Support vector machine(SVM), as a general and effective machine learning approach, has been applied successfully in many fields. With the fleetly growing data size and more complex data expression and structure in actual application problems, the learning efficiency and generalization performance of SVM are restricted greatly, and then the application areas are also limited. In this project, the theory and approaches on improving the learning efficiency and generalization performance of SVM for complex data will be studied deeply. The main research contents include: (1) Kernel function selection approach based on semi-parameter. (2) Depth of fusion on SVM and granular computing, which includes reconstructing the optimal quadratic programming problem, analyzing the decision hyperplane in geometry after SVM training and correcting the hyperplane. (3) Effective dimension reduction approach under SVM-like frame. Linear PCA will be learned with linear programming, and the method will be extended to nonlinear/kernel PCA. Also, the algorithms for learning linear and nonlinear PCA will be provided. (4) Researches on constructing semantic feature function for non-structure data and exploring the learning mechanism of structural SVM. (5) Establishment of SVM evaluation system based on parameters of SVM model and learning environment. (6) Development of a platform for complex data analyzing and processing based on the research results.The research results of this project will not only enrich the theory and algorithms of SVM and expand its application areas, but also have very important theoretical significiance and practical applicaton value for large scale complex data processing.
支持向量机(SVM)作为一种通用有效的机器学习方法,在许多领域得到成功的应用,但随着所处理问题的数据规模日趋增大、数据表示和结构的日趋复杂,SVM的学习效率和泛化能力受到极大制约,进而限制了它的进一步应用。本项目将系统研究提高SVM处理复杂数据效能的方法,主要内容包括:(1)基于半参数的SVM核函数构造方法。(2)SVM与粒度计算理论的深度融合,包括学习问题的重构和训练后超平面的几何分析与调整。(3)SVM框架下的高效降维算法,建立基于SVM的线性PCA和非线性PCA的线性规划求解机制和算法。(4)非结构化数据中语义特征函数的构造方法及结构化SVM的学习机理。(5)模型及环境参数相关的学习算法评价方法。(6)研制一个基于SVM的复杂数据处理平台。本项目研究成果将丰富和完善SVM的理论和算法研究、拓展其应用领域,对大规模复杂数据处理的研究有重要的理论意义和应用价值。
支持向量机作为一种通用有效的机器学习方法,在许多领域得到成功的应用,但随着所处理问题的数据规模日趋增大、数据表示和结构的日趋复杂,支持向量机的学习效率和泛化能力受到极大制约,进而限制了它的进一步应用。本项目系统研究了提高处理复杂数据效能的方法,已完成的主要内容包括:(1)设计了基于半参数的支持向量机核函数构造方法。(2)研究了支持向量机与粒度计算、主动学习等理论、模型的深度融合,包括学习问题的重构和训练后超平面的几何分析与调整、模式类别的挖掘及信息提取等。(3)设计了高效的支持向量机框架下的复杂数据挖掘算法,设计了面向非平衡、多类别、大规模复杂数据的高效支持向量机算法,以及基于决策树、随机森林的高效支持向量机分类算法。(4)研究了非结构化数据中语义特征函数的构造方法及结构化SVM的学习机理,以及高效支持向量机方法在文本分类、图像分割、目标检测提取中的深入应用。(5)深入探索了模型及环境参数相关的支持向量机学习算法评价体系。(6)构建了面向复杂数据处理的支持向量机学习平台。本项目研究成果丰富和完善了支持向量机的理论和算法研究、拓展了支持向量机的应用领域,对大规模复杂数据处理的研究有重要的理论意义和应用价值。.项目实施期间,完成的成果“基于粒计算的数据建模理论与方法研究”荣获山西省自然科学一等奖1项(排名第4),以第一(或通讯)作者身份发表(录用)学术论文44篇(其中SCI收录9篇),以第一作者身份出版专著1部,以第一(或通讯)参与人获软件著作权登记8项;培养博士研究生11名,硕士研究生27名。总之,项目整体执行情况良好,全面完成了项目研究任务,实现了预期的目标。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
特斯拉涡轮机运行性能研究综述
基于LASSO-SVMR模型城市生活需水量的预测
面向大量数据的半监督支持向量机的优化方法研究
基于支持向量机的Mobile Agent系统中数据分类方法研究
复杂多流形半监督问题的非平行支持向量机方法研究
高维缺失数据半监督支持向量机研究