At present, big data has become a research hotspot of areas such as Artificial Intelligence, Machine Learning et al. In this project, the high efficient support granular machine optimal modeling and application for big data will be studied deeply to solve the problem that the low performance of traditional support vector machine (SVM). The main research contents include: (1) Combining with artificial intelligence methods such as Granular Computing, Active Learning, Online Learning, Incremental Learning et al., the "small information" abstraction, presentation, storage, analysis methods will be constructed respectively for the volume, variety, value and velocity big data problems. (2) Based on the conversion from big data to "small information", the new mechanism of information mining is studied deeply for different types of big data problems. (3) By building multilayer granular information space based on the dynamical hierarchical granulation, the support granular machine information mining model will be designed for big data problems. (4) Development of a platform for big data modeling, analysis, mining, evaluation, and then it will be used in the image recognition, email classification and protein interaction relations prediction. The research results of this project will not only enrich the theory, modeling and application of big data processing, but also have very important theoretical significance and practical application value for big data mining research.
目前,大数据问题已经成为人工智能、机器学习等领域的研究热点。针对支持向量机(SVM)处理大数据挖掘性能较低的问题,本项目拟深入开展面向大数据的高效支持粒度机优化建摸及应用研究。具体研究内容包括:(1)结合粒度计算、主动学习、在线学习、增量学习等人工智能方法,分别构建面向大容量、多类型、高价值、快速度大数据问题的“小信息”抽象、表示、存储、分析方法;(2)面向不同类型的大数据问题,通过大数据到“小信息”的转化,深入探讨信息挖掘的新机制;(3)通过样本的动态层次粒划分,构建多层粒度信息空间,设计面向大数据问题的支持粒度机信息挖掘模型;(4)系统构建面向大数据的建模、分析、挖掘与评测平台,并用于图像识别、邮件分类、蛋白质互作用关系预测等领域。本项目研究成果将丰富和完善大数据处理的相关理论、建模及应用研究,对大数据挖掘的研究有重要的理论意义和应用价值。
支持向量机作为一种有效的机器学习方法,在许多领域得到成功的应用,但随着所处理问题的数据规模增大、数据结构日趋复杂,其学习效率和泛化能力受到极大制约,进而限制了它的进一步应用。本项目系统研究了提高SVM处理复杂数据效能的方法,已完成的主要内容包括:(1)结合多概念层次的粒度划分理论,构建了基于多层粒度划分的支持向量机高效学习方法;(2)探讨了粒度支持向量机的核心本质及相关问题;(3)采用半监督组合优化的方式,构建了面向稀疏标签数据的增量学习方法;(4)结合多窗口的学习技术,设计了流数据的高效挖掘模型及有效的概念漂移检测机制;(5)构建了面向区间型的复杂特性数据的学习方法;(6)构建了面向复杂数据处理的支持向量机学习平台。本项目研究成果丰富和完善了支持向量机的理论和算法研究、拓展了支持向量机的应用领域,对大规模复杂数据处理的研究有重要的理论意义和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
粒度支持向量机学习方法及应用研究
从个体到种群:多尺度建模、分析及应用
弹性建模与分析:从部件到系统
基于多粒度信息粒化的数据分析方法及其应用研究