In real-world applications, data usually take on hybrid forms including nominal, numerical, ordered and interval. These data patterns with complex structure and heterogeneous form have brought many challenges for traditional data analysis approaches. Main content includes: (1) Analyzing the rough approximations of target concepts in the context of various types of attribute, exploring fusing approaches for various types of rough approximations, and constructing multigranulation rough set model for hybrid data. (2) Presenting new definitions of roughness which can be used to measure size and structure of boundary region got from hybrid data. (3) Designing roughness-based evaluation algorithms for attribute subsets in hybrid data. (4) Proposing roughness-based approaches for generating decision tree which are applicable for hybrid data, and constructing random forest which can be used to classify hybrid data. Results of this subject will provide new ways for knowledge discovery from hybrid data, which also have theoretical significance and practical application for many areas include data mining and machine learning.
现实生活中广泛存在着名义型、数值型、有序型和区间型等多种类型并存的混合数据,这种结构复杂、形式异构的数据模式给传统的数据分析方法带来了挑战。本项目拟借鉴人类多粒度认知和逼近推理的问题求解方法,开展面向混合数据的多粒度粗糙分析模型与算法研究,主要内容有:(1)研究不同类型属性下目标概念的粗糙近似,探索不同类型粗糙近似的融合方法,建立面向混合数据多粒度粗糙集模型;(2)给出能够有效刻画混合数据中不同类型属性下目标决策边界域的大小和结构的粗糙性度量;(3)给出基于混合数据粗糙性度量的属性子集评价方法,建立从对象和属性两个方向同时缩小数据规模的启发式属性约简加速策略;(4)给出基于粗糙性度量的决策树生成算法,建立面向混合数据的随机森林分类方法。本项目研究成果将为面向混合数据的知识发现提供新途径,对数据挖掘和机器学习等领域的研究具有重要的理论意义和应用价值。
混合数据广泛地存在于自然科学、社会经济等诸多领域,基于粗糙集理论的数据粒化和粗糙近似的思想,特别是多粒度融合思想,可以有效地解决多种不同类型属性共存的混合数据知识发现问题。因此,本项目选择以粗糙集理论与方法为主要工具,并结合机器学习的相关技术,面向混合数据开展相关模型与算法的创新性研究,主要获得了以下研究成果:(1)建立了面向混合数据多粒度粗糙集模型;(2)分析了粗糙集理论中常见不确定性度之间的关系;(3)给出了基于数据对象分块融合的高效混合数据约简算法和逐步去除无关对象和属性的属性约简加速算法;(4)提出了基于粗糙随机子空间的混合数据随机森林分类方法。这些研究成果将为面向混合数据的知识发现提供新途径,对促进数据挖掘、粒计算等领域的相关研究具有重要的理论意义和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于SSVEP 直接脑控机器人方向和速度研究
基于多模态信息特征融合的犯罪预测算法研究
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
多空间交互协同过滤推荐
多标记数据的多粒度粗糙计算理论与算法研究
多维多粒度粗糙集模型和算法研究
面向大数据分层分类学习的多粒度计算模型和算法
模糊决策条件下的多粒度决策粗糙计算模型研究