Pattern classification is the important and fundamental issue for pattern recognition, data mining, machine learning and information fusion research. At present, pattern classification of the qualitative and quantitative mixed-mode data is not yet well-researched cutting-edge topics. Based on the mathematical formal description in set theory and formal concept analysis and building the structure graphs of attribute partial order for formal contexts, study of mathematical principles for pattern classification of the multi-dimensional mixed data is to carry out in this project. .Main study include: building the required cube models for pattern discovery of the mixed- data (data cube, the concept cube and the concept network cube) and the cube slicing models, the optimization methods for the mixed data formal context, pattern classification attribute reduction mathematical methods, mathematical principles of generation for a partial order structure graphs, pattern discovery methods in the attribute partial order structure graphs and the based on the principle of supervised clustering, division based on sub-class pattern classification mathematical theorems, pattern automatic classification system design for mixed-data application. .The original academic thought has been verified in preliminary experiments. The project works closely with the mathematical theory and engineering applications with distinctive features, the conduct and completion of the project to solve the mixed-mode data in the scientific classification of problem is important.
模式分类是模式识别、数据挖掘、机器学习和信息融合等研究领域中重要而基础性问题。目前,定性与定量混合数据的模式分类是一个还没有得到充分研究的前沿性课题。本项目基于集合论和形式概念分析两种数学形式化描述方法,在构建分块形式背景属性偏序结构图的基础上,开展多维混合数据的模式分类数学原理的研究。研究主要内容有:构建表达混合数据模式发现过程所需要的多立方体模型(数据立方体、概念立方体和概念网络立方体)和立方体切片模型;混合数据形式背景优化方法;模式分类属性约简数学方法;分块形式背景属性偏序结构图生成的数学原理;基于属性偏序结构图和有监督聚类原理的模式发现方法;基于子类划分的模式分类数学定理;混合数据模式自动分类系统设计等。本项目原创性学术思想在已经开展的预实验中得到了验证。本项目工程与数学紧密结合、理论与工程应用研究结合特色鲜明,项目的开展与完成对解决混合数据模式分类研究中的科学问题具有重要意义。
模式分类是模式识别、数据挖掘、机器学习和信息融合等研究领域中重要而基础性问题。目前,定性与定量混合数据的模式分类是一个还没有得到充分研究的前沿性课题。本项目基于集合论和形式概念分析两种数学形式化描述方法,在构建偏序形式结构的基础上,开展多维混合数据的模式分类数学原理的研究。.多维混合数据向形式背景的转化是首先需要解决的问题,项目引进归一化、滤波和排序等方法对数据进行预处理,提出了可视化离散化方法,建立了多种类型数据构建形式背景的方法。在对形式背景充分研究的基础上,提出了形式背景中属性特征、对象特征和覆盖特征的定义,为偏序形式结构的研究提供理论基础。提出了“独有属性”、“独有复合属性”的计算方法,并基于此建立了以区分对象为目的的属性化简方法,较大程度提高了规则提取的效率。提出了形式背景偏序结构生成原理,建立了偏序结构图的计算机生成方法,并以Microsoft Office Excel插件形式实现中小型规模偏序结构图生成的工具集。为了降低算法复杂度,扩大处理容量,提出了基于覆盖的偏序结构生成原理,并建立了对应的计算机生成算法和软件工具,处理速度和容量得到显著提高。应对较大规模数据,提出了偏序形式结构的辐射树、环形图等多种可视化形式。基于上述软件工具,建立了多维混合数据可视分析多屏平台,为偏序形式结构的研究和应用提供了坚实的技术支撑。提出了基于偏序形式结构的模式分类和知识发现方法,并在英语语言分析、医学诊断、知识可视化、知识发现、中药方剂配伍、中医药临床知识挖掘与传承等领域得到成功应用。.本项目所提供的原创性理论和方法,丰富了多维混合数据模式分类的理论研究,开辟了多维混合数据模式分类、可视分析和知识发现的新途径。在多个领域内成功应用的实例,证明了本项目所提供理论和方法的普适性与有效性。项目设计了应对较大规模数据的处理方法,应对大数据时代的到来具有一定的前瞻性。因此,本项目所完成工作具有理论创新,方法普适、有效,内容具有前瞻性的特点。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于数学属性偏序表示原理的《伤寒论》方证群结构知识发现方法研究
基于属性偏序可视化表示原理的脾虚证方剂配伍规律知识发现方法
基于张量模式的DTI数据模式分类及其分布式算法研究
基于不可约序关系的复杂疾病诊断基因模式发现技术研究