本项目针对生产实践中大量类型多样、结构复杂的数据共存特点。在分析研究现状和现有处理方法基础之上,通过把同态映射理论和粗糙集理论有机结合,提出了数据同态压缩理论。基于该理论研究混合海量数据的有效压缩方法与信息挖掘快速算法。建立了基于同态压缩理论的混合数据属性约简的统一模型。在统一模型框架下,寻找最优同态以确保把复杂海量数据的信息系统最大程度地压缩成数据规模较小的信息系统,同时保证信息系统的属性约简和决策规则不变。研究不同类型数据在最优同态下决策规则提取和规则融合方法,以及基于最优同态的混合数据属性约简和分类的快速算法。从而达到从纷繁复杂的数据中快速准确地提取出决策规则和快速决策的目的,不但提高了生产实践效率,也节约了人力、物力等成本;这无疑为不确定性决策分析提供了有效的新理论和方法。本项目研究成果必将提高和促进数据挖掘技术的发展,在复杂系统的海量数据处理等领域中具有广泛的应用前景。
本项目针对海量数据集,研究了基于同态压缩理论的数据挖掘理论与方法,取得了一系列创新性成果,达到了预期的研究目标。本项目的研究结果具体包括三个方面内容:(1)基于同态压缩理论的属性约简模型的建立。(2)同态条件下信息系统的不变性的研究。(3)混合数据属性约简和分类的快速算法。.在第一方面,提出了数据同态压缩理论,研究构造同态映射的方法以确保把复杂海量数据的信息系统最大程度地压缩成数据规模较小的信息系统,同时保证信息系统的属性约简和决策规则不变。.在第二方面,研究了在同态条件下信息系统的信息粒子结构不变性、信息粒子近似运算不变性,构造了协调函数并研究了其不变性质。.第三方面,基于邻域粗糙集、模糊粗糙集设计了混合数据属性约简和分类的快速算法。进一步研究了基于粗糙集的多粒度同态的属性约简和分类算法。
{{i.achievement_title}}
数据更新时间:2023-05-31
拥堵路网交通流均衡分配模型
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
物联网中区块链技术的应用与挑战
一种改进的多目标正余弦优化算法
一种加权距离连续K中心选址问题求解方法
基于语义距离的分布式数据挖掘理论与方法
数据挖掘中的凸规划理论与方法
基于核学习的大型复杂数据挖掘理论与方法研究
基于机器学习的生物医学大数据挖掘理论与方法研究