随着人们收集、传输、存贮数据能力不断提高,数据出现了爆炸性增长,与此形成鲜明对比的是,对决策有价值的知识却非常匮乏。"数据丰富、知识贫乏"是当前智能计算面临的难点前沿课题。本项目拟采用多粒度分治处理的思路,研究面向用户的海量数据挖掘理论和方法,在保持知识不确定性(信息量)不变的前提下,不同用户从海量数据中获取所需的真实知识(知识的不变性),提高海量数据挖掘的效率。为此,本项目研究的主要问题包括:海量数据的特征分析与多粒度(结构化)描述;知识在不同载体中的多粒度描述与关系;知识的不确定性度量理论与方法;利用数据驱动的方法,面向用户提取信息量不变的不同形式领域知识;利用分治法建立分层递阶的多粒度动态数据挖掘模型和高效知识获取算法;并探索云存储环境下的多粒度数据存储模型和动态数据挖掘问题。最终形成一套面向用户的多粒度海量数据挖掘理论和高性能的知识获取算法,推动海量数据挖掘的发展。
本项目针对复杂海量数据信息处理问题,在海量数据的特征分析与多粒度(结构化)描述,知识在不同载体中的多粒度形式化描述与关系(即数据表达形式中知识的特征在分层递阶商空间中的变化关系),知识的不确定性度量理论与方法(即用形式化表达方式对通过数据挖掘获取的潜在有用知识进行不确定性度量以及定量描述),面向不同领域(用户)知识形式的转化以及双向认知计算模型等方面进行了深入研究,取得很好的成果。初步实现了分层递阶商空间中的知识多粒度(结构化)描述, 建立了知识不确定性的度量模型、规则与方法,提出了动态信息的多粒度建模与自动更新方法,提出了基于分治法的属性约简方法、值约简方法和属性序下的知识发现方法,提出了多粒度云模型与双向认知计算模型,对粗糙集的扩展模型进行了研究,实现了复杂海量数据中的知识获取,并在时空数据流分析、图像分割、DNA数据分析等应用领域中取得了良好的效果。项目组主要成员中,1人入选中组部"万人计划"和科技部“创新人才推进计划”,3人晋升教授,培养博士生6人(3人毕业,3人在读)。作为会议(程序委员会)主席或共同主席组织召开国际学术会议5次和全国学术会议3次,出席国际会议14次,出席国内会议19次,应邀作国际会议特邀报告8次、全国会议特邀报告7次。发表学术论文50篇(其中, SCI收录8篇、EI收录27篇),出版专著3部 (含编著),主编国际会议论文集4本,申请国家发明专利1项,获“领跑者5000-中国精品科技期刊顶尖学术论文”奖。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响
城市轨道交通车站火灾情况下客流疏散能力评价
基于FTA-BN模型的页岩气井口装置失效概率分析
肉苁蓉种子质量评价及药材初加工研究
面向多模态数据的多粒度计算理论与方法
面向领域用户知识发现的数据结构化建模与多粒度融合
面向混合数据的粒度计算理论与方法研究
面向大规模复杂数据的多粒度知识发现关键理论与方法研究