随着对信息获取渠道的增多和测量手段的提高,人们可以对许多研究对象进行多角度地观测和描述。所获取的多角度数据往往包含着更丰富、更完备的信息,合理地利用这些信息将有助于更好地理解研究对象和挖掘潜在的数据模式。因此在聚类分析研究领域,多角度数据聚类成为重要的发展方向和热点之一。.本项目将从多线性的角度来研究多角度聚类问题,利用张量为多角度数据建模,通过张量分解来获得多角度数据之间的多线性关系,并基于张量分析对多角度数据展开聚类。本项目将采用理论研究、试验仿真和实际应用相结合的手段来研究多角度聚类理论和应用中存在的问题,例如,多角度数据的建模,异质数据的聚类,以及多角度数据的联合降维等问题。同时,针对张量分析在数据挖掘中运算复杂的问题,展开对张量分析的快速计算的研究,并将基于张量的多角度聚类算法应用到大规模的科技文献自动分类和图像聚类中,通过不同的实际应用来验证算法的有效性。
在大数据时代,人们获取信息的渠道、手段和数量在不断地提高,数据主体可以用更多维度的数据来描述,多角度的数据可以带来更加全面、更富有洞察力的信息,但是同时也带来了更多的挑战,例如数据量增加使得存储和运算处理变得复杂,最大的挑战在于如何采用新的算法模型在信息融合的基础上进行数据挖掘和知识发现。本研究集中在多角度聚类,从算法模型的理论问题到实际的应用。建立在矩阵分析基础上的张量是一个自然的多角度数据模型,同时张量分解又具有很多良好的性能。因此在项目组成员之前的聚类研究基础上,提出并展开基于张量分析的多角度聚类研究。结合张量分析和多角度聚类的最新进展,本研究侧重于与该多角度聚类方法在数据挖据领域的几个关键问题,如多角度数据的联合降维,张量分析的快速实现,以及如何对多角度异质数据的正确聚类等。同时,项目组还深入研究了符合大数据特点的其它模型,例如复杂网络,对多角度聚类进行了分析。为了验证算法和理论本研究还将多角度聚类算法应用到实际问题中,例如大规模科技文献数据库的文献自动分类和图像聚类等,在具体的应用中算法的有效性得到了检验。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
基于分形维数和支持向量机的串联电弧故障诊断方法
基于二维材料的自旋-轨道矩研究进展
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
基于高维数据聚类的算法交易策略若干关键问题研究
基于相似度学习的异构数据聚类算法研究及其应用
缺失多视图聚类算法及其应用研究
基于最大公共子图的谱聚类算法在文本聚类中的应用研究