With the advent of the era of big data and artificial intelligence, data mining techniques are facing challenges with the rapid growing size of data. For large scale data, expensive labeling cost makes it rare to have labeled data in real world applications, therefore it has become an essential demand to develop effective unsupervised learning methods. 2-dimensional (2D) data are becoming increasingly common in real world applications, meanwhile the current methods usually need to apply vectorization to 2D data which is problematic in that it damages spatial information of original data. To solve this problem, in this project, we will study clustering algorithms for 2D data, which includes: studying novel algorithms in a new category which can preserve spatial information from original data and simultaneously extract the most representative features and learn clustering structure, and designing linear and nonlinear models for 2D subspace clustering and producing theoretical analysis. This research project will enrich the field of clustering 2D data, which is academically significant.
随着大数据和人工智能时代的来临,急速膨胀的数据规模在实际应用对数据挖掘技术提出了严峻的挑战。对于大规模数据,高昂的标记成本导致了人们在实际问题中往往面临无标记的数据,因此发展有效的无监督学习方法成为数据挖掘领域的基本需求。与此同时,二维数据在实际问题中的使用日益广泛,而当前的学习算法在面临二维数据时通常需要将数据向量化,导致了原始二维数据空间结构信息的损坏,存在严重的缺陷。为解决这一问题,本项目将研究一类面向二维数据的聚类算法,主要研究内容包括:研究一类新型算法能够保存二维数据的空间信息并同时学习数据最具表达的特征与类结构信息,设计线性和非线性二维子空间聚类算法并进行理论分析。本项目的研究将进一步完善面向二维数据的聚类学习研究,具有重要的学术意义。
随着大数据和人工智能时代的来临,急速膨胀的数据规模在实际应用对数据挖掘技术提出了严峻的挑战。对于大规模数据,高昂的标记成本导致了人们在实际问题中往往面临无标记的数据,因此发展有效的无监督学习方法成为数据挖掘领域的基本需求。与此同时,二维数据在实际问题中的使用日益广泛,而当前的学习算法在面临二维数据时通常需要将数据向量化,导致了原始二维数据空间结构信息的损坏,存在严重的缺陷。为解决这一问题,本项目将研究一类面向二维数据的聚类算法,主要研究内容包括:研究一类新型算法能够保存二维数据的空间信息并同时学习数据最具表达的特征与类结构信息,设计线性和非线性二维子空间聚类算法并进行理论分析。本项目的研究将进一步完善面向二维数据的聚类学习研究,具有重要的学术意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于LASSO-SVMR模型城市生活需水量的预测
基于二维材料的自旋-轨道矩研究进展
面向社会媒体数据的子空间聚类算法研究
面向高光谱图像的局部多流形结构保持稀疏子空间聚类算法研究
多粒度视角下大规模数据聚类算法研究
大规模数据聚类的并行进化算法骨架研究