Multi-view subspace clustering plays an important role in multi-view high dimensional data clustering. The existing methods lose sight of the different clustering ability of each view . These methods also cannot serve complex multi-view high dimensional data including partial mapped or unmapped data and large scale data or a growing number of data..The project will study multi-view subspace clustering in depth and provide the following methods to cure the above problems:1) Study the multi-view self-adaptive weight computing algorithm based on the clustering ability of data instance in each view, and provide multi-view subspace clustering method with multi-view self-adaptive weight;2) To deal with unmapped multi-view high dimensional data, study the loss function to represent the constraints between views and propose a constraint-based multi-view subspace clustering method; 3) Propose a two-stage multi-view subspace clustering for partial mapped multi-view high dimensional data;4) Study self-adaptive sampling method with multi-view data and propose a self-adaptive sampling based incremental multi-view subspace clustering method. .The project will enhance the ability of high dimensional data processing and provide an efficient solution for such applications as data mining and pattern recognition.
多视图子空间聚类是多视图高维数据聚类的重要方法。现有的方法没有深入分析不同视图下数据实例可聚性的差异,并且没有考虑数据视图间是部分映射或无映射的以及数据规模庞大或增量变化的复杂多视图高维数据。. 针对以上问题,本项目拟深入研究复杂多视图高维数据的子空间聚类方法: 1)根据不同视图下数据实例的可聚性差异,研究自适应的视图权重分配算法,设计视图权重自适应的多视图子空间聚类方法;2)研究视图间无映射情况下视图间约束的损失函数表示,设计基于视图间约束的多视图子空间聚类方法;3)针对视图间部分映射的多视图高维数据,设计两阶段式多视图子空间聚类方法;4)研究多视图下自适应的抽样方法,设计基于自适应抽样策略的多视图子空间增量聚类方法,解决大规模或增量变化的多视图高维数据的聚类问题。. 本课题的研究可以提高对多视图高维数据的处理能力,为数据挖掘、模式识别等应用提供有效方法。
多视图子空间聚类是多视图高维数据聚类的重要方法。本项目深入研究复杂多视图高维数据的聚类方法。.(1)提出了一种加权的多视图k均值聚类策略,即在k均值聚类方法中引入了L2,1范数,从而减弱异常数据点对k-均值算法带来的负面影响,得到更加鲁棒的效果。.(2)针对多视图加权策略不能同时有效利用多视图聚类特点和相应单视图聚类特点的问题,提出一种基于谱扰动的加权多视图谱聚类方法。该方法在加权多视图谱聚类中充分利用谱聚类的谱扰动特性,使用最大规范角来度量不同谱聚类效果之间的差异,最终将权重求解问题转化为标准的二次规划问题。.(3)为了深入挖掘隐藏在数据中的内在特征,提出了一种基于深度矩阵分解的自加权多视图聚类(SMDMF)。通过执行深度分解结构,消除干扰,揭示多视图数据的语义信息。.(4)本项目提出了共正则化多视图子空间聚类方法,将谱聚类加入到多视图子空间聚类的目标方程中进行联合优化。使用指标矩阵来确保同时对每个视图的子空间表示执行聚类,并增加了一个共同正则化的约束,以保证指标矩阵的一致性。.(5)本项目在扰动风险最小边界和不完备多视图聚类之间建立桥梁,提出一种扰动诱导的不完备多视图聚类方法。将数据特征缺失转换为数据点间相似度缺失,并提出一种有效的相似度填充方法,减小特征缺失带来的风险;利用图谱理论,指出谱扰动边界最小化等同于不同视图间融合结果最大化,从而给出融合机制的一个准则。.(6)本项目将自步学习策略与多视图K-means、多视图谱聚类相融合,旨在运用自步学习策略度量各个视图的重要性,从而为多个视图赋予动态权重。使得提出的算法能够更充分地利用多视图所包含的信息。最终达到提升聚类效果的目的。.(7)将多视图聚类应用于网络商品的特征信息相似性与语义关联性的挖掘中,从而改进协同过滤算法以解决该算法中存在的数据稀疏性问题。.以上方法在人工和真实多视图数据集上的实验结果明显优于现有基线算法。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于合作式的多视图数据深度子空间聚类的研究
基于贝叶斯张量分解的高维关系组学数据子空间双聚类建模与统计方法研究
高维多媒体特征的低维流形子空间降维及聚类研究
高维稀疏数据聚类研究