非随机性数据缺失的结构化稀疏子空间聚类研究

基本信息
批准号:61502108
项目类别:青年科学基金项目
资助金额:21.00
负责人:王丽娟
学科分类:
依托单位:广东工业大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:林志毅,李卫华,谢锐,洪英汉,张小文,袁畅,黄灿锦
关键词:
子空间聚类非随机性数据缺失结构化稀疏子空间聚类聚类相似图
结项摘要

This proposal mainly concerns data clustering with nonrandom missing entries. There are two key points in this proposal. One is how to effectively measure the similarity between data with nonrandom missing entries. And the other is how to construct the clustering similarity graph for data with nonrandom missing entries. The two points are closely related. Sparse representation can measure the sparse similarity between data with random missing entries. However, when missing entries is not at random, sparse representation can not measure the non-sparse similarity between data. In this case, partial similarity may debase the connectivity of clustering similarity graph, where points in the same cluster form multiple components, so that it can not generate effective clustering. Motivated by this critical problem, in this proposal we will conduct the following study. Firstly, structured sparse optimization platform with neighborhood constraint is studied for complex structure data with nonrandom missing entries, so as to get the sparse representation and its corresponding coefficients, and form the partial clustering similarity graph between data. Then, the latent non-sparse similarity between data with nonrandom missing entries is gotten by the link-based refinement approach according to the above sparse similarity, which can form the complete clustering similarity graph between data. In the complete clustering similarity graph, points in the same subspace lie in one component, so that it can generate effective clustering. The proposed research aims to study how to forms effective structured sparse subspace clustering for data with nonrandom missing entries. Expected outcomes of the proposed research will provide solution for the critical problem underlying structured sparse subspace clustering with nonrandom missing entries, so that the proposed research can be more and more popular in the application of data clustering with missing entries.

本项目拟重点研究非随机性数据缺失聚类,涉及两个关键问题:相似性度量以及连通的聚类相似图的构建。稀疏表示能够提取随机性数据缺失的稀疏相似性信息,却无法提取非随机性数据缺失的非稀疏相似性信息。依据不完整的稀疏相似性信息,聚类相似图的连通性较差,使得同一子空间内的数据位于多个连通分量,无法形成有效的聚类。针对这一问题,首先研究邻域约束的结构化稀疏平台,提取具有复杂结构的非随机性数据缺失的稀疏表示及其系数,初步建立聚类相似图;然后,在此基础上研究基于链接分析的信息优化方法,提取非随机性数据缺失隐含的非稀疏相似性,完善聚类相似图,使得同一子空间内的数据位于同一连通分量内,从而形成有效的聚类。项目旨在揭示非随机性数据缺失对结构化稀疏子空间聚类的影响,提出非随机性数据缺失结构化稀疏子空间聚类关键问题的解决方案,使得该研究在数据缺失聚类中具有广泛的应用空间。

项目摘要

随着聚类分析应用领域的扩展和深入,噪音和缺失数据聚类成为当前研究的热点。如何有效度量噪音和缺失数据的相似性是聚类分析的关键点。子空间聚类从数据中提取低秩表示,并计算数据的相似性矩阵,通过谱聚类得到聚类结果。但是,当数据存在噪音和缺失,子空间聚类无法正确提取数据的低秩表示,相似性矩阵的块状性能无法保证,从而无法形成有效的聚类。.本项目开展以下研究:(i)基于低秩表示的健壮回归算法,低秩表示获取数据的低维子空间结构,但是却忽略了邻域信息。在低秩表示获取干净数据集的基础上,回归误差可以准确获取数据的邻域信息。二者将全局和局部信息结合,减少噪音和缺失的影响,探测数据内部的真实结构。(ii)基于块状约束的健壮子空间聚类算法研究,针对噪声和缺失数据设计自适应误差权重,极小化加权的块状约束数据的重构误差,直接获取较好块状性能的相似性矩阵,使得同一子空间数据位于同一连通分量内,从而形成有效的聚类。.项目旨在揭示噪声和缺失对子空间聚类的影响,提出噪声和缺失数据的子空间聚类关键问题和的解决方案,使得该研究在噪声和缺失数据聚类中具有广泛的应用空间。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
4

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

王丽娟的其他基金

批准号:41102026
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:30900388
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:81402353
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:31600620
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:31571785
批准年份:2015
资助金额:58.00
项目类别:面上项目
批准号:81671275
批准年份:2016
资助金额:52.00
项目类别:面上项目
批准号:41101168
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:71202117
批准年份:2012
资助金额:18.50
项目类别:青年科学基金项目
批准号:81371401
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:31500086
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:31702337
批准年份:2017
资助金额:23.00
项目类别:青年科学基金项目
批准号:10401041
批准年份:2004
资助金额:10.00
项目类别:青年科学基金项目
批准号:51508434
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:81802935
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:31260065
批准年份:2012
资助金额:48.00
项目类别:地区科学基金项目
批准号:41102123
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:10971158
批准年份:2009
资助金额:22.00
项目类别:面上项目
批准号:51808127
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:31371022
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:31060043
批准年份:2010
资助金额:25.00
项目类别:地区科学基金项目
批准号:21403016
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目
批准号:30870863
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:11371285
批准年份:2013
资助金额:50.00
项目类别:面上项目
批准号:31700593
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:31500699
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:81801707
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:11771344
批准年份:2017
资助金额:48.00
项目类别:面上项目
批准号:21503056
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目

相似国自然基金

1

基于稀疏低秩表示的子空间聚类算法研究

批准号:61502175
批准年份:2015
负责人:刘小兰
学科分类:F0605
资助金额:20.00
项目类别:青年科学基金项目
2

基于高维特征和稀疏子空间聚类的图像分割方法研究

批准号:61472303
批准年份:2014
负责人:王卫卫
学科分类:F0210
资助金额:80.00
项目类别:面上项目
3

高维稀疏数据聚类研究

批准号:70771007
批准年份:2007
负责人:武森
学科分类:G01
资助金额:16.00
项目类别:面上项目
4

面向社会媒体数据的子空间聚类算法研究

批准号:61403247
批准年份:2014
负责人:朱林
学科分类:F0603
资助金额:25.00
项目类别:青年科学基金项目