Image and video have the characteristics of high dimension, obvious nonlinearity and complex internal structure. The representation and processing problems of image and video are always hot issues in both research and industry area. However, the traditional Euclidean space based methods generally do not consider the inherent nonlinear structure of complex high-dimensional data, thus the performance is not well. Orient to the unsupervised clustering of image and video, we utilize the manifold learning method to represent the image and video data, and establish multi-linear low rank models on manifold space to make learned features more suitable for clustering. For the representation of image and video, we adopt the manifold method as the representation approach to ensure the inner non-linear structure of image and video data. To achieve better clustering performance of image and video, we will built the multi-linear low rank model on manifold space. This project will break the limitation of the traditional Euclidean space based clustering model and provide a theoretical support and a new solution for the clustering of image and video.
图像视频数据具有维度高、非线性结构突出、内在结构复杂等特点,其表示和分析方法一直是学术界和工业界的热点研究问题。然而,传统基于欧氏空间度量的方法往往忽略了高维数据的内在特性,无法得到良好的效果。本项目面向图像视频的聚类应用,结合流形和低秩表示方法,重点研究图像视频的流形表达,并建立流形上的多线性低秩模型,使得学习得到的数据特征及其相似度矩阵更适合于聚类应用。针对图像视频等高维数据,研究面向图像视频的流形表示方法,以保证图像视频的内在非线性特性;在传统单一低秩表示模型的基础上,研究建立面向流形表示的多线性低秩表示模型,实现对图像视频的高效聚类。通过本项目的研究,将突破传统基于欧氏空间度量聚类模型以及单一低秩表示模型的局限性和不足,为图像视频等高维复杂数据的聚类问题提供新的解决方案。
本项目针对图像视频的聚类问题,以非线性流形表示方法为基础,重点研究图像视频等高维非结构数据的特征表示,同时扩展传统单一凸核函数的低秩表示模型,建立多线性低秩表示模型,同时引入图表示理论,得到更好的数据表示,实现图像视频的高效聚类。项目取得的主要理论成果包括:(1)针对图像视频等高维非结构数据的特征表示问题,分别提出图像的SPD流形表示方法、视频的Grassmann流形表示方法、以及多视角数据的异构流形表示方法;(2)对于不同的流形表示,扩展传统低秩表示方法,建立相应的多线性低秩表示模型,实现高效聚类;(3)结合图表示方法,建立图表示和低秩表示的聚类模型。项目研究取得了一系列创新性成果和知识产权,共发表学术论文7篇,全部为SCI、EI检索,获得国家发明专利授权1项。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
流形上的低秩表示及其在图像视频聚类中的应用
基于低秩表示的图像视频编码方法研究
基于稀疏低秩表示的子空间聚类算法研究
流形空间不完整多视图像视频的聚类