Image representation is a fundamental problem in image processing and pattern recognition tasks. A good representation can typically reveal the latent structure of data, and further facilitate these tasks in terms of learnability and computational complexity. This project will make a study of the image representation of such non-negativity, sparseness, robustness and discrimination. For such purpose, the matrix decomposition theories including non-negative matrix factorization, sparse coding, dictionary learning, sparse auto-encoders and independent component analysis are utilized. Specifically, we will primarily study the following subjects: the discriminative non-negative matrix factorization for image representation, the globally optimal solution to non-negative matrix factorization, and the robust sparse representation for image classification and face recognition. The research achievements of this project can be extensively applied to the fields including image classification, image clustering, image retrieval, face recognition, object detection and image denoising, and have great significance in both theory and practice.
图像表示是图像处理和模式识别领域中的核心研究问题之一。一个有效的图像表示方法不仅有助于挖掘图像潜在的数据结构,而且有利于降低数据存储和传输的成本。非负性、稀疏性、鲁棒性以及判别性是图像表示理论的核心问题,本课题拟从矩阵分解的角度出发,围绕图像表示方法中的矩阵非负分解和稀疏分解两个重要的研究方向展开研究,主要包括:判别的图像低维表示方法,基于全局最优解的非负矩阵分解方法,鲁棒的图像稀疏表示方法等。本项目的研究成果可以广泛应用于图像分类和聚类、图像检索、人脸识别、目标检测、图像去噪等领域,具有重要的理论意义和实用价值。
图像表示是计算机视觉领域中的核心研究问题之一。一个有效的图像表示方法不仅有助于挖掘图像潜在的数据结构,而且有利于降低数据存储和传输的成本。其中,鲁棒性和判别性是图像表示研究的热点问题。因此,课题组提出了一种基于图像级标注的语义分割网络,其利用一种基于假定感知分类与跨媒体语义增强的方法来生成定位图,并且通过这些生成的定位图以监督的方式来粗略的训练语义分割网络,进一步利用基于单个标签的交叉熵损失函数来优化网络,进而可以得到具有鲁棒性的图像表示。同时,课题组提出了基于长短记忆型卷积神经网络方法,利用卷积神经网络挖掘数据在空间维度上的局部相关性,同时基于长短记忆型神经网络学习数据表示在时间维度上的连续性,进而增强数据表示的判别性。此外,课题组提出了基于单幅图像自底向上和自顶向下特征融合的显著区域检测算法,分析影响判别性和鲁棒性的相关因素,设计了一个更加完善的自底向上的视觉特征集合。课题组已发表论文8篇,其中SCI论文2篇,包括本研究领域的重要学术期刊Pattern Recognition、IEEE Transactions on Multimedia等。申请国家发明专利3项,其中3项已获授权。本课题的研究成果可以广泛应用于图像分类和聚类、图像检索、人脸识别、目标检测、图像去噪等领域,具有一定的理论意义和实用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
低轨卫星通信信道分配策略
内点最大化与冗余点控制的小型无人机遥感图像配准
基于细粒度词表示的命名实体识别研究
基于全模式全聚焦方法的裂纹超声成像定量检测
感应不均匀介质的琼斯矩阵
稳健矩阵回归表示方法及其在图像识别中的应用研究
基于空间分解方法的Hamilton算子矩阵及其应用研究
基于非负矩阵分解的图像特征表示及语义理解关键技术研究
基于深度矩阵分解的高光谱图像解混研究