基于多视角深度稀疏编码及流形正则化的图像标注研究

基本信息

批准号：61671480

项目类别：面上项目

资助金额：58.00

负责人：刘伟锋

学科分类：

依托单位：中国石油大学（华东）

批准年份：2016

结题年份：2020

起止时间：2017-01-01 - 2020-12-31

项目状态：已结题

项目参与者：王延江,刘宝弟,李莉,李鹏,王立,张连波,马腾洲,杨兴浩,张振清

关键词：

多视角学习流形学习正则化稀疏编码

结项摘要

Image annotation plays an important role in various applications such as multimedia processing, image understanding, large scale image/video retrieval, intelligent surveillance. This project will explore and study a novel solution of image annotation based on multiview deep sparse coding and manifold regularization. Firstly, we will propose a high-order locality preserving algorithm i.e. p-Laplacian regularization to boost the performance of image annotation. Secondly, we will propose a manifold regularized multiview canonical correlation analysis algorithm and then develop a deep architecture of multiview canonical correlation to discover the nonlinear correlation information hidden in different image features. Thirdly, we will propose a deep multiview spare coding algorithm to learn effect image representation for annotation. Finally, we will construct the prototype system to evaluate the performance of image annotation with the mentioned solutions. The proposed study of image annotation that integrates deep learning, manifold learning, sparse coding and multiview learning will disclose the intrinsic relations between multiple image features and pave a fresh way for large scale image retrieval and understanding.

图像标注在多媒体信息处理、图像理解、大规模图像／视频检索、智能监控等多个领域有着重要的应用价值。本项目拟探讨和研究基于多视角深度稀疏编码及流形正则化的图像标注方法。首先，结合流形学习，提出一种保持样本分布局部结构的高阶流形p-Laplacian正则化方法，从而提高图像标注的准确性；其次，提出一种基于流形正则化的多视角典型相关分析算法，并进而构建多视角典型相关分析的深度模型，分析图像不同特征之间的非线性关系；第三，提出一种多视角深度稀疏编码模型，有效地学习多视角图像特征表达；最后，构建图像标注原型系统。本项目结合深度学习、流形学习、稀疏编码及多视角学习对图像标注方法进行研究，将进一步揭示图像多视角特征间的内在联系，为大规模图像检索奠定基础，为智能图像理解提供一条新的途径。

项目摘要

图像标注是多媒体信息处理、理解、推荐等应用研究的重要组成部分，有着重要的应用价值。本项目围绕局部结构学习理论研究多视角深度稀疏编码及流形正则化的图像标注方法，主要完成了如下研究内容。（1）针对图像样本的局部结构表示，提出了样本局部结构保持p-Laplacian的逼近算法，进而实现了p-Laplacian正则化框架、超图p-Laplacian正则化的逻辑回归、集成p-Laplacian正则化等算法；（2）针对图像的多视角特征融合，提出了Hessian多集典型相关分析算法、多集典型相关分析网络模型；（3）针对图像深度稀疏编码，提出了Hessian深度自编码器、最大边界深度自编码器算法；（4）结合不同的图像标注场景，在主流的图像数据库上对算法模型进行了图像识别、分类等应用实验验证，实验结果表明了项目所提出方法的有效性。本项目对多视角深度稀疏编码、流形正则化、图卷积神经网络等表示学习理论进行了深入研究，探索了大规模图像标注中的深度结构学习理论和方法，进一步揭示了统计学习中数据样本分布的本质，为构建有效的图像标注模型提供有力的理论依据，为大规模图像数据分析提供了新的途径。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：2021

DOI：10.14050/j.cnki.1672-9250.2017.02.014

发表时间：2017

DOI：

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

刘伟锋的其他基金

批准号：51404296

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：61301242

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

相似国自然基金

基于稀疏正则化和深度学习的湍流退化图像复原研究

批准号：61402480

批准年份：2014

负责人：谢源

学科分类：F0210

资助金额：27.00

项目类别：青年科学基金项目

基于稀疏多流形学习的高光谱遥感图像分类

批准号：41371338

批准年份：2013

负责人：黄鸿

学科分类：D0113

资助金额：75.00

项目类别：面上项目

基于稀疏正则化方法的盲图像复原关键技术研究

批准号：61572077

批准年份：2015

负责人：何宁

学科分类：F0210

资助金额：65.00

项目类别：面上项目

网络图像标注中多视图半监督稀疏特征选择算法研究

批准号：61502143

批准年份：2015

负责人：史彩娟

学科分类：F0210

资助金额：21.00

项目类别：青年科学基金项目

基于多视角深度稀疏编码及流形正则化的图像标注研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于国产化替代环境下高校计算机教学的研究

基于铁路客流分配的旅客列车开行方案调整方法

基于综合治理和水文模型的广西县域石漠化小流域区划研究

基于多色集合理论的医院异常工作流处理建模

基于腔内级联变频的0.63μm波段多波长激光器

刘伟锋的其他基金

基于组元特性的含锑难处理金矿直接熔炼富集金的基础研究

基于多视角学习的情感分析理论与方法研究

相似国自然基金