基于多视角深度稀疏编码及流形正则化的图像标注研究

基本信息
批准号:61671480
项目类别:面上项目
资助金额:58.00
负责人:刘伟锋
学科分类:
依托单位:中国石油大学(华东)
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:王延江,刘宝弟,李莉,李鹏,王立,张连波,马腾洲,杨兴浩,张振清
关键词:
多视角学习流形学习正则化稀疏编码
结项摘要

Image annotation plays an important role in various applications such as multimedia processing, image understanding, large scale image/video retrieval, intelligent surveillance. This project will explore and study a novel solution of image annotation based on multiview deep sparse coding and manifold regularization. Firstly, we will propose a high-order locality preserving algorithm i.e. p-Laplacian regularization to boost the performance of image annotation. Secondly, we will propose a manifold regularized multiview canonical correlation analysis algorithm and then develop a deep architecture of multiview canonical correlation to discover the nonlinear correlation information hidden in different image features. Thirdly, we will propose a deep multiview spare coding algorithm to learn effect image representation for annotation. Finally, we will construct the prototype system to evaluate the performance of image annotation with the mentioned solutions. The proposed study of image annotation that integrates deep learning, manifold learning, sparse coding and multiview learning will disclose the intrinsic relations between multiple image features and pave a fresh way for large scale image retrieval and understanding.

图像标注在多媒体信息处理、图像理解、大规模图像/视频检索、智能监控等多个领域有着重要的应用价值。本项目拟探讨和研究基于多视角深度稀疏编码及流形正则化的图像标注方法。首先,结合流形学习,提出一种保持样本分布局部结构的高阶流形p-Laplacian正则化方法,从而提高图像标注的准确性;其次,提出一种基于流形正则化的多视角典型相关分析算法,并进而构建多视角典型相关分析的深度模型,分析图像不同特征之间的非线性关系;第三,提出一种多视角深度稀疏编码模型,有效地学习多视角图像特征表达;最后,构建图像标注原型系统。本项目结合深度学习、流形学习、稀疏编码及多视角学习对图像标注方法进行研究,将进一步揭示图像多视角特征间的内在联系,为大规模图像检索奠定基础,为智能图像理解提供一条新的途径。

项目摘要

图像标注是多媒体信息处理、理解、推荐等应用研究的重要组成部分,有着重要的应用价值。本项目围绕局部结构学习理论研究多视角深度稀疏编码及流形正则化的图像标注方法,主要完成了如下研究内容。(1)针对图像样本的局部结构表示,提出了样本局部结构保持p-Laplacian的逼近算法,进而实现了p-Laplacian正则化框架、超图p-Laplacian正则化的逻辑回归、集成p-Laplacian正则化等算法;(2)针对图像的多视角特征融合,提出了Hessian多集典型相关分析算法、多集典型相关分析网络模型;(3)针对图像深度稀疏编码,提出了Hessian深度自编码器、最大边界深度自编码器算法;(4)结合不同的图像标注场景,在主流的图像数据库上对算法模型进行了图像识别、分类等应用实验验证,实验结果表明了项目所提出方法的有效性。本项目对多视角深度稀疏编码、流形正则化、图卷积神经网络等表示学习理论进行了深入研究,探索了大规模图像标注中的深度结构学习理论和方法,进一步揭示了统计学习中数据样本分布的本质,为构建有效的图像标注模型提供有力的理论依据,为大规模图像数据分析提供了新的途径。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

DOI:
发表时间:2020

刘伟锋的其他基金

批准号:51404296
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:61301242
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目

相似国自然基金

1

基于稀疏正则化和深度学习的湍流退化图像复原研究

批准号:61402480
批准年份:2014
负责人:谢源
学科分类:F0210
资助金额:27.00
项目类别:青年科学基金项目
2

基于稀疏多流形学习的高光谱遥感图像分类

批准号:41371338
批准年份:2013
负责人:黄鸿
学科分类:D0113
资助金额:75.00
项目类别:面上项目
3

基于稀疏正则化方法的盲图像复原关键技术研究

批准号:61572077
批准年份:2015
负责人:何宁
学科分类:F0210
资助金额:65.00
项目类别:面上项目
4

网络图像标注中多视图半监督稀疏特征选择算法研究

批准号:61502143
批准年份:2015
负责人:史彩娟
学科分类:F0210
资助金额:21.00
项目类别:青年科学基金项目