视觉特征表达的集成深度自我学习研究

基本信息
批准号:61862031
项目类别:地区科学基金项目
资助金额:39.00
负责人:罗会兰
学科分类:
依托单位:江西理工大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:井福荣,易见兵,李俊,卢飞,文彪,陈鸿坤,岳亮亮,黎宵
关键词:
特征提取特征表达非监督式学习深度学习集成学习
结项摘要

Visual feature representation is the key step of computer vision, and the simple and efficient representation is the essence of visual understanding. Most hand-crafted visual features are only suitable for specific occasions and simple tasks. Although the recent deep learning technique shows promising ability to learn visual feature representations, it requires a large number of supervised samples. This project proposes to design ensemble deep self-taught learning framework, which can take advantage of self-taught learning, ensemble learning and deep learning to learn visual feature representations. Firstly, the model and training method of ensemble deep self-taught learning framework will be studied. The model and ensemble learning method will be studied, which can be trained to learn different visual cues from a large number of unlabeled low cost image and video data. Secondly, The framework based on generative adversarial networks will be designed to train ensemble deep self-taught feature representation learning model, which tries to learn element feature library of visual representation. Finally the approach to sparsely express images and videos using the visual feature representation element library will be studied, so as to implement the subsequent computer vision tasks, such as recognition and detection. The smooth development of the project will improve the theory and algorithm system of self-taught learning and deep learning, and provide an effective method for the extraction and representation of visual features.

视觉特征的表达是计算机视觉的关键步骤,简单高效的表达是视觉理解的本质。大多数人工设计的特征提取和表达方法只适合于特定场合和简单任务,近年来出现的利用深度学习实现特征的自动提取方法,虽然有学习特征表达的能力,但需要大量的监督样本。本项目提出结合自我学习、集成学习和深度学习进行视觉特征表达学习的研究。首先研究无监督集成深度学习模型,研究从大量无标签低成本图像和视频数据中集成学习不同视觉线索的模型与方法;其次研究构建生成对抗网络架构来训练自我集成深度特征表达学习模型,试图学习到视觉特征表达的基元库;最后研究利用此基元库进行图像和视频的分级稀疏表达,从而实现后续的计算机视觉任务,如分类和检测等。项目的顺利开展将完善自我学习与深度学习理论和算法体系,为视觉特征提取和表达提供一种有效的方法。

项目摘要

视觉特征的表达是计算机视觉的关键步骤,简单高效的表达是视觉理解的本质。本项目针对不同的视觉数据进行特征表达和学习的研究,利用集成学习和基于生成对抗的无监督学习方法,在不同的视觉任务上进行特征表达模型的研究。在RGB视频数据和人体骨架关键点视频数据进行特征提取和表达的研究方面,提出了协同时空注意力、多维特征激励融合、多维动态拓扑学习图卷积等一系列新颖的特征提取和表达方法,以学习到有效的时空视觉特征,并应用于人体动作识别和异常行为识别领域,获得了较大的性能提升。第二,对基于图像的数据进行特征提取和表达研究,以完成目标检测、显著性目标检测、深度估计和语义分割等基于单个图像信息的视觉任务,提出了一系列细节特征和语义特征增强和融合的方法,利用注意力指导模块集成多尺度、跨维度特征,设计交互模块以促进上下文语义信息和空间信息的交互学习,以完成不同级别的图像识别任务。另外,为了减少特征融合过程中的信息损失,提出了一种新的渐进式特征集中结构,将低级特征和高级特征逐层集成,实现多层次特征的递进融合,通过语义引导融合来缓解低层次特征在融合过程中导致的语义稀释问题,实现了更精准的特征表达。第三,集成多任务的特征表达学习研究,以利用有限的训练数据学习到通用视觉特征,同时结合生成对抗的训练学习方法,通过共享特征的学习和任务特定特征的学习,基于压缩激励和可选择权重的多任务学习网络利用可选择权重对语义分割特征和深度估计特征进行融合,学习对特定任务更具辨别性的特征。还研究了文本特征与视觉特征的融合,设计因果卷积层促进图像特征的准确描述。最后,还对特定领域,交通标志图像及光学遥感图像进行了特征表达和描述的研究,结果表明通用领域的特征学习方法需要根据领域进行微调才能获得更好的识别效果。本项目研究的实验结果表明了所提出方法的有效性,对于视觉特征表达和通用视觉任务的研究具有重要的理论意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021
4

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

罗会兰的其他基金

批准号:61462035
批准年份:2014
资助金额:46.00
项目类别:地区科学基金项目
批准号:61105042
批准年份:2011
资助金额:24.00
项目类别:青年科学基金项目

相似国自然基金

1

融合浅层模型和深度网络的视觉特征学习研究

批准号:61671151
批准年份:2016
负责人:潘泓
学科分类:F0116
资助金额:58.00
项目类别:面上项目
2

基于深度迁移学习的跨领域视觉特征融合与分类

批准号:61806207
批准年份:2018
负责人:潘杰
学科分类:F0604
资助金额:25.00
项目类别:青年科学基金项目
3

基于时空特征深度学习的无约束场景视觉目标跟踪研究

批准号:61602018
批准年份:2016
负责人:张辉
学科分类:F0210
资助金额:20.00
项目类别:青年科学基金项目
4

基于快速视觉注意模型和深度学习的视觉跟踪

批准号:61401463
批准年份:2014
负责人:黎万义
学科分类:F0117
资助金额:27.00
项目类别:青年科学基金项目