视觉特征表达的集成深度自我学习研究

基本信息

批准号：61862031

项目类别：地区科学基金项目

资助金额：39.00

负责人：罗会兰

学科分类：

依托单位：江西理工大学

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：井福荣,易见兵,李俊,卢飞,文彪,陈鸿坤,岳亮亮,黎宵

关键词：

特征提取特征表达非监督式学习深度学习集成学习

结项摘要

Visual feature representation is the key step of computer vision, and the simple and efficient representation is the essence of visual understanding. Most hand-crafted visual features are only suitable for specific occasions and simple tasks. Although the recent deep learning technique shows promising ability to learn visual feature representations, it requires a large number of supervised samples. This project proposes to design ensemble deep self-taught learning framework, which can take advantage of self-taught learning, ensemble learning and deep learning to learn visual feature representations. Firstly, the model and training method of ensemble deep self-taught learning framework will be studied. The model and ensemble learning method will be studied, which can be trained to learn different visual cues from a large number of unlabeled low cost image and video data. Secondly, The framework based on generative adversarial networks will be designed to train ensemble deep self-taught feature representation learning model, which tries to learn element feature library of visual representation. Finally the approach to sparsely express images and videos using the visual feature representation element library will be studied, so as to implement the subsequent computer vision tasks, such as recognition and detection. The smooth development of the project will improve the theory and algorithm system of self-taught learning and deep learning, and provide an effective method for the extraction and representation of visual features.

视觉特征的表达是计算机视觉的关键步骤，简单高效的表达是视觉理解的本质。大多数人工设计的特征提取和表达方法只适合于特定场合和简单任务，近年来出现的利用深度学习实现特征的自动提取方法，虽然有学习特征表达的能力，但需要大量的监督样本。本项目提出结合自我学习、集成学习和深度学习进行视觉特征表达学习的研究。首先研究无监督集成深度学习模型，研究从大量无标签低成本图像和视频数据中集成学习不同视觉线索的模型与方法；其次研究构建生成对抗网络架构来训练自我集成深度特征表达学习模型，试图学习到视觉特征表达的基元库；最后研究利用此基元库进行图像和视频的分级稀疏表达，从而实现后续的计算机视觉任务，如分类和检测等。项目的顺利开展将完善自我学习与深度学习理论和算法体系，为视觉特征提取和表达提供一种有效的方法。

项目摘要

视觉特征的表达是计算机视觉的关键步骤，简单高效的表达是视觉理解的本质。本项目针对不同的视觉数据进行特征表达和学习的研究，利用集成学习和基于生成对抗的无监督学习方法，在不同的视觉任务上进行特征表达模型的研究。在RGB视频数据和人体骨架关键点视频数据进行特征提取和表达的研究方面，提出了协同时空注意力、多维特征激励融合、多维动态拓扑学习图卷积等一系列新颖的特征提取和表达方法，以学习到有效的时空视觉特征，并应用于人体动作识别和异常行为识别领域，获得了较大的性能提升。第二，对基于图像的数据进行特征提取和表达研究，以完成目标检测、显著性目标检测、深度估计和语义分割等基于单个图像信息的视觉任务，提出了一系列细节特征和语义特征增强和融合的方法，利用注意力指导模块集成多尺度、跨维度特征，设计交互模块以促进上下文语义信息和空间信息的交互学习，以完成不同级别的图像识别任务。另外，为了减少特征融合过程中的信息损失，提出了一种新的渐进式特征集中结构，将低级特征和高级特征逐层集成，实现多层次特征的递进融合，通过语义引导融合来缓解低层次特征在融合过程中导致的语义稀释问题，实现了更精准的特征表达。第三，集成多任务的特征表达学习研究，以利用有限的训练数据学习到通用视觉特征，同时结合生成对抗的训练学习方法，通过共享特征的学习和任务特定特征的学习，基于压缩激励和可选择权重的多任务学习网络利用可选择权重对语义分割特征和深度估计特征进行融合，学习对特定任务更具辨别性的特征。还研究了文本特征与视觉特征的融合，设计因果卷积层促进图像特征的准确描述。最后，还对特定领域，交通标志图像及光学遥感图像进行了特征表达和描述的研究，结果表明通用领域的特征学习方法需要根据领域进行微调才能获得更好的识别效果。本项目研究的实验结果表明了所提出方法的有效性，对于视觉特征表达和通用视觉任务的研究具有重要的理论意义。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2020

DOI：

发表时间：2021

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：10.7498/aps.70.20202116

发表时间：2021

DOI：10.1360/SSM-2020-0035

发表时间：2020

罗会兰的其他基金

批准号：61462035

批准年份：2014

资助金额：46.00

项目类别：地区科学基金项目

批准号：61105042

批准年份：2011

资助金额：24.00

项目类别：青年科学基金项目

相似国自然基金

融合浅层模型和深度网络的视觉特征学习研究

批准号：61671151

批准年份：2016

负责人：潘泓

学科分类：F0116

资助金额：58.00

项目类别：面上项目

基于深度迁移学习的跨领域视觉特征融合与分类

批准号：61806207

批准年份：2018

负责人：潘杰

学科分类：F0604

资助金额：25.00

项目类别：青年科学基金项目

基于时空特征深度学习的无约束场景视觉目标跟踪研究

批准号：61602018

批准年份：2016

负责人：张辉

学科分类：F0210

资助金额：20.00

项目类别：青年科学基金项目

基于快速视觉注意模型和深度学习的视觉跟踪

批准号：61401463

批准年份：2014

负责人：黎万义

学科分类：F0117

资助金额：27.00

项目类别：青年科学基金项目

视觉特征表达的集成深度自我学习研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

二维FM系统的同时故障检测与控制

非牛顿流体剪切稀化特性的分子动力学模拟

现代优化理论与应用

罗会兰的其他基金

基于集成流形学习的监控视频中人体行为识别研究

自动聚类集成理论及其在不变性识别中的应用研究

相似国自然基金