RGB-D图像分类中的异构多模态数据自适应融合研究

基本信息

批准号：61602485

项目类别：青年科学基金项目

资助金额：20.00

负责人：赵鑫

学科分类：

依托单位：中国科学院自动化研究所

批准年份：2016

结题年份：2019

起止时间：2017-01-01 - 2019-12-31

项目状态：已结题

项目参与者：王威,张俊格,程衍华,贾真,李乔哲,刘晋德,付连锐,李达

关键词：

深度神经网络异构多模态数据RGBD图像分类模式识别自适应融合

结项摘要

The RGB and depth images of RGB-D data are acquired independently and have complementary visual information which has the ability of comprehensive visual perception. The potential of RGB-D data cannot be discovered properly because most existing RGB-D image classification methods are inspired by the conventional methods instead of the characteristics and problems of the heterogeneous multi-modal data. The aim of this project is about to propose a comprehensive adaptive fusion framework. The framework is able to explore the complementarity and deal with the problem of the redundancy and heterogeneity of modal representation based on the independence of data acquisition. The importance of this project is as follows: the structure of multiple layered networks of the hierarchical model learns the top-down and bottom-up visual feature via similarity constraints and improves the robustness of the representation; the recursive neural networks with tree-based topological structure remove the redundancy of the modal representation; reconstruction network and total network regularization solve the initialization and over-fitting problems; diversity-preserving algorithm solves the problem of unbalanced examples during model updating; adaptive multi-modal deep co-training removes the heterogeneity and utilizes the complementarity of the modal representation. In summary, this project will study the RGB-D image classification thoroughly in order to provide new viewpoints and methods.

RGB-D数据中颜色和深度图像的采集方式相互独立，在视觉信息上相互补充，具有全面的视觉感知能力。当前的方法大多是对传统方法进行移植，没有针对异质多模态数据的特点和存在的问题综合设计，无法充分发挥RGB-D数据的潜力。本项目旨在提出完整的自适应融合框架，以采集方式独立性为前提，充分挖掘RGB-D数据的互补特性，解决其存在的模态表达冗余性和异构性的问题。在深度协同训练框架下，本项目的意义在于层次化模型的多层网络结构，结合图像相似度约束，学习自下而上和自上而下相结合的视觉特征，提升了表达的鲁棒性；树状拓扑结构的递归神经网络消除了模态的冗余性；重构网络和网络完全正则化理论解决了模型对初始化参数敏感和过拟合的问题；多样性保持算法解决了模型更新样本不均衡的问题；自适应的多模态深度协同训练消除了模态异构性，发挥了模态互补性。总之，本项目将全面深入地探索RGB-D图像分类，以期给该方向带来新观点和新方法。

项目摘要

当今，有效地融合三维空间信息以及二维图像信息，进一步提升图像分类的准确度和鲁棒性，成为计算机视觉发展的必然趋势。随着新型的消费级深度传感器可实现同步获得高分辨率的RGB图像和高质量的depth图像 (即RGB-D数据)，宣告这一时刻的提前到来。本项目的主要研究内容是围绕RGB-D数据在视觉信息上的互补特性，研究单模态特征学习方法和RGB-D 数据特征表达方法，之后又充分考虑物体识别中大规模人工标记训练样本标签的成本代价，研究大规模无标注样本条件下RGB-D数据的无监督特征表达学习，构造了两种无监督的多层网络结构的层次化模型来有效地表征RGB-D数据各个模态的特性。研究层次化模型的多层网络结构和多模态协同训练模型的机制，以及特征学习的鲁棒性建模和在线学习算法，实现协同训练模型的优化。在少量标注样本结合大规模无标注样本条件下，研究RGB-D物体的特征及分类器联合协同学习，提出了一种基于协同学习的半监督特征及分类器联合学习框架。研究大规模标注样本条件下RGB-D物体尺度及视角不变性的多模态融合学习，提出一种密集匹配策略将物体映射到同一个尺度及视角空间，并在该空间定义了一种多模态融合学习策略来动态的权衡RGB-D图像中各个模态的重要性，有效地融合RGB和depth模态的互补性能进一步提升RGB-D图像分类的准确度和鲁棒性。最后为将RGB-D图像分类研究与室内智能视频监控和机器人视觉等实际应用问题相结合，研究了相比图片级的RGB-D分类任务难度更大的像素级RGB-D分类任务，即场景语义分割，提出了一种开关融合策略来学习RGB和depth两种模态在描述不同场景下各种物体时权重的可变性，用于进一步提升分类的精度。总之，本项目全面深入地探索RGB-D图像的分类问题，在多个RGB-D图像分类标准库上都获得了最高的分类精度，为该方向带来新观点和新方法。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：2021

DOI：10.3778/j.issn.1002-8331.1911-0012

发表时间：2020

DOI：

发表时间：2020

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

赵鑫的其他基金

批准号：11901357

批准年份：2019

资助金额：23.00

项目类别：青年科学基金项目

批准号：31800499

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：61872369

批准年份：2018

资助金额：62.00

项目类别：面上项目

批准号：51305361

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：81500367

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

批准号：81302146

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：81801380

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：51408103

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：81803959

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：31401905

批准年份：2014

资助金额：22.00

项目类别：青年科学基金项目

批准号：51209012

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：31300838

批准年份：2013

资助金额：22.00

项目类别：青年科学基金项目

批准号：51675444

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：31560283

批准年份：2015

资助金额：37.00

项目类别：地区科学基金项目

批准号：30901802

批准年份：2009

资助金额：21.00

项目类别：青年科学基金项目

批准号：81603213

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：41101249

批准年份：2011

资助金额：26.00

项目类别：青年科学基金项目

批准号：51003111

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：31770985

批准年份：2017

资助金额：55.00

项目类别：面上项目

批准号：61502502

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

相似国自然基金

有效融合多源异构数据的集成分类器研究

批准号：61503253

批准年份：2015

负责人：何丽芳

学科分类：F0603

资助金额：21.00

项目类别：青年科学基金项目

基于协同粒化的异构多模态数据高效约简与融合及其应用

批准号：61762009

批准年份：2017

负责人：蒙祖强

学科分类：F0607

资助金额：39.00

项目类别：地区科学基金项目

信息物理融合系统中多模态数据的融合机制研究

批准号：61602083

批准年份：2016

负责人：高静

学科分类：F0208

资助金额：20.00

项目类别：青年科学基金项目

基于多模态图像和多分类器融合的DBT肿块自动检测方法研究

批准号：61602419

批准年份：2016

负责人：赖小波

学科分类：F0214

资助金额：20.00

项目类别：青年科学基金项目

RGB-D图像分类中的异构多模态数据自适应融合研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于国产化替代环境下高校计算机教学的研究

基于铁路客流分配的旅客列车开行方案调整方法

针对弱边缘信息的左心室图像分割算法

基于多色集合理论的医院异常工作流处理建模

基于改进LinkNet的寒旱区遥感图像河流识别方法

赵鑫的其他基金

Navier-Stokes方程与Darcy流耦合模型的mortar元方法及其后验误差估计

落叶松液化物非金属原位掺杂有序炭材料的控制制备及其超级电容器储能机制研究

基于记忆增强神经网络的用户兴趣理解与个性化推荐技术研究

高速列车车轮踏面局部滚动接触疲劳的机理研究

多模态“影像”集成个体化预测急性DebakeyⅠ型主动脉夹层外科治疗后的再发破裂

B7-H3分子调控survivin表达在胰腺癌抵抗吉西他滨化疗中的作用机制

CREB-NR2B反馈调控过程对脑衰老相关胰岛素抵抗与TGF-β信号通路紊乱对话的作用及其在术后认知功能障碍中的意义

基于产氢功能基因组学的产氢群落解析及高效菌群构建

基于肠道益生菌的杜仲抗骨质疏松机制研究

基于基因组重复序列的FISH技术绘制菊属重要野生种的精准核型

流速与藻类种群生长演替驱动-响应关系模拟研究

基于中央执行功能的儿童工作记忆可塑性研究

高速冲击下的轮轨滚动接触疲劳萌生及瞬态裂纹扩展研究

认知训练对反应抑制能力的影响：个体差异、长期效应以及神经机制

去卵巢动物睡眠模式异常的机制与干预

人工神经网络级联模型识别天然HERG抑制剂及其作用机制研究

水盐胁迫下荒漠生态系统土壤微生物量时空分布及对土壤呼吸的影响

太阳能光热转换涂层用聚酰亚胺胶黏剂的制备与性能研究

IL-36促进CD8+T细胞分泌IL-9在肿瘤免疫中的作用及机制

融合多网络社区身份的用户话题兴趣建模研究

相似国自然基金