基于结构化深度学习的场景理解

基本信息
批准号:61872364
项目类别:面上项目
资助金额:63.00
负责人:卢汉清
学科分类:
依托单位:中国科学院自动化研究所
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:陈盈盈,郭海云,李成华,史磊,高云泽,朱优松,周鲁
关键词:
场景理解深度学习图像表征深度估计结构化模型
结项摘要

In this proposal, we aim to systematically study on structured deep learning based scene understanding. We propose to design proper deep neural networks, in order to overcome the shortcomings of the traditional models on the lack of ability on image feature representation. We integrate deep neural networks and probabilistic graphical models to study the structured deep learning problem. we propose a model which combines convolutional neural networks (CNN) and continuous conditional random fields (CCRF) in a unified deep learning framework. CNN can extract rich related features from image, and CCRF can optimize the output of CNN according to the position and color information of the image pixels. We also propose a model to fuse sparse known labels. By using these known labels, we can provide our model a few relatively accurate depth value as a reference, and largely narrow down the range of reasonable depth value of other pixels. Thus the model can reduce the ambiguity of mapping a single RGB image into depth map to some extent. We investigate the multi-task learning problem on both depth estimation and semantic segmentation. By addressing the problems studied in this proposal, the vision based scene understanding theory and technique can be further developed.

本项目旨在研究基于结构化深度学习的图像场景理解问题,通过合理设计和架构深度学习网络模型,克服传统方法在图像特征表达能力方面的不足;将深度学习模型与概率图模型相结合,研究统一的结构化深度学习框架,解决传统深度学习模型输出缺乏结构化约束、空间结构信息丢失的问题;面向大规模应用数据,研究结构化输出模型的快速推断方法,以避免巨大的计算代价;在深度学习模型中引入可以通过较低成本获取的稀疏先验信息,研究先验信息的融合方法,以减少单幅图像到深度图之间映射的不确定性。研究图像的深度估计和语义分割的多任务学习,实现两个任务的共同增强。本项目的研究将促进基于视觉的场景理解理论和技术的发展,为机器人、无人车等技术的推进和发展提供有力的保障。

项目摘要

本项目深入研究了基于结构化深度学习的图像场景理解问题。围绕场景语义描述、语义分割、深度估计等计算机视觉关键科学问题展开系统研究,提出了新颖的方法,取得了一定的成果,包括:面向场景分析的自适应上下文神经网络模型、基于反事实多智能体强化学习的非自回归场景语义描述模型、基于多视图特征与混合奖励的场景语义描述方法、基于双重关系感知注意网络的场景解析方法、基于连续条件随机场的单目图像场景深度估计神经网络等。项目组共发表论文11篇,其中发表期刊论文4篇,发表高水平国际会议论文7篇。本项目的研究将促进基于视觉的场景理解理论和技术的发展,为机器人、无人车等技术的推进和发展提供有力的保障。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

针对弱边缘信息的左心室图像分割算法

针对弱边缘信息的左心室图像分割算法

DOI:10.3778/j.issn.1002-8331.1911-0012
发表时间:2020
2

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
3

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

DOI:10.6041/j.issn.1000-1298.2022.07.022
发表时间:2022
4

二维FM系统的同时故障检测与控制

二维FM系统的同时故障检测与控制

DOI:10.16383/j.aas.c180673
发表时间:2021
5

信息熵-保真度联合度量函数的单幅图像去雾方法

信息熵-保真度联合度量函数的单幅图像去雾方法

DOI:10.3724/SP.J.1089.2019.17435
发表时间:2019

卢汉清的其他基金

批准号:60475010
批准年份:2004
资助金额:24.00
项目类别:面上项目
批准号:60833006
批准年份:2008
资助金额:190.00
项目类别:重点项目
批准号:61070104
批准年份:2010
资助金额:32.00
项目类别:面上项目

相似国自然基金

1

基于深度学习的装配场景理解及装配诱导、监测研究

批准号:51475251
批准年份:2014
负责人:陈成军
学科分类:E0510
资助金额:80.00
项目类别:面上项目
2

基于深度强化学习的大尺度人群监控场景理解研究

批准号:61771303
批准年份:2017
负责人:杨华
学科分类:F0117
资助金额:62.00
项目类别:面上项目
3

基于场景语意理解和深度学习特征表述的视频行为分析研究

批准号:61602014
批准年份:2016
负责人:李楠楠
学科分类:F0210
资助金额:21.00
项目类别:青年科学基金项目
4

基于超体素深度特征学习的室内点云场景分割与理解

批准号:61802294
批准年份:2018
负责人:罗楠
学科分类:F0209
资助金额:27.00
项目类别:青年科学基金项目