具有3D空间辨识力的视觉显著计算模型研究

基本信息

批准号：61472380

项目类别：面上项目

资助金额：83.00

负责人：曹洋

学科分类：

依托单位：中国科学技术大学

批准年份：2014

结题年份：2018

起止时间：2015-01-01 - 2018-12-31

项目状态：已结题

项目参与者：陈长汶,方帅,郑志刚,邹杰,张敬,刘羽,康凯,周传培,汪婷

关键词：

显著性空间辨识力立体匹配3D场景表示图像分类

结项摘要

In this project, a novel discriminative 3D spatial saliency computational model is proposed by using the spatial relations between objects and scene. Most of the state-of-the-art 3D saliency detection methods only take the depth information as the low-level feature, but this ignores the influence of depth information on 3D scene representation. To overcome this, there are four main issues to be addressed in this project: 1). A robust stereo matching algorithm that incorporates the monocular cues contained in the image is presented. The proposed algorithm uses multi-scale image segmented regions as matching primitives and exploits a cooperative optimization procedure to minimize the matching costs of all regions by introducing the cooperative and competitive mechanism between regions. 2). Based on the block world model, a qualitative physical representation of an outdoor scene is presented, where objects have volume and mass, and relationships describe 3D structure and mechanical configurations. Then a novel combinatorial optimization approach is proposed to build up a physically-plausible 3D interpretation of the scene. 3). Inspired by the basic photographic composition rules, a novel saliency computational model is presented, which utilizes the knowledge of photographic composition as priors to express the scenario of photographer. 4）A contextualizing framework, which iteratively and mutually boosts stereo image classification and 3D salient object detection by taking the outputs from one task as the context of the other one, is presented. The proposed solution is supposed to be superior over the existing methods.

本项目面向3D图像内容，针对现有视觉显著性计算方法的不足，依据目标-场景的3D空间关系，提出具有3D空间辨识力的视觉显著计算模型，并对由此引出的如下科学问题和关键技术开展研究：1）以多尺度图像分割区域作为基元，基于协同优化的思想，融合基于单眼线索和基于立体匹配的深度估计方法，提高自然场景深度估计的精度和鲁棒性。2）利用积木世界模型描述3D场景，通过将图像的各个分割区域模化为带有几何和物理属性的积木实体，基于几何空间约束和物理稳定性约束，采用组合优化策略建立目标与场景间的3D空间关系。3）基于摄影构图的基本规则，寻求从目标-场景的3D空间布局中估计出摄影者想表征的事物或主题，并通过心理学实验获取其视觉显著性的表示方法。4）将3D显著性检测和立体图像分类结合起来，通过设计一个互为上下文关系的迭代框架，采用交替渐进优化的方法，一方面增强显著性区域的3D空间辨识性，另一方面提高图像分类问题的效果。

项目摘要

本项目所提出的 “3D空间辨识力”这一概念，是指从图像内容中抽象和刻画3D场景空间布局的能力。为了自动计算和提取出图像内容中具有3D空间辨识力的显著性区域，并将其扩展应用于图像增强、机器人自主导航、目标分类等视觉任务中，本项目针对如下内容进行了深入研究：1）融合多种深度感知线索的深度估计方法研究。将基于散焦、纹理变化、光线穿透度等单眼深度线索的图像局部特征与基于立体视差、运动视觉等多视角深度线索的图像全局特征相结合，一方面利用单眼线索克服分辨率不足、运动模糊等因素所带来的影响，提高深度估计结果的鲁棒性，另一方面利用多视角深度线索所提供的精确测量信息，提高深度估计方法的可靠性。2）基于深度信息的自然场景3D空间表示。融合图像中内蕴的散焦程度、纹理梯度、消失线等多种深度线索，采用监督学习的方式结合目标-场景的空间布局先验约束，从自然图像中自动提取空间结构辨识特征，实现场景结构感知的自然场景3D空间表示，并将其应用于飞行机器人自主巡航、人群密度估计等视觉任务中。3）基于目标-场景3D空间关系的视觉显著计算模型。建立了一个以眼动数据作为真实显著性检测结果的立体图像数据库，为3D视觉显著计算研究提供了研究平台。引入了摄影构图模式的思想，从目标-场景的3D空间布局中估计出摄影者想表征的事物或主题，并将其引入到视觉显著计算框架中。4）3D视觉显著计算模型的应用。一方面将3D显著性特征与自下而上的底层图像特征相结合，抑制图像中大量无关像素的干扰，改善图像增强的效果；另一方面将其与自上而下的高层语义特征相结合，增强显著性区域的3D空间辨识性，提高立体图像分类的准确性。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3778/j.issn.1002-8331.1911-0012

发表时间：2020

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：

发表时间：2019

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

曹洋的其他基金

批准号：31401130

批准年份：2014

资助金额：20.00

项目类别：青年科学基金项目

批准号：60805019

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：30901903

批准年份：2009

资助金额：20.00

项目类别：青年科学基金项目

批准号：61601193

批准年份：2016

资助金额：22.00

项目类别：青年科学基金项目

批准号：51608127

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：61872327

批准年份：2018

资助金额：64.00

项目类别：面上项目

相似国自然基金

基于显著性共生结构的视觉计算模型和图像检索研究

批准号：61866005

批准年份：2018

负责人：刘广海

学科分类：F0609

资助金额：41.00

项目类别：地区科学基金项目

基于感知增强理论的视觉显著性计算

批准号：61703166

批准年份：2017

负责人：余晋刚

学科分类：F0604

资助金额：26.00

项目类别：青年科学基金项目

面向夜间视频的视觉显著性模型研究

批准号：61602349

批准年份：2016

负责人：徐新

学科分类：F0210

资助金额：20.00

项目类别：青年科学基金项目

显著视觉相似性度量模型及应用

批准号：61572207

批准年份：2015

负责人：刘文予

学科分类：F0605

资助金额：67.00

项目类别：面上项目

具有3D空间辨识力的视觉显著计算模型研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

针对弱边缘信息的左心室图像分割算法

一种基于多层设计空间缩减策略的近似高维优化方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于主体视角的历史街区地方感差异研究———以北京南锣鼓巷为例

信息熵-保真度联合度量函数的单幅图像去雾方法

曹洋的其他基金

引入蛋白质主链和侧链耦合作用的侧链结构模拟算法研究

基于单眼线索的自然场景深度重建

金福安汤通过调控p120ctn途径干预肺癌转移的实验研究

面向多模式机器型通信的无线网络资源调配机理研究

地铁列车制/启动运行对折返线道岔尖轨磨耗影响机制研究

基于对抗学习策略的模糊辨识性特征计算方法研究

相似国自然基金