多视环境下基于变分水平集的场景流估计

基本信息
批准号:61502382
项目类别:青年科学基金项目
资助金额:20.00
负责人:李秀秀
学科分类:
依托单位:西安理工大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:赵明华,肖照林,李红叶,柳宇,曹慧
关键词:
场景流多视点深度图像
结项摘要

Human-computer interaction and three-dimensional technology are one of the three themes of "Industry 4.0", and the key aspects of the industry intelligence. A core element of human-computer interaction is to acquire and analyze the motions of human and interactions between human and computers. Since scene flow is able to describe the three-dimensional motion field in detail, it is very significant to study the acquisition of scene flow. In this project, multiple depth cameras and color cameras are combined to estimation the scene flow which should be continuous and vivid. The deficiency of depth information and the existence of outlies can affect the completeness and continuity of the shape of three-dimensional object. Therefore, the fusion mechanism of multiple depth images are studied to obtain a continuous and complete shape of three-dimensional object. Further, a model for estimating dense scene flow will be proposed with the guidance of local rigid motion to reduce the complexity of computation and avoid errors: the segmentation of the three-dimensional object shape and the calculation of rigid motion parameters of segmented regions are studied, which can narrow the search space of scene flow estimation; then the dense and continuous scene flow is estimated by simulating the motion of three-dimensional object shape with the evolution of variational level set. The achievements of this project will be the dependence and data source of segmentation, tracking and behavior analysis in the three-dimensional scene, and can improve the ability to analyze and understand the scene in robot navigation, smart monitoring, and smart car etc.

人机交互是产业智能化的关键环节,其核心内容之一是获取分析人与机器的运动及交互行为,而场景流因能够细致地描绘三维场景的运动场,因而研究意义巨大。本课题拟综合多个深度、可见光摄像机的优点,研究多视环境下基于变分水平集的场景流获取框架,以获取连续、逼真的场景流,内容包括:针对深度图像中信息缺失、外点等问题,研究在深度和影像信息驱动下,基于水平集函数的多深度视图融合机制,以获得连续、完整的外形曲面。针对场景流估计中的计算量大且易出错问题,研究局部刚性运动指导下的全局场景流估计模型:通过局部区域属性一致性分割及刚性运动估计,缩小场景流估计的搜索空间,降低计算中的空间、时间复杂度;使用水平集函数演化模拟三维目标外形运动以实现连续的场景流的获取。本课题的成果可作为三维场景中的目标分割、跟踪和基于运动场的行为分析的依据和数据源;在机器人导航、智能监控和智能汽车等方面可显著提高其分析理解场景的能力。

项目摘要

产业智能化的发展对人机交互、场景理解的要求逐渐提高,利用视觉信息分析理解场景中的目标及其运动是其中一项重要内容。本课题研究了深度图像与可见光图像下的场景流估计。. 针对多视图像颜色不一致和深度图像空洞问题,提出了立体图像对协同本征分解模型和shading信息引导的深度图像修复方法。协同本征分解模型使立体图像对的Reflection分量在信息熵与对比度方面有所提高;shading信息引导的深度图像修复结果的峰值信噪比和平均结构相似性均高于同类方法。. 针对多视图像色差、光照及特征分布不均造成的运动估计不正确问题,提出了基于多视二维距离约束的三维运动估计方法。将已有三维目标外形与下一时刻的多视图像联合,通过在各视点缩小目标外形二维投影与目标silhouette的距离来估计三维运动参数。通过基于自行采集数据的刚性目标动态重建,验证了该方法的有效性。. 针对传感器不足及标定误差造成的信息缺失问题,提出了基于水平集演化的场景流估计框架。将三维目标的运动看作水平集函数的演化以获得连续、完整的场景流:初始化水平集函数,使其包围目标外形;构建目标运动前后的投影与多视图像的颜色一致性约束及与silhouette一致性约束;建立关于水平集函数的能量函数,通过计算演化速度得到场景流。通过估计结果的二维投影对多视silhouette的覆盖分析及视觉对比,验证了本框架的有效性。. 针对运动中的遮挡问题,提出了深度图像自动分层的场景流估计框架。该框架借助RGB图像指导对齐深度图像的初始分割;基于图像局部相似性或运动相似性合并初始分割完成深度图像分层;在运动前后颜色一致性、分层深度信息变化及RGB与深度图像边缘相关性等约束下,计算每层的2D运动和相应的深度变化,最终得到场景流。通过在Middlebury2003、 SRSF和RGBD等数据集的实验,本框架在视觉效果、均方根误差和平均角度误差等量化指标方面取得了较好的结果。. 本课题研究成果可用于场景的语义分割、分析,目标的检测与跟踪。在机器人导航、自动驾驶及三维数据的压缩等应用领域有着重大的应用前景。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
2

针灸治疗胃食管反流病的研究进展

针灸治疗胃食管反流病的研究进展

DOI:
发表时间:2022
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

李秀秀的其他基金

相似国自然基金

1

基于深度线索的多假设变分场景流估计研究

批准号:61401113
批准年份:2014
负责人:项学智
学科分类:F0116
资助金额:24.00
项目类别:青年科学基金项目
2

基于变分原理和水平集方法的复杂图像分割研究

批准号:61070120
批准年份:2010
负责人:何宁
学科分类:F0210
资助金额:36.00
项目类别:面上项目
3

基于变分原理和水平集的眼底图像自动分析算法研究

批准号:60871078
批准年份:2008
负责人:唐延东
学科分类:F0125
资助金额:35.00
项目类别:面上项目
4

面向复杂场景图像分割的多模态驱动型水平集方法研究

批准号:61672204
批准年份:2016
负责人:王晓峰
学科分类:F0210
资助金额:59.00
项目类别:面上项目