Object detection in image and video frames is one of the most important topics in computer vision and image understanding, while most of the existing object detection methods are challenged by object views, deformation and complex background. In this project, focusing on multi-view and multi-posture human objects, depending on the "global-first" visual cognition and compressed sensing theories, we investigate the topology description and piecewise linear sparse representation. We plan to use dynamic programming (DP) and inverse optimization methods to solve the topology deformation and transferring models. We also attempt to solve the multi-view and multi-posture problem by the fusion of piecewise linear sparse representation and deformable models. The research will realize the "global-first" visual cognition in computer vision and finally bring out a high performance object detection algorithm. The research content covers the object representation theory, classifier design method and object deformation problem. The research results are significant to general object detection theory and are valuable to practical applications such as intelligent video surveillance, content-based video retrieval and driver-assistant systems.
图像/视频中的目标检测是计算机视觉与图像理解领域的核心研究课题之一。而现有检测方法大多受到目标视角、形变、复杂背景等因素的困扰。本项目以多视角多姿态的人体目标为切入点,以拓扑优先认知理论与压缩感知理论为依据,研究目标的拓扑描述和分段线性稀疏表示方法;采用动态规划与逆最优化数学工具,求解拓扑形变及拓扑迁移模型;采用分段线性稀疏表示与形变模型相结合的方法解决多视角多姿态难题。尝试在计算机视觉中呈现拓扑优先的生物认知机理,进而实现高性能的目标检测算法。项目研究内容涉及了目标特征表示理论、分类器设计方法及形变问题。研究成果对于广义目标检测具有重要理论意义,对于视频监控、图像/视频检索、辅助安全驾驶等系统具有应用价值。
在项目计划执行过程中基本上按照原定研究计划进行,研究内容涉及了A.面向人体目标检测的局部特征提取; B.分段线性分类器的设计与建模; C.视觉目标检测的快速定位算法; D. 多视角人体目标的跟踪算法四个主要部分。研究成果之一发表在IEEE ICASSP2015国际会议,提出了多通道互补性正交卷积特征,显著提高了多视角多姿态人体目标检测的性能。提出分段线性支撑向量机方法,并将其用于人体目标检测,为多视角多姿态人体目标检测提供方法支撑,成果发表在图像处理知名期刊IEEE Trans. Image Processing 2013。所提出的目标预定位方法性能远高于传统的Selective Search。在召回率为80%时排序后降低窗口数量5倍以上。提出了深度数据关联模型对基于RGB-D 的目标观测进行多目标跟踪;提出了基于深度结构的遮挡问题处理方法。研究成果发表在知名期刊IEEE Transactions on Intelligent Transportation Systems, 2015. 在本基金资助下共发表学术论文20篇,其中在高影响力的SCI国际期刊(IEEE Transactions)发表论文4篇,其他SCI论文2篇,EI论文12篇,在目标检测领域产生了一定的学术影响。相关的学术成果整理出版专著一本(视觉目标检测与跟踪:科学出版社)。培养青年研究骨干1名,博士生研究生5名,硕士生7名。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
基于SSVEP 直接脑控机器人方向和速度研究
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
多视图人体姿态可信估计方法及应用
基于多视角深度特征融合的遥感视频运动目标检测跟踪
基于多视角与多示例学习的目标跟踪方法研究
基于多视角和多模态潜在关联挖掘的人体动作识别算法研究