多视角多姿态人体目标检测研究

基本信息
批准号:61271433
项目类别:面上项目
资助金额:76.00
负责人:叶齐祥
学科分类:
依托单位:中国科学院大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:焦建彬,陈杰,韩振军,张立国,彭艺,陈孝罡,梁吉祥,柯炜,高文
关键词:
目标检测视觉模型机器学习
结项摘要

Object detection in image and video frames is one of the most important topics in computer vision and image understanding, while most of the existing object detection methods are challenged by object views, deformation and complex background. In this project, focusing on multi-view and multi-posture human objects, depending on the "global-first" visual cognition and compressed sensing theories, we investigate the topology description and piecewise linear sparse representation. We plan to use dynamic programming (DP) and inverse optimization methods to solve the topology deformation and transferring models. We also attempt to solve the multi-view and multi-posture problem by the fusion of piecewise linear sparse representation and deformable models. The research will realize the "global-first" visual cognition in computer vision and finally bring out a high performance object detection algorithm. The research content covers the object representation theory, classifier design method and object deformation problem. The research results are significant to general object detection theory and are valuable to practical applications such as intelligent video surveillance, content-based video retrieval and driver-assistant systems.

图像/视频中的目标检测是计算机视觉与图像理解领域的核心研究课题之一。而现有检测方法大多受到目标视角、形变、复杂背景等因素的困扰。本项目以多视角多姿态的人体目标为切入点,以拓扑优先认知理论与压缩感知理论为依据,研究目标的拓扑描述和分段线性稀疏表示方法;采用动态规划与逆最优化数学工具,求解拓扑形变及拓扑迁移模型;采用分段线性稀疏表示与形变模型相结合的方法解决多视角多姿态难题。尝试在计算机视觉中呈现拓扑优先的生物认知机理,进而实现高性能的目标检测算法。项目研究内容涉及了目标特征表示理论、分类器设计方法及形变问题。研究成果对于广义目标检测具有重要理论意义,对于视频监控、图像/视频检索、辅助安全驾驶等系统具有应用价值。

项目摘要

在项目计划执行过程中基本上按照原定研究计划进行,研究内容涉及了A.面向人体目标检测的局部特征提取; B.分段线性分类器的设计与建模; C.视觉目标检测的快速定位算法; D. 多视角人体目标的跟踪算法四个主要部分。研究成果之一发表在IEEE ICASSP2015国际会议,提出了多通道互补性正交卷积特征,显著提高了多视角多姿态人体目标检测的性能。提出分段线性支撑向量机方法,并将其用于人体目标检测,为多视角多姿态人体目标检测提供方法支撑,成果发表在图像处理知名期刊IEEE Trans. Image Processing 2013。所提出的目标预定位方法性能远高于传统的Selective Search。在召回率为80%时排序后降低窗口数量5倍以上。提出了深度数据关联模型对基于RGB-D 的目标观测进行多目标跟踪;提出了基于深度结构的遮挡问题处理方法。研究成果发表在知名期刊IEEE Transactions on Intelligent Transportation Systems, 2015. 在本基金资助下共发表学术论文20篇,其中在高影响力的SCI国际期刊(IEEE Transactions)发表论文4篇,其他SCI论文2篇,EI论文12篇,在目标检测领域产生了一定的学术影响。相关的学术成果整理出版专著一本(视觉目标检测与跟踪:科学出版社)。培养青年研究骨干1名,博士生研究生5名,硕士生7名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

叶齐祥的其他基金

批准号:60872143
批准年份:2008
资助金额:29.00
项目类别:面上项目
批准号:61671427
批准年份:2016
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

多视图人体姿态可信估计方法及应用

批准号:61872317
批准年份:2018
负责人:刘新国
学科分类:F0209
资助金额:65.00
项目类别:面上项目
2

基于多视角深度特征融合的遥感视频运动目标检测跟踪

批准号:61902298
批准年份:2019
负责人:陈璞花
学科分类:F0210
资助金额:29.00
项目类别:青年科学基金项目
3

基于多视角与多示例学习的目标跟踪方法研究

批准号:61672183
批准年份:2016
负责人:何震宇
学科分类:F0210
资助金额:63.00
项目类别:面上项目
4

基于多视角和多模态潜在关联挖掘的人体动作识别算法研究

批准号:61572357
批准年份:2015
负责人:高赞
学科分类:F0210
资助金额:64.00
项目类别:面上项目