稀疏化、结构化和判别性约束的多视角行为识别方法研究

基本信息
批准号:61202168
项目类别:青年科学基金项目
资助金额:24.00
负责人:高赞
学科分类:
依托单位:天津理工大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:张桦,刘安安,董晨,聂为之,徐俊瑜,沈丁成,侯建元,申晓霞,鞠玉翠
关键词:
稀疏表示词典学习行为识别多视角
结项摘要

Automated multi-view human behavior recognition is essential for intelligent surveillance, human-machine interface, digital entertainment and etc. In this proposal, we propose the multi-view human behavior recognition method induced by sparsity, structuring and discrimination constraints. The proposed method consists of three steps, object detection and tracking, visual feature extraction, and multi-view behavior modeling. Our research will focus on the third step. Specifically, it includes four main problems: 1) Problem Formulation: designing the objective function for this task by discovering the constraints for multi-view requirement and formulating the corresponding regularization terms; 2) Dictionary Learning: learning the dictionary with multi-view information based on collective representation and Fisher Discriminant Criterion; 3) Redundancy Elimination: reducing the redundant bases in the learned dictionary with Maximum Entropy Criterion; 4) Model Inference: predicting the optimal parameters based on coordinate decent method. This research will promote the system construction for multi-view human behavior recognition. Moreover, it will not only benefit the research of computer vision and pattern recognition but also provide the feasible and novel techniques for multiple applications.

自动地多视角人体行为识别已成为智能监控、人机交互和数字娱乐等领域亟待解决的问题。为了实现多视角环境下人体行为的准确识别,拟提出稀疏化、结构化和判别性约束的多视角人体行为建模方法。该方法包括目标检测和跟踪,特征提取和多视角行为建模三部分,本课题将侧重解决多约束的多视角行为建模问题,其主要内容包括四个方面:首先,模型构建:拟通过多视角问题下多约束条件的挖掘和相应正则项的制定来构建多视角行为识别目标函数;其次,词典学习:拟基于协同表示和Fisher准则实现多视角联合词典学习;再次,针对多视角信息存在较强相关性,拟基于最大熵准则实现多视角联合词典冗余信息去除;最后,模型推断:拟基于坐标下降法实现多参数模型联合最优推断。本课题研究有利于多视角人体行为识别系统构建,相关研究成果对计算机视觉和模式识别研究领域新问题和新方法的探索具有重要意义,并为相关工业界新应用的发展提供可行和创新性技术基础。

项目摘要

自动地多视角人体行为识别已成为智能监控、人机交互和数字娱乐等领域亟待解决的问题。为了实现多视角环境下人体行为的准确识别,本项目提出了稀疏化、结构化和判别性约束的多视角人体行为建模方法。. 本项目研究重点之一如何构建多约束下的多视角行为识别模型问题。首先,通过不同的多视角动作数据集,探究多视角动作潜在的关联特性,制定反应它们潜在关联的正则项,此外,在限定重建系数稀疏性的同时,还使得同类基赋予较接近的权重,来增强类内的一致性和类间的差异性,从而构建多视角行为识别模型;其次,在词典学习过程中首先将所有视角下各目标动作特征构建共同的初始联合词典,然后,在多视角联合词典的学习过程中,引入Fisher准则来构建正则项,使得同类样本重建系数差异最小化和不同类样本重建系数差异最大化;再次,根据高斯过程,计算多视角联合词典的熵,并基于最大熵准则实现多视角联合词典冗余信息去除。. 另一个研究重点是对构建的多参数模型如何求解以及如何构建识别模型问题。首先,研究了坐标下降法和交叉迭代方法,从而将多个变量的联合空间求解最优化的NP难问题转化为单变量的凸优化问题;其次,在识别模型中,将最优重建系数与词典训练过程中各类动作的稀疏系数平均值的差异融入到模型中。. 此外,还研究了一些与上述研究相关的基础或扩展问题,如多目标跟踪、多模态特征融合和跨越学习等问题。 . 研究小组按计划完成了规定的研究内容,达到了预期目标。. 本课题研究有利于多视角人体行为识别系统构建,相关研究成果对计算机视觉和模式识别研究领域新问题和新方法的探索具有重要意义,并为相关工业界新应用的发展提供可行和创新性技术基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022

高赞的其他基金

相似国自然基金

1

结构化过完备稀疏性约束的超分辨率图像重建研究

批准号:61162022
批准年份:2011
负责人:邓承志
学科分类:F0116
资助金额:48.00
项目类别:地区科学基金项目
2

多源数据判别特征学习的结构化自编码方法

批准号:61906046
批准年份:2019
负责人:徐晓琳
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目
3

基于多视角融合的欺诈行为识别方法与应用研究

批准号:71701007
批准年份:2017
负责人:刘冠男
学科分类:G0112
资助金额:19.00
项目类别:青年科学基金项目
4

流形空间的深度学习模型及多视角人体行为识别方法研究

批准号:61772048
批准年份:2017
负责人:孙艳丰
学科分类:F0210
资助金额:63.00
项目类别:面上项目