基于多目视觉的形体语言感知与识别研究

基本信息
批准号:61172128
项目类别:面上项目
资助金额:60.00
负责人:阮秋琦
学科分类:
依托单位:北京交通大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:安高云,金一,王雪峤,郭松,刘帅,支瑞聪,万军,李妍
关键词:
无重叠配置多目视觉形体语言人机交互
结项摘要

本项目将围绕人机交互中形体语言感知与识别的核心内容展开研究。其中包括: 1)基于多目视觉的形体语言感知机理研究:从感知形体语言的表象入手,探讨多摄像机感知的模型、多摄像机无重叠配置的基本机理,主要解决①感知形体语言的机理与形体语言的表示问题;②形体语言加工与特征提取问题。2)建立多目视觉智能感知协同计算模型的理论,尝试以多目视觉系统解决形体语言感知的遮挡、盲区等问题,同时解决多目视觉带来的匹配等难点问题;3)深入研究多目视觉感知全局表观特征标注方法,解决识别的准确率及识别速度问题;4)适境计算理论及技术研究:建立一个"适境计算"的理论框架以及基于"适境计算"的信息融合算法,以解决形体语言视觉感知及识别的鲁棒性问题;.5)实现一个形体语言的感知与识别综合实验平台,以展示形体语言的语义表达及识别效果,同时建立一个基于形体语言感知与识别的人机交互实验系统。

项目摘要

本项目将围绕人机交互中形体语言感知与识别的核心内容展开研究。其中包括: .1)基于多目视觉的形体语言感知机理研究:从感知形体语言的表象入手,探讨多摄像机感知的模型、多摄像机无重叠配置的基本原理与方法,主要解决①感知形体语言的机理与形体语言的表示问题;②形体语言加工与特征提取问题。.2)建立多目视觉智能感知协同计算模型的理论,尝试以多目视觉系统解决形体语言感知的遮挡、盲区等问题,同时解决多目视觉带来的匹配难点问题;.3)研究多目视觉感知全局表观特征标注方法,解决识别的准确率及识别速度问题;.4)建立一个"适境计算"的理论框架以及基于"适境计算"的信息融合算法,以解决形体语言视觉感知及识别的鲁棒性问题;.5)实现一个形体语言的感知与识别综合实验平台,以展示形体语言的语义表达及识别效果,同时建立一个基于形体语言感知与识别的人机交互实验系统。 . 本项目研究取得了如下一些成果:.1)提出了一种基于RGB-D的一次学习手势识别方法。其中包括,同步正交匹配追踪(SOMP)算法;三维增强运动尺度不变特征转换(3D EMoSIFT);三维稀疏运动尺度不变特征转换(3D SMoSIFT)算法;字典优化的特定类互信息最大化(CSMMI)算法等;不仅提高了识别率,而且识别速度也有较大的提高;.2)提出了一种基于弯曲不变量的三维人脸表面描述子及鲁棒的区域稀疏回归模型,该方法具有良好的三维数据表达能力,在三维人脸识别中显示出了优越的性能。.3)提出了正交张量邻域保持嵌入算法(OTNPE)和正交张量边界费舍尔分析算法(OTMFA),从而改善了人脸表情的表征和识别效果;提出了张量秩一差分图保持分析算法(TR1DGPA),该算法对于表观人脸表情的识别更加有效;.4)提出了一种基于异质人脸数据的对偶可鉴别特征学习方法。该方法可提高异质人脸识别准确率。.5)提出了一种基于Agent的多摄像机无重叠视野域的目标跟踪方法。利用智能Agent代理摄像机,解决了多目视觉系统协同合作的关键难点。.本项目经过4年的研究取得的成果还包括:.1) 发表论文 70余篇,其中包括多篇发表在IEEE Trans 和PR等高水平杂志上;.2) 申请发明专利2项,授权一项;.3) 获奖3项;.4) 培养博士生16名,毕业5名,毕业硕士生19名。.5) 主办国际会议4次,参加国际学术交流20余人次。.该已圆满完成了预定的任务。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

多空间交互协同过滤推荐

多空间交互协同过滤推荐

DOI:10.11896/jsjkx.201100031
发表时间:2021
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

阮秋琦的其他基金

批准号:61471032
批准年份:2014
资助金额:90.00
项目类别:面上项目
批准号:60973060
批准年份:2009
资助金额:30.00
项目类别:面上项目
批准号:60672062
批准年份:2006
资助金额:28.00
项目类别:面上项目
批准号:69572002
批准年份:1995
资助金额:9.00
项目类别:面上项目
批准号:60472033
批准年份:2004
资助金额:26.00
项目类别:面上项目

相似国自然基金

1

基于计算机视觉的鞘翅目储粮害虫检测与分类识别研究

批准号:30871449
批准年份:2008
负责人:毛罕平
学科分类:C1302
资助金额:31.00
项目类别:面上项目
2

基于视觉感知机理的林火视频识别模型研究

批准号:31200496
批准年份:2012
负责人:赵亚琴
学科分类:C1609
资助金额:22.00
项目类别:青年科学基金项目
3

基于人类感知机理的智能指势视觉识别研究

批准号:60872117
批准年份:2008
负责人:管业鹏
学科分类:F0116
资助金额:30.00
项目类别:面上项目
4

基于视觉感知的多视点视频编码研究

批准号:60972137
批准年份:2009
负责人:王永芳
学科分类:F0116
资助金额:33.00
项目类别:面上项目