基于知识与数据混合驱动概率图模型的多模态情感识别

基本信息
批准号:61402129
项目类别:青年科学基金项目
资助金额:25.00
负责人:李永强
学科分类:
依托单位:哈尔滨工业大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:赵永平,柴鑫,韩玉兰,杨恒,仝少敏,张永强
关键词:
先验知识概率图模型情感识别机器学习
结项摘要

The core issue for Human Computer Interaction (HCI) is to enable the computer to recognize, understand and express emotions, the basis of which is emotion recognition. Emotion is a kind of subjective experience, which always happens with some external changes, such as changes of facial expressions, changes of tone, rhythm, speech etc. This research will study the Probabilistic Graphical Model (PGM), based on which to fuse the information from visual and audio channels under the multilevel message passing mechanisms of human brain. The proposed method will exploit and model the prior distributions of facial activities in order to recognize facial action units (AUs), and afterwards human emotions. Domain prior knowledge is incorporated into the inference process to help reason and make decision. We will develop effective multimodal information fusion mechanism, which accounts the interactions between visual an audio channels. To handle the observation uncertainty problem, we will build a prior model to model the prior distribution and dynamics of facial actions, in which the information flow is two-way, not only bottom-up, but also top-down. Generalized prior knowledge extraction method will be investigated, which can handle various forms of prior knowledge. We will develop hybrid knowledge and data driven learning method to improve the robustness and generalization ability of the model. The successful implementation of this research will enriches the theory of pattern recognition and machine learning, and provides a new solution for multimodal emotion recognition.

人机交互核心问题是赋予计算机感知、理解以及表达情感的能力,其基础是情感识别。情感是一种内在的主观体验,但总是伴随着某些外部表现,如面部表情的变化,言语的声调、节奏和速度的变化等。本课题以概率图模型(PGM)为研究对象,模拟人脑神经元多层深度传递机理,有效地融合多模态信息,并挖掘、表示人面部动作先验分布,运用已有的先验知识来加强推理和判断,实现鲁棒地识别人面部肌肉动作单元(AU),继而识别、理解人情感状态。其中拟解决的关键问题包括:建立有效的多模态信息融合机制,解释音频信息与视频信息本质相关性;建模人面部动作先验分布及动态特性,使信息流双向流动,处理观测值不确定性问题;探求推广性强的知识抽象策略和表示方法,使其可以适用于不同类型不同形式的先验知识;发展知识与数据共同驱动模型训练算法,提高模型的鲁棒性和泛化性能。本研究的成功实施将丰富模式识别与机器学习理论,并为多模态情感识别提供新的解决途径。

项目摘要

本项目按照研究计划研究了基于多模态信息融合的情感识别方法、人面部动作先验分布及动态特性建模方法、以及先验知识嵌入模型训练过程方法。针对基于多模态信息融合的情感识别,本课题研究了基于语音和图像的情感识别,针对语音信号,提取了包含短时能量、基音频率、语音持续时间、前三共振峰、MFCC系数等相关统计学参数,共92维语音特征,对于图像信息,本课题分别提取语音段峰值图像的 LBP 特征以及序列图像脸部特征点的均值和标准差,在此基础上,考察了多种特征融合方法并在SAVEE数据库上测试,结果表明融合语音和图像的情感识别方法优于单一模态情感识别方法,相关成果发表PCM会议论文1篇。针对人面部动作先验分布及动态特性建模方法,本课题研究了基于动态贝叶斯网络(DBN)的AU强度识别方法,通过DBN建模AU之间的共生关系及互斥关系,以及AU强度单调变化等动态关系,显著提高了AU强度观测值准确率,相关成果发表Pattern Recognition期刊论文1篇。针对嵌入先验知识的模型训练方法,本课题研究了结构化输出标签中标签相关性嵌入模型训练过程的方法,提出了基于多标签学习的AU识别模型,将AU相关性嵌入模型训练过程,进一步提高了系统性能,相关成果发表Pattern Recognition期刊论文1篇。项目执行过程中,培养硕士研究生2名,均已毕业,博士研究生3名,目前在读。项目投入经费25万元,支出20.063万元,各项支出基本与调整后预算相符。剩余经费4.937万元,剩余经费计划用于本项目研究后续支出。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018

李永强的其他基金

批准号:41001304
批准年份:2010
资助金额:18.00
项目类别:青年科学基金项目
批准号:31201517
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:31401711
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目
批准号:31360378
批准年份:2013
资助金额:45.00
项目类别:地区科学基金项目
批准号:71372208
批准年份:2013
资助金额:58.00
项目类别:面上项目
批准号:51403189
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:31500802
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:51408566
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:31560428
批准年份:2015
资助金额:38.00
项目类别:地区科学基金项目
批准号:71072170
批准年份:2010
资助金额:28.00
项目类别:面上项目
批准号:61772517
批准年份:2017
资助金额:58.00
项目类别:面上项目
批准号:61703369
批准年份:2017
资助金额:24.00
项目类别:青年科学基金项目
批准号:11772090
批准年份:2017
资助金额:56.00
项目类别:面上项目
批准号:21772104
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:11304386
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:11774428
批准年份:2017
资助金额:69.00
项目类别:面上项目
批准号:21102077
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:61303255
批准年份:2013
资助金额:24.00
项目类别:青年科学基金项目

相似国自然基金

1

知识与数据混合驱动的概率图模型研究及在行为分析中的应用

批准号:61202325
批准年份:2012
负责人:张一帆
学科分类:F0210
资助金额:24.00
项目类别:青年科学基金项目
2

基于多模态情感识别技术的情感学习模型研究

批准号:60873132
批准年份:2008
负责人:申丽萍
学科分类:F0213
资助金额:20.00
项目类别:面上项目
3

基于概率图模型的复杂行为识别

批准号:61572500
批准年份:2015
负责人:张一帆
学科分类:F0210
资助金额:66.00
项目类别:面上项目
4

视觉注意机制下基于深度概率图模型的情感计算

批准号:61401265
批准年份:2014
负责人:肖冰
学科分类:F0113
资助金额:24.00
项目类别:青年科学基金项目