基于知识与数据混合驱动概率图模型的多模态情感识别

基本信息

批准号：61402129

项目类别：青年科学基金项目

资助金额：25.00

负责人：李永强

学科分类：

依托单位：哈尔滨工业大学

批准年份：2014

结题年份：2017

起止时间：2015-01-01 - 2017-12-31

项目状态：已结题

项目参与者：赵永平,柴鑫,韩玉兰,杨恒,仝少敏,张永强

关键词：

先验知识概率图模型情感识别机器学习

结项摘要

The core issue for Human Computer Interaction (HCI) is to enable the computer to recognize, understand and express emotions, the basis of which is emotion recognition. Emotion is a kind of subjective experience, which always happens with some external changes, such as changes of facial expressions, changes of tone, rhythm, speech etc. This research will study the Probabilistic Graphical Model (PGM), based on which to fuse the information from visual and audio channels under the multilevel message passing mechanisms of human brain. The proposed method will exploit and model the prior distributions of facial activities in order to recognize facial action units (AUs), and afterwards human emotions. Domain prior knowledge is incorporated into the inference process to help reason and make decision. We will develop effective multimodal information fusion mechanism, which accounts the interactions between visual an audio channels. To handle the observation uncertainty problem, we will build a prior model to model the prior distribution and dynamics of facial actions, in which the information flow is two-way, not only bottom-up, but also top-down. Generalized prior knowledge extraction method will be investigated, which can handle various forms of prior knowledge. We will develop hybrid knowledge and data driven learning method to improve the robustness and generalization ability of the model. The successful implementation of this research will enriches the theory of pattern recognition and machine learning, and provides a new solution for multimodal emotion recognition.

人机交互核心问题是赋予计算机感知、理解以及表达情感的能力，其基础是情感识别。情感是一种内在的主观体验，但总是伴随着某些外部表现，如面部表情的变化，言语的声调、节奏和速度的变化等。本课题以概率图模型（PGM）为研究对象，模拟人脑神经元多层深度传递机理，有效地融合多模态信息，并挖掘、表示人面部动作先验分布，运用已有的先验知识来加强推理和判断，实现鲁棒地识别人面部肌肉动作单元（AU），继而识别、理解人情感状态。其中拟解决的关键问题包括：建立有效的多模态信息融合机制，解释音频信息与视频信息本质相关性；建模人面部动作先验分布及动态特性，使信息流双向流动，处理观测值不确定性问题；探求推广性强的知识抽象策略和表示方法，使其可以适用于不同类型不同形式的先验知识；发展知识与数据共同驱动模型训练算法，提高模型的鲁棒性和泛化性能。本研究的成功实施将丰富模式识别与机器学习理论，并为多模态情感识别提供新的解决途径。

项目摘要

本项目按照研究计划研究了基于多模态信息融合的情感识别方法、人面部动作先验分布及动态特性建模方法、以及先验知识嵌入模型训练过程方法。针对基于多模态信息融合的情感识别，本课题研究了基于语音和图像的情感识别，针对语音信号，提取了包含短时能量、基音频率、语音持续时间、前三共振峰、MFCC系数等相关统计学参数，共92维语音特征，对于图像信息，本课题分别提取语音段峰值图像的 LBP 特征以及序列图像脸部特征点的均值和标准差，在此基础上，考察了多种特征融合方法并在SAVEE数据库上测试，结果表明融合语音和图像的情感识别方法优于单一模态情感识别方法，相关成果发表PCM会议论文1篇。针对人面部动作先验分布及动态特性建模方法，本课题研究了基于动态贝叶斯网络（DBN）的AU强度识别方法，通过DBN建模AU之间的共生关系及互斥关系，以及AU强度单调变化等动态关系，显著提高了AU强度观测值准确率，相关成果发表Pattern Recognition期刊论文1篇。针对嵌入先验知识的模型训练方法，本课题研究了结构化输出标签中标签相关性嵌入模型训练过程的方法，提出了基于多标签学习的AU识别模型，将AU相关性嵌入模型训练过程，进一步提高了系统性能，相关成果发表Pattern Recognition期刊论文1篇。项目执行过程中，培养硕士研究生2名，均已毕业，博士研究生3名，目前在读。项目投入经费25万元，支出20.063万元，各项支出基本与调整后预算相符。剩余经费4.937万元，剩余经费计划用于本项目研究后续支出。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2020

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.16383/j.aas.c180673

发表时间：2021

李永强的其他基金

批准号：41001304

批准年份：2010

资助金额：18.00

项目类别：青年科学基金项目

批准号：31201517

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：31401711

批准年份：2014

资助金额：26.00

项目类别：青年科学基金项目

批准号：31360378

批准年份：2013

资助金额：45.00

项目类别：地区科学基金项目

批准号：71372208

批准年份：2013

资助金额：58.00

项目类别：面上项目

批准号：51403189

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：31500802

批准年份：2015

资助金额：21.00

项目类别：青年科学基金项目

批准号：51408566

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：31560428

批准年份：2015

资助金额：38.00

项目类别：地区科学基金项目

批准号：71072170

批准年份：2010

资助金额：28.00

项目类别：面上项目

批准号：61772517

批准年份：2017

资助金额：58.00

项目类别：面上项目

批准号：61703369

批准年份：2017

资助金额：24.00

项目类别：青年科学基金项目

批准号：11772090

批准年份：2017

资助金额：56.00

项目类别：面上项目

批准号：21772104

批准年份：2017

资助金额：64.00

项目类别：面上项目

批准号：11304386

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：11774428

批准年份：2017

资助金额：69.00

项目类别：面上项目

批准号：21102077

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：61303255

批准年份：2013

资助金额：24.00

项目类别：青年科学基金项目

相似国自然基金

知识与数据混合驱动的概率图模型研究及在行为分析中的应用

批准号：61202325

批准年份：2012

负责人：张一帆

学科分类：F0210

资助金额：24.00

项目类别：青年科学基金项目

基于多模态情感识别技术的情感学习模型研究

批准号：60873132

批准年份：2008

负责人：申丽萍

学科分类：F0213

资助金额：20.00

项目类别：面上项目

基于概率图模型的复杂行为识别

批准号：61572500

批准年份：2015

负责人：张一帆

学科分类：F0210

资助金额：66.00

项目类别：面上项目

视觉注意机制下基于深度概率图模型的情感计算

批准号：61401265

批准年份：2014

负责人：肖冰

学科分类：F0113

资助金额：24.00

项目类别：青年科学基金项目

基于知识与数据混合驱动概率图模型的多模态情感识别

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于多色集合理论的医院异常工作流处理建模

基于改进LinkNet的寒旱区遥感图像河流识别方法

新型树启发式搜索算法的机器人路径规划

二维FM系统的同时故障检测与控制

李永强的其他基金

基于车载LIDAR数据的建筑物灾情应急测量关键技术研究

棉铃虫羧酸酯酶CarE001C定向进化及突变酶的结构与功能研究

红小豆中与菜豆普通花叶病毒抗性相关基因的分离鉴定

青稞膳食纤维对多酚生物利用的作用机制

自我监控人格对销售绩效的动态影响：社会网络的视角

等离子体诱导接枝聚合制备超疏水纺织品及其机制研究

基于纳米线阵列芯片温控富集和纳米金比色法的高灵敏度病原细菌快速检测

浅表砂层地震液化大变形物理机制与弹塑性本构研究

青稞多酚化合物代谢指纹图谱的构建及其生物转化途径

社会网络对销售绩效的动态影响研究

对称密码算法关键部件的设计问题研究

Q-学习最优控制的稳定性、收敛性与最优性研究

深部岩石爆破的气–固耦合断裂建模与机制研究

棉籽中抗植物病毒活性先导化合物的发现和结构优化及构效关系研究

光晶格中多组分超冷原子气体的量子相变及多体冷却技术的研究

基于主方程理论研究复杂原子系统X射线波段的吸收及其相干调控

基于磺酰脲受体与配体相互作用的新结构苯甲酰脲类昆虫生长调节剂的设计合成、构效关系及作用机制研究

密码意义的置换多项式的存在性及构造问题研究

相似国自然基金