In the 12th Five Year National Plan for the elderly, the psychological health of the aged people is placed in prominent place. To replace psychologists, the key technology is emotion recognition of the elderly. Our subject analyze the mental state of the elderly by the speech emotion recognition.However,duiring the practical application, the speaker of the speech source, which is used for the recognition of the elderly speech emotion, is unkown and the recoding environment as well as the training samples are different. Sometimes, there are also differences between languages. What's more, some old people speak with tongues. These differences will bring adverse effect to the process of actual emotion recognition. This subject aims at researching the emotion recognition based on the robustness of multi-factor variabilable speech source and proposes a series of key technologies: (1)(2)(3) provide technical support for the development and productization of helpage robots that give spiritual comfort to the elderly.Hence, this subject has great significance for ensuring physical and spiritual health of the elderly as well as for the construction of a harmonious society.The main content of this project are:.(1)The elderly speech emotion feature extration in the robustness of multi-factor variabilable speech source based on local compensation strategy..(2)The elderly speech emotion recognition classifier in the robustness of multi-factor variabilable speech source based on global compensation strategy..(3)The elderly complex speech emotion recognition in the robustness of multi-factor variabilable speech source based on the combination of local and global compensation and fuzzy membership degree.
国家“十二五”老年人规划中,将老年人的心理健康摆在突出位置,为了能使机器人代替心理医生的作用,让机器人正确分析老年人的精神状态为其中的核心技术。本课题通过老年人语音情感识别来分析老年人精神状态,在实际应用过程中,用于老年人情感识别的声源中说话人是未知的,录音环境是不同的,年龄和词汇有差异,甚至有老年人说话带有方言,这些因素的变化性给语音情感识别带来不利影响。本课题旨在研究居家老年人声源中多因素变化性鲁棒的情感识别,拟给出一系列关键技术:(1)(2)(3)为具有精神抚慰功能的助老机器人的研发及产品化提供技术支撑。项目研究对保障老年人身心健康,构建和谐社会具有重要意义。本项目主要内容:(1)基于局部补偿策略的声源变化性鲁棒的老年人语音情感特征提取;(2)基于全局补偿策略的声源变化性鲁棒的老年人语音情感分类器构建;(3)基于局部与全局综合补偿及模糊隶属度的声源变化性鲁棒的老年人语音复合情感识别。
情感识别是情感智能的基础与必要前提,具有重要的理论研究意义和广阔的市场前景。作为一种高效的人机交互途径,语音信号蕴含着丰富的说话人情感信息,语音情感识别这项交叉学科研究课题正得到越来越广泛的关注与重视,也是让机器人正确分析老年人的精神状态的核心技术。用于老年人情感识别的声源中总是伴随着各种环境噪声等的干扰,这些因素的变化性给语音情感识别带来不利影响。提取并选择出有效表征情感并且具有高的噪声鲁棒性的语音情感特征以及构建噪声鲁棒性的语音情感分类器,是本项目的重点研究内容。.针对噪声语音情感识别问题,在最优小波包基的构建的基础上,利用短时帧分析与长时帧分析相结合的方法,本项目提取了一种噪声鲁棒的小波包倒谱系数。然后引入了对加性噪声具有较好鲁棒性的子带频谱质心参数,提出了一种频谱质心加权的小波包倒谱系数特征的噪声鲁棒性的算法。.基于语音片段轨迹模型,提出了一种用于计算语音特征携带情感信息的量化准则函数,从而对高维的噪声鲁棒性的频谱质心加权的小波包倒谱系数特征进行特征选择。.针对语音情感识别中的测试样本中普遍存在的噪声问题,通过计算重要性权重,对支持向量机分类器等效优化问题中的松弛变量进行加权,提出了一种噪声鲁棒的支持向量机分类器。并通过不同信噪比水平下的语音情感识别实验,对本项目中提取的噪声鲁棒的子频带质心加权的语音情感特征的噪声情况下语音情感识别能力进行分析评估, 相比于传统的语音情感特征以及传统的支持向量机,改进后的情感识别方法具有更好的噪声鲁棒性以及识别性能。.提出了一种基于DBN网络的特征融合算法,将传统的声学特征和音律特征与谱特征WPCC以及W-WPCC融合,通过对比实验对基于DBN网络的特征融合算法提取的特征在噪声情况下的语音情感识别能力进行分析评估。不同信噪比水平下的语音情感识别实验结果表明,相比于原始的小波包倒谱系数特征,改进后的特征具有更好的噪声鲁棒性。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
复杂噪声混响环境下分布式鲁棒声源跟踪方法研究
广义时变系统的鲁棒性分析与控制
说话人识别中时变鲁棒的声纹特征研究
多模式摄动控制系统的鲁棒性分析