智能化人性化的人机交互是近年来学术界的研究热点之一。为实现此目标,迫切需要开展机器自动感知周边环境的研究,其中一个主要方面就是环境声音感知的研究。鉴于声音的种类可粗分为语音和非语音,而以语音识别为代表的语音感知研究已较为丰富。因此,本项目重点开展非语音感知,即声学事件检测的研究,以便为智能系统提供更多的环境信息。声学事件检测是一个极具潜力的研究课题,还有许多问题需要解决。考虑到目前已有的检测方法过多依赖于特定环境,因此,本项目的目标是研究与环境无关,即非特定环境的声学事件检测方法。拟解决如下关键问题:适合于声学事件检测的鲁棒特征的选择与提取、非特定环境声学事件的检测方法、与声学事件检测相适应的声音感知系统框架和评价方法。声学事件检测可广泛用于鲁棒语音识别及音频信息检索技术的前端,以及未来智能教室、智能医院等环境中声音信息的智能分析与处理。开展此方面的研究具有重要的理论意义和实用价值。
智能化人性化的人机交互是近年来学术界的研究热点之一。为实现此目标,迫切需要开展机器自动感知周边环境的研究,其中一个主要方面就是环境声音感知的研究。因此,本项目重点开展非语音感知,即声学事件检测的研究,以便为智能系统提供更多的环境信息。声学事件检测是一个极具潜力的研究课题,还有许多问题需要解决。考虑到目前已有的检测方法过多依赖于特定环境,因此,本项目的目标是研究与环境无关,即非特定环境的声学事件检测方法。.在本项目的实施过程中,不仅解决了申请中所提出的关键问题,而且还在具体研究过程中还扩展了相关的研究。在鲁棒特征提取方面:针对具有显著周期性的短时声学事件,提出了基于复指数字典稀疏分解的特征提取方法;针对周期性不显著的短时声学事件,提出了基于学习字典的特征提取方法;针对长时声学事件,提出了基于矩阵低秩约束的特征提取方法。研究表明这些方法都大大提高了不同特性的声学事件特征的鲁棒性。在检测方法方面:针对具有稳定统计分布的短时声学事件,提出了基于HMM修正MAP准则的帧检测方法;针对不具有稳定统计分布的短时声学事件,提出了基于核方法与Chernoff不等式的检测方法;针对具有稳定统计分布的长时声学事件,提出了基于异质混合模型的检测方法;针对不具有稳定统计分布的长时声学事件,提出了基于符号似然比多观测值检测方法;研究表明这些方法都大大提高了检测器的性能。.在本课题执行过程中已发表和录用论文19篇,其中国际刊物论文11篇,国际会议论文8篇。刊物论文被SCI收录9篇,其中包括本领域重要期刊:IEEE Transactions on Audio Speech and Language Processing上发表2篇,IEEE Signal Processing Letters发表1篇,IET Signal Processing发表1篇。EI收录9篇,其中包括本领域的重要会议:ICASSP 4篇,INTERSPEECH 2篇,ICONIP 1篇。同时,申请发明专利3项。研究成果超出了计划合同任务中的指标。上述成果也构成了《音频信息检索理论与技术》一书中的组成部分之一,该书已于2011年3月由科学出版社出版。此外,研究的部分内容也补充进了《语音信号处理(第二版)》,该书已于2013年4月由清华大学出版社出版。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
低轨卫星通信信道分配策略
兼具鲁棒性和抗检测性的图像隐写关键技术研究
复杂声学环境下声学事件检测与音频场景识别方法研究
面向网络对抗的鲁棒性入侵检测技术研究
基于声学模型的鲁棒性声场重建与控制技术