鲁棒的非特定环境声学事件检测关键技术研究

基本信息
批准号:61071181
项目类别:面上项目
资助金额:32.00
负责人:韩纪庆
学科分类:
依托单位:哈尔滨工业大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:邓世文,吕学琴,游大涛,马翼平,张茹,孟昕,王敏
关键词:
智能信息处理特征提取非特定环境鲁棒性声音感知
结项摘要

智能化人性化的人机交互是近年来学术界的研究热点之一。为实现此目标,迫切需要开展机器自动感知周边环境的研究,其中一个主要方面就是环境声音感知的研究。鉴于声音的种类可粗分为语音和非语音,而以语音识别为代表的语音感知研究已较为丰富。因此,本项目重点开展非语音感知,即声学事件检测的研究,以便为智能系统提供更多的环境信息。声学事件检测是一个极具潜力的研究课题,还有许多问题需要解决。考虑到目前已有的检测方法过多依赖于特定环境,因此,本项目的目标是研究与环境无关,即非特定环境的声学事件检测方法。拟解决如下关键问题:适合于声学事件检测的鲁棒特征的选择与提取、非特定环境声学事件的检测方法、与声学事件检测相适应的声音感知系统框架和评价方法。声学事件检测可广泛用于鲁棒语音识别及音频信息检索技术的前端,以及未来智能教室、智能医院等环境中声音信息的智能分析与处理。开展此方面的研究具有重要的理论意义和实用价值。

项目摘要

智能化人性化的人机交互是近年来学术界的研究热点之一。为实现此目标,迫切需要开展机器自动感知周边环境的研究,其中一个主要方面就是环境声音感知的研究。因此,本项目重点开展非语音感知,即声学事件检测的研究,以便为智能系统提供更多的环境信息。声学事件检测是一个极具潜力的研究课题,还有许多问题需要解决。考虑到目前已有的检测方法过多依赖于特定环境,因此,本项目的目标是研究与环境无关,即非特定环境的声学事件检测方法。.在本项目的实施过程中,不仅解决了申请中所提出的关键问题,而且还在具体研究过程中还扩展了相关的研究。在鲁棒特征提取方面:针对具有显著周期性的短时声学事件,提出了基于复指数字典稀疏分解的特征提取方法;针对周期性不显著的短时声学事件,提出了基于学习字典的特征提取方法;针对长时声学事件,提出了基于矩阵低秩约束的特征提取方法。研究表明这些方法都大大提高了不同特性的声学事件特征的鲁棒性。在检测方法方面:针对具有稳定统计分布的短时声学事件,提出了基于HMM修正MAP准则的帧检测方法;针对不具有稳定统计分布的短时声学事件,提出了基于核方法与Chernoff不等式的检测方法;针对具有稳定统计分布的长时声学事件,提出了基于异质混合模型的检测方法;针对不具有稳定统计分布的长时声学事件,提出了基于符号似然比多观测值检测方法;研究表明这些方法都大大提高了检测器的性能。.在本课题执行过程中已发表和录用论文19篇,其中国际刊物论文11篇,国际会议论文8篇。刊物论文被SCI收录9篇,其中包括本领域重要期刊:IEEE Transactions on Audio Speech and Language Processing上发表2篇,IEEE Signal Processing Letters发表1篇,IET Signal Processing发表1篇。EI收录9篇,其中包括本领域的重要会议:ICASSP 4篇,INTERSPEECH 2篇,ICONIP 1篇。同时,申请发明专利3项。研究成果超出了计划合同任务中的指标。上述成果也构成了《音频信息检索理论与技术》一书中的组成部分之一,该书已于2011年3月由科学出版社出版。此外,研究的部分内容也补充进了《语音信号处理(第二版)》,该书已于2013年4月由清华大学出版社出版。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
5

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019

韩纪庆的其他基金

批准号:60085001
批准年份:2000
资助金额:14.00
项目类别:专项基金项目
批准号:U1736210
批准年份:2017
资助金额:256.00
项目类别:联合基金项目
批准号:61471145
批准年份:2014
资助金额:86.00
项目类别:面上项目
批准号:60672163
批准年份:2006
资助金额:28.00
项目类别:联合基金项目
批准号:91120303
批准年份:2011
资助金额:270.00
项目类别:重大研究计划
批准号:60575030
批准年份:2005
资助金额:22.00
项目类别:面上项目
批准号:60173044
批准年份:2001
资助金额:18.00
项目类别:面上项目

相似国自然基金

1

兼具鲁棒性和抗检测性的图像隐写关键技术研究

批准号:61802145
批准年份:2018
负责人:冯丙文
学科分类:F0206
资助金额:23.00
项目类别:青年科学基金项目
2

复杂声学环境下声学事件检测与音频场景识别方法研究

批准号:U1736210
批准年份:2017
负责人:韩纪庆
学科分类:F0111
资助金额:256.00
项目类别:联合基金项目
3

面向网络对抗的鲁棒性入侵检测技术研究

批准号:61070198
批准年份:2010
负责人:蔡志平
学科分类:F0205
资助金额:33.00
项目类别:面上项目
4

基于声学模型的鲁棒性声场重建与控制技术

批准号:11504405
批准年份:2015
负责人:武帅兵
学科分类:A2305
资助金额:19.00
项目类别:青年科学基金项目