鲁棒的非特定环境声学事件检测关键技术研究

基本信息

批准号：61071181

项目类别：面上项目

资助金额：32.00

负责人：韩纪庆

学科分类：

依托单位：哈尔滨工业大学

批准年份：2010

结题年份：2013

起止时间：2011-01-01 - 2013-12-31

项目状态：已结题

项目参与者：邓世文,吕学琴,游大涛,马翼平,张茹,孟昕,王敏

关键词：

智能信息处理特征提取非特定环境鲁棒性声音感知

结项摘要

智能化人性化的人机交互是近年来学术界的研究热点之一。为实现此目标，迫切需要开展机器自动感知周边环境的研究，其中一个主要方面就是环境声音感知的研究。鉴于声音的种类可粗分为语音和非语音，而以语音识别为代表的语音感知研究已较为丰富。因此，本项目重点开展非语音感知，即声学事件检测的研究，以便为智能系统提供更多的环境信息。声学事件检测是一个极具潜力的研究课题，还有许多问题需要解决。考虑到目前已有的检测方法过多依赖于特定环境，因此，本项目的目标是研究与环境无关，即非特定环境的声学事件检测方法。拟解决如下关键问题：适合于声学事件检测的鲁棒特征的选择与提取、非特定环境声学事件的检测方法、与声学事件检测相适应的声音感知系统框架和评价方法。声学事件检测可广泛用于鲁棒语音识别及音频信息检索技术的前端，以及未来智能教室、智能医院等环境中声音信息的智能分析与处理。开展此方面的研究具有重要的理论意义和实用价值。

项目摘要

智能化人性化的人机交互是近年来学术界的研究热点之一。为实现此目标，迫切需要开展机器自动感知周边环境的研究，其中一个主要方面就是环境声音感知的研究。因此，本项目重点开展非语音感知，即声学事件检测的研究，以便为智能系统提供更多的环境信息。声学事件检测是一个极具潜力的研究课题，还有许多问题需要解决。考虑到目前已有的检测方法过多依赖于特定环境，因此，本项目的目标是研究与环境无关，即非特定环境的声学事件检测方法。.在本项目的实施过程中，不仅解决了申请中所提出的关键问题，而且还在具体研究过程中还扩展了相关的研究。在鲁棒特征提取方面：针对具有显著周期性的短时声学事件，提出了基于复指数字典稀疏分解的特征提取方法；针对周期性不显著的短时声学事件，提出了基于学习字典的特征提取方法；针对长时声学事件，提出了基于矩阵低秩约束的特征提取方法。研究表明这些方法都大大提高了不同特性的声学事件特征的鲁棒性。在检测方法方面：针对具有稳定统计分布的短时声学事件，提出了基于HMM修正MAP准则的帧检测方法；针对不具有稳定统计分布的短时声学事件，提出了基于核方法与Chernoff不等式的检测方法；针对具有稳定统计分布的长时声学事件，提出了基于异质混合模型的检测方法；针对不具有稳定统计分布的长时声学事件，提出了基于符号似然比多观测值检测方法；研究表明这些方法都大大提高了检测器的性能。.在本课题执行过程中已发表和录用论文19篇，其中国际刊物论文11篇，国际会议论文8篇。刊物论文被SCI收录9篇，其中包括本领域重要期刊：IEEE Transactions on Audio Speech and Language Processing上发表2篇，IEEE Signal Processing Letters发表1篇，IET Signal Processing发表1篇。EI收录9篇，其中包括本领域的重要会议：ICASSP 4篇，INTERSPEECH 2篇，ICONIP 1篇。同时，申请发明专利3项。研究成果超出了计划合同任务中的指标。上述成果也构成了《音频信息检索理论与技术》一书中的组成部分之一，该书已于2011年3月由科学出版社出版。此外，研究的部分内容也补充进了《语音信号处理（第二版）》，该书已于2013年4月由清华大学出版社出版。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：2017

DOI：

发表时间：2016

DOI：10.11999/JEIT150995

发表时间：2016

DOI：10.12068/j.issn.1005-3026.2019.06.009

发表时间：2019

韩纪庆的其他基金

批准号：60085001

批准年份：2000

资助金额：14.00

项目类别：专项基金项目

批准号：U1736210

批准年份：2017

资助金额：256.00

项目类别：联合基金项目

批准号：61471145

批准年份：2014

资助金额：86.00

项目类别：面上项目

批准号：60672163

批准年份：2006

资助金额：28.00

项目类别：联合基金项目

批准号：91120303

批准年份：2011

资助金额：270.00

项目类别：重大研究计划

批准号：60575030

批准年份：2005

资助金额：22.00

项目类别：面上项目

批准号：60173044

批准年份：2001

资助金额：18.00

项目类别：面上项目

相似国自然基金

兼具鲁棒性和抗检测性的图像隐写关键技术研究

批准号：61802145

批准年份：2018

负责人：冯丙文

学科分类：F0206

资助金额：23.00

项目类别：青年科学基金项目

复杂声学环境下声学事件检测与音频场景识别方法研究

批准号：U1736210

批准年份：2017

负责人：韩纪庆

学科分类：F0111

资助金额：256.00

项目类别：联合基金项目

面向网络对抗的鲁棒性入侵检测技术研究

批准号：61070198

批准年份：2010

负责人：蔡志平

学科分类：F0205

资助金额：33.00

项目类别：面上项目

基于声学模型的鲁棒性声场重建与控制技术

批准号：11504405

批准年份：2015

负责人：武帅兵

学科分类：A2305

资助金额：19.00

项目类别：青年科学基金项目

鲁棒的非特定环境声学事件检测关键技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

玉米叶向值的全基因组关联分析

论大数据环境对情报学发展的影响

监管的非对称性、盈余管理模式选择与证监会执法效率?

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

低轨卫星通信信道分配策略

韩纪庆的其他基金

心理紧张和应力影响下Robust语音识别方法研究

复杂声学环境下声学事件检测与音频场景识别方法研究

基于内在与潜在语义特征的声音段落级语义识别方法研究

基于内容的音频信息检索关键技术研究

行车环境听觉模型及声音处理关键技术

基于子词网格的汉语语音检索关键技术研究

数字音频水印系统的基本模型和算法研究

相似国自然基金