双耳交互计算模型与空间听觉研究

基本信息

批准号：61201345

项目类别：青年科学基金项目

资助金额：25.00

负责人：周琳

学科分类：

依托单位：东南大学

批准年份：2012

结题年份：2015

起止时间：2013-01-01 - 2015-12-31

项目状态：已结题

项目参与者：赵小燕,吴海洋,杨娟娟,胡金鑫,包夏红

关键词：

双耳声定位双耳交互模型语音定位

结项摘要

The robustness of speech processing system is still an important and difficult research filed. Psychoacoustic and Physiological acoustics research indicate that the binaural system of human hearing plays a major role in improving speech intelligibility. The primary goal of this project is to study the binaural perception model of human hearing and to propose the computational model of binaural interaction to improve the robustness of speech signal processing system in the noisy and reverberant environment. First, binaural cross correlation function is extracted as the localization cues for establishing sound source localization model. Second, inhibition model based on crossed fed-forward and fed-backward structure is proposed to simulate the precedence effect. Third, binaural model based on cross correlation is collaborated with equalization-cancellation model. At last, the sub-band SNR (signal-Noise Ratio) estimation based on covariance matrix is deduced to select the frequency adaptively for localization cues computation. This project will realize the target speech detection and analysis based on localization cues, and establish the framework of binaural speech signal processing. This work will improve the robustness of current speech signal processing system in real application.

复杂声学环境下语音信号处理的鲁棒性研究一直是重点和难点。听觉生理学和心理学研究表明人的双耳结构决定了听觉系统的鲁棒性。因此本项目基于双耳声信号处理框架，研究听觉神经对双耳声信号的交互、融合处理机制，提出相应计算模型，具体包括：研究基于子带互相关函数的空间线索，建立空间方位识别模型；建立前、后向结构的反射声抑制模型，融合均衡抵消处理过程，建立听觉系统优先效应的计算模型，实现混响环境下的空间方位识别；基于协方差矩阵实现短时子带噪声估计，在定位模型中将子带信噪比作为可信度度量，实现子带自适应选择。本项目模拟人耳听觉系统处理结构，给出完整的双耳交互计算模型，实现基于空间线索的目标语音检测和分析，提高现有语音信号处理系统对复杂声学环境的鲁棒性，为语音信号处理系统的鲁棒性研究提供新的研究框架。

项目摘要

复杂声学环境下语音信号处理系统的鲁棒性研究一直是重点和难点。听觉生理学和心理学研究表明人的双耳结构决定了听觉系统的鲁棒性。因此本项目基于双耳声信号处理框架，研究双耳的空间感知机制，实现基于空间线索的目标声源检测和分离。具体的研究内容包括：在已有的基于耳间时间差ITD(Inter-aural Time Difference)定位基础上，综合耳间强度差IID(Inter-aural Intensity Difference)、双耳互相关函数，模拟听觉神经的多参数融合处理机制，研究了基于ITD、IID、互相关函数的深度神经网络DNN(Deep Neural Network)定位机制，挖掘各声学特征参数间的内在结构信息，模拟听觉系统的混响抑制机制，改善混响环境下的双耳定位性能；基于听觉场景分析中，听觉系统对不同声源目标信号的分离和重构机制，提出了基于定位-分离重构迭代结构的双耳声源定位算法，进一步改善复杂声学环境下的双耳声源定位和分离性能；基于压缩感知原理，提出了基于双耳声信号的计算模型，解决了混响环境下的鲁棒双耳声源定位和基于声源方位信息的目标声源分离问题；模拟人耳听觉系统的频率选择性，基于协方差矩阵，实现子带噪声估计，在定位模型中将子带信噪比作为可信度度量，实现子带频率的自适应选择，提高了混响和噪声环境下双耳声源定位的鲁棒性；同时研究了低信噪比环境下的端点检测算法和多环境模型矢量泰勒级数VTS(Vector Taylor Series)语音识别算法，作为双耳空间感知的前端和后端处理模块，提高双耳声源定位的鲁棒性，以及为基于空间感知的语音信号处理研究提供基础。最后，课题组基于声学人工头和多通道采集设备，搭建了硬件测试平台，双耳空间感知算法的验证提供了实验条件。课题组开展的研究工作实现了混响、噪声复杂声学环境下，基于双耳声信号的目标声源空间感知和识别，为提高语音信号处理系统鲁棒性提供了新的途径，研究成果可广泛用于语音识别、说话人识别、语音通信、机器人听觉等领域。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13334/j.0258-8013.pcsee.190276

发表时间：2020

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2016

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：

发表时间：2020

周琳的其他基金

批准号：31201654

批准年份：2012

资助金额：21.00

项目类别：青年科学基金项目

批准号：81400347

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：21606213

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：61571106

批准年份：2015

资助金额：57.00

项目类别：面上项目

批准号：81774212

批准年份：2017

资助金额：55.00

项目类别：面上项目

批准号：31371962

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：31900741

批准年份：2019

资助金额：24.00

项目类别：青年科学基金项目

批准号：51779237

批准年份：2017

资助金额：60.00

项目类别：面上项目

批准号：30901368

批准年份：2009

资助金额：22.00

项目类别：青年科学基金项目

批准号：U1404813

批准年份：2014

资助金额：30.00

项目类别：联合基金项目

批准号：51409235

批准年份：2014

资助金额：26.00

项目类别：青年科学基金项目

批准号：81472325

批准年份：2014

资助金额：72.00

项目类别：面上项目

批准号：81001103

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

相似国自然基金

双耳空间听觉模型与虚拟环绕声系统的研究

批准号：10374031

批准年份：2003

负责人：谢菠荪

学科分类：A2305

资助金额：18.00

项目类别：面上项目

基于参数优化具有简单认知能力的双耳听觉计算模型

批准号：11174316

批准年份：2011

负责人：鲍明

学科分类：A2305

资助金额：75.00

项目类别：面上项目

复杂声音场景下的双耳听觉模型研究

批准号：61175043

批准年份：2011

负责人：曲天书

学科分类：F0601

资助金额：58.00

项目类别：面上项目

双耳听觉的脑干神经环路研究

批准号：31872769

批准年份：2018

负责人：肖中举

学科分类：C0904

资助金额：60.00

项目类别：面上项目

双耳交互计算模型与空间听觉研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

一种基于多层设计空间缩减策略的近似高维优化方法

基于MCPF算法的列车组合定位应用研究

二维FM系统的同时故障检测与控制

扶贫资源输入对贫困地区分配公平的影响

周琳的其他基金

牡丹花色形成相关MYB类转录因子的分离及其功能分析

T淋巴细胞KCa3.1钾通道在静脉血栓栓塞症发病中的作用及机制

多重刺激协同作用对动态键交联的热固性聚氨酯拆解性能的影响研究

基于空间听觉感知的双耳语音分离和识别关键问题研究

基于miR-140-3p/SIRT1信号轴探讨山药多糖防治妊娠糖尿病的分子机制

1,6二氧大花旋覆花内酯对辣椒疫霉菌分子作用机制研究

LGI1点突变在颞叶癫痫中的作用及机制研究

基于模态识别和数据驱动的海上风电健康监测方法研究

B细胞活化因子（BAFF）在急性体液性排斥反应中调节浆细胞产生抗体的作用及机制研究

嗜酸乳杆菌LuxS/AI-2在种间密度感应调节中的作用研究

基于单仿生声学信标的水下移动目标合作定位关键技术研究

肿瘤低氧微环境下ACE2-Ang(1-7)-Mas轴功能缺失在胰腺癌发病中的作用及机制研究

胰腺腺泡细胞介导REG Ialpha在胰腺导管腺癌发病中的作用及机制研究

相似国自然基金