自回归维纳滤波语音增强方法研究

基本信息
批准号:61471014
项目类别:面上项目
资助金额:80.00
负责人:鲍长春
学科分类:
依托单位:北京工业大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:Bastiaan Kleijn,贾懋珅,李如玮,邓峰,夏丙寅,鲍枫,张东明,何奇,王清
关键词:
自回归模型语音编码语音增强线性预测维纳滤波
结项摘要

Considering the background of linear prediction speech coding that has been widely used in mobile communication, the speech enhancement method in adverse environment based on auto-regressive (AR) Wiener filtering (WF) will be proposed in this project. This method exploits the priori codebooks about spectral shape of speech to optimize AR power spectrum shape of the speech based on maximum-likelihood estimation, where the priori codebooks have finite states that depend on the energy of speech. This method also tries to find the statistical cross-correlation between the spectra of noise and noisy observation to modify Wiener filter for balancing the power ratio of speech and noise. In addition, the noise estimation will be improved by phase space reconstruction of the noisy observation, and the priori codebooks about spectral shape of speech will be optimized by Deep Belief Network(DBN) and simulated annealing(SA) algorithm.This kind of speech enhancement method can avoid the noise classification, and is very suitable for suppressing nonstationary noise that the types and energy vary on a frame-by-frame basis in mobile speech communication.

本课题以目前移动通信中普遍使用的线性预测语音编码技术为背景,通过构建能量依赖的有限状态语音谱包络先验码书,研究复杂环境下的自回归(AR)维纳滤波语音增强方法。该方法将利用极大似然估计确定最终的语音AR谱包络,并借助估计的噪声谱和观测信号谱之间的相关性修正维纳滤波器,以达到平衡语音和噪声功率的目的。另外,该方法还将对观测信号进行相空间重构来改善噪声估计性能,并用深度信念网络和模拟退火等算法优化语音的AR谱包络码书。该方法不需噪声分类,非常适合移动通信中噪声类型和噪声能量逐帧改变的非平稳噪声抑制。

项目摘要

在实际的声学环境下,语音交互设备(如移动电话)在获取或处理语音时,不可避免地要受到环境噪声的影响,为了减少环境噪声的影响,课题以目前移动通信中普遍使用的线性预测语音编码技术为背景,为保证语音处理设备接收到相对纯净的语音信号,提出了一系列单通道语音增强方法。考虑到现有方法存在的语音和噪声模棱两可的问题、噪声泛化能力不足的问题、较少考虑长时时间动态时频信息的问题以及自回归(AR)模型增益估计不准确的问题,课题组以AR模型参数为先验信息,对基于维纳滤波的语音增强方法进行了深入研究。其中课题的重点研究工作包括:针对AR增益估计不准确的问题,提出了利用期望最大化(EM)技术、乘法迭代原则和深度神经网络(DNN)等技术提高AR参数的估计准确度;提出了先验增益建模的隐马尔科夫模型(HMM)的语音增强方法用于解决语音和噪声的模棱两可性;针对缺少长时时间动态时频信息,提出了利用字典学习技术、非负矩阵分解技术、DNN技术和数据场技术为语音和噪声建立时频关联性的方法;考虑到统计模型方法是一类不受噪声类型影响的方法,项目组基于统计模型对噪声的泛化能力也展开了较深入的研究工作。.除了上述重点研究工作之外,课题还从以下几个方面对语音增强进行了研究。首先,将维纳滤波思想扩展为基于听觉掩蔽效应的时频掩蔽形式,项目组利用GMM模型和DNN模型对语音和噪声进行建模,并结合贝叶斯估计理论对时频掩蔽展开研究;其次,针对缺少语音和噪声相关性而造成的语音信息丢失较大的问题,提出利用双耳线索编码技术,并结合DNN模型来改善这一问题;考虑到大多数现存方法未考虑语音相位信息的问题,课题组提出利用相位修正技术和跳转连接算法来恢复语音的相位。.实验评测结果表明,本项目所提方法的性能均优于传统的码书驱动维纳滤波方法。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018

鲍长春的其他基金

批准号:60872027
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:61072089
批准年份:2010
资助金额:35.00
项目类别:面上项目
批准号:60372063
批准年份:2003
资助金额:24.00
项目类别:面上项目
批准号:69872005
批准年份:1998
资助金额:12.00
项目类别:面上项目

相似国自然基金

1

基于语音增强的鲁棒性语音识别方法研究

批准号:62001446
批准年份:2020
负责人:屠彦辉
学科分类:F0117
资助金额:16.00
项目类别:青年科学基金项目
2

强噪声地震资料正则化维纳滤波方法研究

批准号:40774054
批准年份:2007
负责人:李月
学科分类:D0408
资助金额:49.00
项目类别:面上项目
3

基于稀疏编码的语音特征增强方法研究

批准号:61305001
批准年份:2013
负责人:何勇军
学科分类:F0605
资助金额:25.00
项目类别:青年科学基金项目
4

微型麦克风阵语音增强方法研究

批准号:60272038
批准年份:2002
负责人:曾庆宁
学科分类:F0111
资助金额:22.00
项目类别:面上项目