根据二阶差分耳蜗模型及听觉神经的感知特性构造了听觉谱语音特征参数,建立了该参数的提取算法。将该参数取代传统的LPC倒谱特征参数用于TDW中小词汇语音识别系统,在特定人条件下,新方法比传统方法正识率提高5%,在非特定人和有噪情况下,前者比后者分别提高了25%和30%。采用VQ对该特征参数进行量化,形成量化空间的特征表示表达式,并建立了平均速率为2.4Kbps的可变速率声码系统。在每帧最多24个参数并采用帧间平滑技术的条件下,合成语音完全可懂 ,除自然度有所下降外,合成语音仍保持较高的清晰度。在语音识别与语音编码的实验中,新的特征参数比传统LPC参数在语音表征能力、鲁棒性及抗噪性等方面均表现了更好的性能。
{{i.achievement_title}}
数据更新时间:2023-05-31
多源数据驱动CNN-GRU模型的公交客流量分类预测
采用黏弹性人工边界时显式算法稳定性条件
涡轮叶片厚壁带肋通道流动与传热性能的预测和优化
基于抚育间伐效应的红松人工林枝条密度模型
简化的滤波器查找表与神经网络联合预失真方法
人工脑的信息处理新神经网络模型研究
听觉神经网络模型理论与应用研究
人工耳蜗植入者听觉系统对基音信息处理的若干问题研究
用神经网络研究基于听觉系统模型的语音识别