移动环境下的语音频质量恢复和评价关键技术研究

基本信息
批准号:61272278
项目类别:面上项目
资助金额:20.00
负责人:张聪
学科分类:
依托单位:武汉轻工大学
批准年份:2012
结题年份:2013
起止时间:2013-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:高戈,卢亚玲,王恒,董石,黄川,阮灵,何健,梁瑞凡
关键词:
客观评价错误隐藏听觉认知模型错误恢复
结项摘要

With the rapid development of the mobile communication market for the increasingly emergency of high-quality speech and audio business,traditonal speech and audio theory constantly facing new challenges.In mobile communications, the transmission channel is less stable, compared to wired transmission channel, resulting in the reception of a data packet error ratio is higher by several orders of magnitude.In addition,due to sound field complexity in the mobile environment,real subjective listening experience with the traditional speech and audio quality evalution methods are quite different..In response to these issues, by studying the cause of packet loss and speech and audio quality declining, a method is presented in the FEC technology, which calculates the current packet loss rate to automatically adjust the redundancy carried by the transmission of information, adjusts adaptively error correction capabilities with network change, enhances the algorithm to face the changing mobile environment..Secondly, by adjusting the gain to be automatically generated in the superposition process of waveform envelope amplitude attenuation in WSOLA, the echo of the previous signal frame is avoided, and the effect of error concealment is improved..At last, the spatial information of sound source is introduced in speech and audio quality objective evaluation mechanism. Through the establishment of multi-source spatial auditory cognitive model, the interference problems among the subjective individual is solved and the auditory consistency of objective evaluation is improved..Related research try to make up the theory of speech and audio coding algorithm in the mobile environment, to enhance the signal quality; establishing speech and audio quality evaluation system in accordance with the human subjective feelings.

随着移动通信市场对高品质语音频业务的需求日益迫切,传统语音频理论不断面临新的挑战。移动通信由于传输信道不太稳定造成数据丢包率较有线传输信道要高出几个数量级;且移动环境声场复杂,真实主观听觉感受与传统语音频质量评价方法存在较大差异。针对这些问题,申请者研究了造成数据丢包以及语音频质量下降的原因,提出在前向纠错技术中通过计算当前数据包丢包率来自动调整传输信息中所携带的冗余量,随网络变化自适应调整纠错能力,增强算法适应多变的移动环境。其次,在波形相似叠加算法中通过调整增益来对叠加过程中生成的波形包络幅度自动进行衰减,避免产生前一语音频信号帧的回声,提高错误隐藏效果。最后,将声源的空间信息引入语音频质量的客观评价机制,通过建立多声源空间听觉认知模型,解决主观个体差异性的干扰问题,提高客观评价的听觉一致性。相关研究成果尝试弥补移动环境下语音频编码算法的理论不足;建立符合人类感知的语音频质量评价系统。

项目摘要

通信行业对高品质语音频业务的需求日益迫切,现有语音频理论不断面临新的挑战,尤其是各种新的移动接入技术相继涌现,应用范围迅速扩展,新的移动数据业务已经成为通信业务的增长点。而移动环境下的语音频应用是移动数据业务的一个重要组成部分,但是移动网络的应用环境不同于固定网络环境,移动音频应用面临的环境要复杂得多。移动通信由于传输信道不太稳定造成数据丢包率较有线传输信道要高出几个数量级;且移动环境声场复杂,真实主观听觉感受与传统语音频质量评价方法存在较大差异。因此,目前移动环境下的语音频质量还远远达不到传统音频的高保真音质水平。.本项目针对这些问题,深入研究了造成数据丢包以及语音频质量下降的原因,在现有语音频感知编码算法的基础上,结合移动环境的特点,首先着重研究了宽带语音/音乐等复杂信号压缩编码和传输造成的数据丢失恢复技术。为了降低网络传输状况对于纠错效果的影响,重点研究使冗余量在传输过程中可随着网络状况进行自适应改变,使纠错效果不再单纯依赖于网络环境的恒定性,增强前向纠错算法的适应范围和健壮性,从而更适应多变的移动环境。.其次,在深入研究实时语音通信丢包隐藏技术的基础上,为了较好解决移动环境造成的语音频质量下降问题,通过在传统波形相似叠加算法的叠加过程中引入增益控制,调整增益来对叠加过程中生成的波形包络幅度自动进行衰减,使得生成的波形包络幅度能延续幅度的趋势,避免产生前一语音频信号帧的回声,提高错误隐藏效果,从而实现在丢包隐藏中提高恢复语音质量的目的。.最后,在语音频质量评价方面,为了解决复杂音频信号特征参数时变性造成的人耳真实主观听觉感受差异,通过研究多声源空间听觉认知模型,将声源的空间信息引入语音频质量的客观评价机制,解决主观个体差异性的干扰问题,提高客观评价的听觉一致性,建立适应移动环境下复杂声场的符合人耳听觉特性的语音频质量评价方法。在项目的支持下,研究了三位空间听觉认知模型,主要包括三个方面:三维空间双耳线索的感知特性分析、三维空间位置线索的感知特性分析以及基于感知的三维音频参数化编码。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

伴有轻度认知障碍的帕金森病~(18)F-FDG PET的统计参数图分析

伴有轻度认知障碍的帕金森病~(18)F-FDG PET的统计参数图分析

DOI:10.3760/cma.j.issn.0376-2491.2018.33.004
发表时间:2018
3

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

张聪的其他基金

批准号:61902369
批准年份:2019
资助金额:24.00
项目类别:青年科学基金项目
批准号:51802214
批准年份:2018
资助金额:19.00
项目类别:青年科学基金项目
批准号:51701013
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:29202009
批准年份:1992
资助金额:5.00
项目类别:青年科学基金项目
批准号:31900004
批准年份:2019
资助金额:24.00
项目类别:青年科学基金项目
批准号:41202034
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:30801469
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:51908247
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:20172008
批准年份:2001
资助金额:18.00
项目类别:面上项目
批准号:61803030
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:41572051
批准年份:2015
资助金额:94.00
项目类别:面上项目
批准号:51609190
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:29572050
批准年份:1995
资助金额:8.00
项目类别:面上项目
批准号:11505253
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目

相似国自然基金

1

基于听觉关注度的音频质量客观评价技术研究

批准号:61102127
批准年份:2011
负责人:杨玉红
学科分类:F0111
资助金额:26.00
项目类别:青年科学基金项目
2

移动计算环境下基于性能和故障感知的数据复制关键技术研究

批准号:61100004
批准年份:2011
负责人:李香
学科分类:F0201
资助金额:20.00
项目类别:青年科学基金项目
3

网络分布环境下的移动计算模型及关键技术研究

批准号:60173023
批准年份:2001
负责人:李京
学科分类:F0201
资助金额:18.00
项目类别:面上项目
4

适于MPEG音频播放控制的音频水印关键技术研究

批准号:60873220
批准年份:2008
负责人:王让定
学科分类:F0206
资助金额:33.00
项目类别:面上项目