(甚)低速率语音编码关键问题研究

基本信息
批准号:61271248
项目类别:面上项目
资助金额:60.00
负责人:赵晓群
学科分类:
依托单位:同济大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:韩笑蕾,张芳,宫云梅,张茜颖,沈恺,高迪
关键词:
语音编码语音建模压缩编码水声通信语音特征分析
结项摘要

This project studies key problems in (very)low rate speech coding for bandwidth-limited underwater acoustic communication, which include: 1)vocal tract parameters: adaptive intra-frame & inter-frame joint prediction coding can reduce the coding bits of the vocal tract parameters. The saved bits can be used to improve the robustness of the encoder, so the system can resist the strong turbulent environment of underwater acoustic communication channel; 2)glottal excitation: the linear predictive analysis method and Hilbert-Huang nonlinear signal analysis method are used to do analysis and reconstruction of the glottal excitation signal in a different frame mode to approach the ideal situation of the short-time stationary model speech, so the naturalness of synthetic speech by the encoder can be improved. The proposed methods can be implemented and tested on "shallow water acoustic channel experimental software platform" which we have built, and ultimately the algorithm is performed by FPGA hardware platform. Based on the above mentioned problems, it can be expected to enhance the robustness of the (very) low bit rate speech coding schemes and the naturalness of the synthesized speech, and promote its application in underwater acoustic communication. It is supposed to strengthen international cooperation and communication via this project and raise more young professionals in speech coding and underwater acoustic communication field.

本项目针对频带资源有限的水声通信,研究(甚)低速率水声语音编码中的关键问题,主要包括:1)声道参数:利用自适应帧内、帧间联合预测编码的方法降低声道参数的编码比特,或将节省下来的比特数用于提升编码器的鲁棒性,使其能抵抗水声信道的强干扰环境;2)声门激励:利用线性预测分析方法和希尔伯特-黄等非线性信号分析方法对不同帧模式下的声门激励信号进行分析和重构,尽可能地逼近语音短时平稳模型的理想情况,提高编码器的合成语音自然度。本项目所设计的实验将在我们已经构建的"浅海水声信道综合实验软件平台"的基础上开展研究,并最终通过FPGA硬件平台对算法进行实现和验证。通过对上述问题的研究,预期可以提升(甚)低速率语音编码方案的鲁棒性和合成语音的自然度,促进其在水声通信中的应用。另外,依托本项目进一步加强国际合作与交流,同时为我国在语音编码及水声通信领域的人才培养做出贡献。

项目摘要

本项目对(甚)低速率语音编码算法中的诸多关键技术进行分析和研究,设计并实现适用于水声信道的编码算法。本项目涉及声道参数、声门激励、基音估计、清浊音判决、编码算法设计及在ARM上的移植优化等关键技术,主要研究成果包括:.1)声道参数:通过对声道编码参数分析和统计,发现可利用线谱频率(LSF)参数具有较强的帧内帧间相关性,且相邻帧间LSF参数的相关性呈线性趋势这一特性,设计偏最小二乘算法及其简化模型来对超帧中的LSF参数进行预测,并在此基础上提出一些高效实用的LSF参数码书训练算法,有效地降低声道参数量化比特。.2)声门激励:利用线性预测分析方法和希尔伯特-黄等非线性信号分析方法对清浊音帧模式下的声门激励信号进行了分析,将经验模态分解算法引入到语音清浊音帧激励信号的构造中;提出了一种基于语音截止频率的语音编码激励模型。.水声环境下准确的基音估计和清浊音判决是构造理想声门激励的基础,因此,提出了一种基于幅度压缩基音估计滤波的清浊音分类及基音估计方法;给出了一种无训练过程的自适应抗噪的清/浊/静音判决方法;分析了基于谱减算法和小波变换算法的语音增强技术在实际背景噪声环境下的性能,及其在水声信道低速率编解码技术中的工程适用性等。.根据水声语音编码的特点,设计了2.4 ,1.84(2种),1.2,1.12,0.88,0.8共7种(甚)低速率语音编码方案,编码后的语音清晰,具有较好的自然度和可懂度。开发了基于ARM的软硬件平台,并将7种编码算法在该平台上进行了实现和优化,经测试表明,所设计编码算法能满足水声通信实际需求。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016

赵晓群的其他基金

批准号:69972042
批准年份:1999
资助金额:11.80
项目类别:面上项目

相似国自然基金

1

高质量甚低比特-变速率语音编码算法研究

批准号:60572074
批准年份:2005
负责人:董恩清
学科分类:F0108
资助金额:22.00
项目类别:面上项目
2

低速率LD-CELP 语音编码算法研究

批准号:60172070
批准年份:2001
负责人:张刚
学科分类:F0101
资助金额:3.50
项目类别:面上项目
3

0.6kb/s低速率语音压缩编码算法研究

批准号:60272020
批准年份:2002
负责人:崔慧娟
学科分类:F0101
资助金额:22.00
项目类别:面上项目
4

基于正弦激励和线性预测的低速率语音编码算法研究

批准号:69872005
批准年份:1998
负责人:鲍长春
学科分类:F0108
资助金额:12.00
项目类别:面上项目