(甚)低速率语音编码关键问题研究

基本信息

批准号：61271248

项目类别：面上项目

资助金额：60.00

负责人：赵晓群

学科分类：

依托单位：同济大学

批准年份：2012

结题年份：2016

起止时间：2013-01-01 - 2016-12-31

项目状态：已结题

项目参与者：韩笑蕾,张芳,宫云梅,张茜颖,沈恺,高迪

关键词：

语音编码语音建模压缩编码水声通信语音特征分析

结项摘要

This project studies key problems in (very)low rate speech coding for bandwidth-limited underwater acoustic communication, which include: 1)vocal tract parameters: adaptive intra-frame & inter-frame joint prediction coding can reduce the coding bits of the vocal tract parameters. The saved bits can be used to improve the robustness of the encoder, so the system can resist the strong turbulent environment of underwater acoustic communication channel; 2)glottal excitation: the linear predictive analysis method and Hilbert-Huang nonlinear signal analysis method are used to do analysis and reconstruction of the glottal excitation signal in a different frame mode to approach the ideal situation of the short-time stationary model speech, so the naturalness of synthetic speech by the encoder can be improved. The proposed methods can be implemented and tested on "shallow water acoustic channel experimental software platform" which we have built, and ultimately the algorithm is performed by FPGA hardware platform. Based on the above mentioned problems, it can be expected to enhance the robustness of the (very) low bit rate speech coding schemes and the naturalness of the synthesized speech, and promote its application in underwater acoustic communication. It is supposed to strengthen international cooperation and communication via this project and raise more young professionals in speech coding and underwater acoustic communication field.

本项目针对频带资源有限的水声通信，研究(甚)低速率水声语音编码中的关键问题，主要包括：1)声道参数：利用自适应帧内、帧间联合预测编码的方法降低声道参数的编码比特，或将节省下来的比特数用于提升编码器的鲁棒性，使其能抵抗水声信道的强干扰环境；2)声门激励：利用线性预测分析方法和希尔伯特-黄等非线性信号分析方法对不同帧模式下的声门激励信号进行分析和重构，尽可能地逼近语音短时平稳模型的理想情况，提高编码器的合成语音自然度。本项目所设计的实验将在我们已经构建的"浅海水声信道综合实验软件平台"的基础上开展研究，并最终通过FPGA硬件平台对算法进行实现和验证。通过对上述问题的研究，预期可以提升(甚)低速率语音编码方案的鲁棒性和合成语音的自然度，促进其在水声通信中的应用。另外，依托本项目进一步加强国际合作与交流，同时为我国在语音编码及水声通信领域的人才培养做出贡献。

项目摘要

本项目对（甚）低速率语音编码算法中的诸多关键技术进行分析和研究，设计并实现适用于水声信道的编码算法。本项目涉及声道参数、声门激励、基音估计、清浊音判决、编码算法设计及在ARM上的移植优化等关键技术,主要研究成果包括：.1）声道参数：通过对声道编码参数分析和统计，发现可利用线谱频率(LSF)参数具有较强的帧内帧间相关性，且相邻帧间LSF参数的相关性呈线性趋势这一特性，设计偏最小二乘算法及其简化模型来对超帧中的LSF参数进行预测，并在此基础上提出一些高效实用的LSF参数码书训练算法，有效地降低声道参数量化比特。.2）声门激励：利用线性预测分析方法和希尔伯特-黄等非线性信号分析方法对清浊音帧模式下的声门激励信号进行了分析，将经验模态分解算法引入到语音清浊音帧激励信号的构造中；提出了一种基于语音截止频率的语音编码激励模型。.水声环境下准确的基音估计和清浊音判决是构造理想声门激励的基础，因此，提出了一种基于幅度压缩基音估计滤波的清浊音分类及基音估计方法；给出了一种无训练过程的自适应抗噪的清/浊/静音判决方法；分析了基于谱减算法和小波变换算法的语音增强技术在实际背景噪声环境下的性能，及其在水声信道低速率编解码技术中的工程适用性等。.根据水声语音编码的特点，设计了2.4 ,1.84(2种),1.2,1.12,0.88,0.8共7种(甚)低速率语音编码方案，编码后的语音清晰，具有较好的自然度和可懂度。开发了基于ARM的软硬件平台，并将7种编码算法在该平台上进行了实现和优化，经测试表明，所设计编码算法能满足水声通信实际需求。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：

发表时间：2021

DOI：10.7498/aps.68.20181682

发表时间：2019

DOI：10.3778/j.issn.1673-9418.2104120

发表时间：

赵晓群的其他基金

批准号：69972042

批准年份：1999

资助金额：11.80

项目类别：面上项目

相似国自然基金

高质量甚低比特-变速率语音编码算法研究

批准号：60572074

批准年份：2005

负责人：董恩清

学科分类：F0108

资助金额：22.00

项目类别：面上项目

低速率LD-CELP 语音编码算法研究

批准号：60172070

批准年份：2001

负责人：张刚

学科分类：F0101

资助金额：3.50

项目类别：面上项目

0.6kb/s低速率语音压缩编码算法研究

批准号：60272020

批准年份：2002

负责人：崔慧娟

学科分类：F0101

资助金额：22.00

项目类别：面上项目

基于正弦激励和线性预测的低速率语音编码算法研究

批准号：69872005

批准年份：1998

负责人：鲍长春

学科分类：F0108

资助金额：12.00

项目类别：面上项目

(甚)低速率语音编码关键问题研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

基于直观图的三支概念获取及属性特征分析

赵晓群的其他基金

阵列偶及阵列偶相关理论研究

相似国自然基金