低码率,低延迟的长话质量语音编码算法是当前通信领域的核心技术。参与制订相关算法标准具有重大科学意义和长远的经济利益,成为学者和业界一致努力的目标。ITU 从1992年开始征集延迟低于5毫秒,速率低于8Kb/s,长话质量的语音编码算法,至今仍无重要进展。本项目以此为目标,设计并提出在长话音质下延迟低于2.5毫秒,码率低于8Kb/s算法以及在通信质量下延迟低于5毫秒,码率低于4Kb/s算法。这是一个富有挑战性的课题,申请者为此进行了近十年的深入研究并积累了丰富的算法基础。在此前结题的国家自然基金项目和山西省自然基金项目中申请者提出攻关思路是精确表示激励增益和训练归一化波形码书。前者是关键难点而后者仅需大量的计算。申请者首次采用增益自适应量化方法,仅用3位表示不超过20样点的激励矢量增益,获得突破性进展。以此为基础采集大容量多国语音样本训练归一化波形码书,这一重大问题有望最终解决。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于混合优化方法的大口径主镜设计
采用深度学习的铣刀磨损状态预测模型
瞬态波位移场计算方法在相控阵声场模拟中的实验验证
基于EMD与小波阈值的爆破震动信号去噪方法
不同分子分型乳腺癌的多模态超声特征和临床病理对照研究
基于非线性矢量量化的延迟2.5毫秒甚低码率语音编码算法
低速率LD-CELP 语音编码算法研究
基于亚像素补偿和视觉感知的超低码率压缩算法研究
高质量甚低比特-变速率语音编码算法研究