高性能数字音频编码技术是当前通信技术和多媒体技术的重要基础。随着应用对音质和压缩率要求不断提高,传统的基于香农采样定理和频域分析的处理技术,难以跟上日益提高的音频应用需求。面对挑战,目前具有前景的解决途径包括:基于对象的音频编码技术和基于感知压缩理论的信号处理方法。本项目研究通过结合基于音频对象的多通道编码技术和感知压缩技术实现高音质的多通道编码技术。其中基于音频对象的编码技术能够有效降低通道间信号冗余,而感知压缩技术能够进一步消除冗余,实现高质量音频的高效编码。和现有的MPEG多通道编码方案比,所提方案计算复杂度低,通过研究对语/乐音信号均具良好稀疏分解能力的冗余字典,使得算法能够抑制噪声和干扰;相同数据速率下的信号质量性能超过现有的空间音频对象编码。具体研究内容分:空间音频对象参数信息提取与恢复;针对语乐音信号的稀疏分解基计算;测量值的矢量量化编码方式以及根据感知压缩特点建立心理
高性能数字音频编码技术是通信和多媒体技术重要基础。随着应用对音质和压缩率要求不断提高,基于传统采样定理的处理技术难以跟上日益提高的应用需求。本项目面对上述挑战,研究通过结合基于音频对象的多通道编码技术和压缩感知技术实现高音质多通道编码。项目具体研究内容和过程如下:.2012:研究适用于音频信号压缩重建的测量矩阵并构建结构化编码冗余字典,并提出多基联合下音频信号稀疏度分配算法.2013:研究单通道音频信号的压缩重建方法。发现传统Kalman滤波信号恢复算法无法适用与压缩采样后的音频信号,为此调整研究方向为基于近似消息传递的重建方法.2014:基于上一年度成果将单声道压缩重建算法拓展到空间音频压缩采样编码。侧重空间音频对象建模方法及模型参数信息获取方法。同时对测量值的量化与熵编码方法进行研究,提出基于有限状态机的熵受限无损编码方法.2015:构建单通道及多通道音频信号的压缩采样测试系统,对性能测试与评价,并优化算法,满足实时需求..通过研究工作完成项目计划内容,理论成果包括:.1 空间音频对象变换域系数量化编码方法.2 适用于音频信号的压缩采样测量矩阵和编码用的冗余字典.3 采用贝叶斯推断方式的单通道音频信号压缩重建算法.4 基于时-频-空域联合模型的多通道音频信号的压缩采样方法.5 无格点分布式压缩重建方法.6 基于压缩感知的声源定位.7 基于稀疏约束的声场重建方法.. 目前得到的研究成果表明,基于压缩感知采样方法结合所提出的重构算法,能够以1/3奈奎斯特采样率的速率对音频信号采样,并达到传统奈奎斯特采样率的采样重构精度,试验和仿真表明单通道音频的重建精度好于24dB。此外通过推广这一方法,利用音频信号的时-频-空域联合稀疏模型并结合贝叶斯推断的消息传递方式实现空间音频的压缩采样编码以及重构,实测表明重构信号的SNR最高达到41.3dB。研究表明使用压缩感知采样方法结合重构算法,能够以亚奈奎斯特采样率条件下,高效地对空间音频信号进行压缩采样编码,并通过算法得到精确的重构。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
内点最大化与冗余点控制的小型无人机遥感图像配准
多空间交互协同过滤推荐
冗余字典下的压缩感知理论及应用研究
基于距离感知的3D音频空间参数压缩研究
基于字典优化与耦合观测的压缩学习感知研究
基于字典学习及压缩感知的干涉高光谱数据压缩重建算法研究