The research of this project is focused on the scalable spatial surround audio coding. Based on the psychoacoustic characteristics of human ear, combined with the spatial squeezing technique and the head-related transfer function,this project is planed to develop efficient technologies for the extraction of virtual sound sources, the perception sorting, nonuniform spatial squeezing, scalable quantisation, linear interpolation and binaural reproduction, which are used for surround audio coding. By these techonlogies, an scalable surround audio coding method whose bit-rate is from 32kb/s to 128kb/s and a virtual surround sound binaural reproduction technique will be proposed in this project. The research of this project will provide technical support for the network transmission of spatial surround audio in the future. The research will attain independent intellectual property rights and can be applied to various kinds of applications, such as the compression and storage for the surround audio signal, television and telephone conference, mobile audio, online audio service and 4G mobile network.
本课题针对空间环绕声的可升级编码展开研究工作,基于人耳心理声学特性,结合空间挤压技术和头相关传输函数,研究适用于处理环绕音频的空间虚拟声源提取技术、感知重要性排序技术、非均匀空间挤压、分级量化技术、线性插值和双耳虚拟重放技术,实现一种码率在32~128kb/s的多码率可升级空间环绕音频编码算法和环绕声耳机虚拟重放技术。本课题研究为空间环绕音频信号的网络传输提供技术支持,研究成果具有自主知识产权,可应用于电视电话会议、移动音频、在线音频服务和第四带移动通信等领域。
本课题针对空间音频的可升级编码展开研究工作,应用各种信息处理方法和数学模型,提出了多种空间音频处理的新算法,包括:基于经验模态分解的语音与音频通用编码方法,基于信号规整和稀疏变换的语音与音频分层编码方法,基于目标内稀疏特性的多通路音频目标编码方法,基于分析-合成的多声道音频目标编码方法,基于压缩感知的多级多路音频编码方法,水平面三维房间传输函数参数化方法,基于球谐分析的3D多区域声场重放方法,混响环境下基于球型阵列的3D多区域声场重放方法,基于球谐分析的多声道声信号转换方法,基于改进高阶Ambisonic的头相关传输函数扩展方法,基于Ambisonics音频重放系统的距离重现方法,多声道音频的相对距离估计方法,基于柱谐分析的多声源声场重建方法和基于最优对称虚拟麦克风响应的HOA声像重放方法。并综合上述各种方法和技术,开发出了一套多码率可升级空间音频编码算法和环绕声耳机虚拟重放技术。测试结果表明,算法效果均达到了课题提出的指标要求。本课题研究为空间音频信号的网络传输提供技术支持,可应用于电视电话会议、3D电视、移动音频、在线音频服务等领域。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
多空间交互协同过滤推荐
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
采用深度学习的铣刀磨损状态预测模型
基于冗余字典和感知压缩的空间音频对象编码
三维音频中空间方位信息感知编码关键技术研究
基于张量分析的空间音频信号压缩与重建技术研究
基于关注度的可分级音频编码方法研究