基于空间挤压的可升级环绕音频编码技术研究

基本信息

批准号：61201197

项目类别：青年科学基金项目

资助金额：25.00

负责人：贾懋珅

学科分类：

依托单位：北京工业大学

批准年份：2012

结题年份：2015

起止时间：2013-01-01 - 2015-12-31

项目状态：已结题

项目参与者：鲍长春,ChristianRitz,李晓明,刘鑫,刘浩杰,步兵,李红蕊

关键词：

空间挤压音频编码可升级编码信源编码环绕音频编码

结项摘要

The research of this project is focused on the scalable spatial surround audio coding. Based on the psychoacoustic characteristics of human ear, combined with the spatial squeezing technique and the head-related transfer function，this project is planed to develop efficient technologies for the extraction of virtual sound sources, the perception sorting, nonuniform spatial squeezing, scalable quantisation, linear interpolation and binaural reproduction, which are used for surround audio coding. By these techonlogies, an scalable surround audio coding method whose bit-rate is from 32kb/s to 128kb/s and a virtual surround sound binaural reproduction technique will be proposed in this project. The research of this project will provide technical support for the network transmission of spatial surround audio in the future. The research will attain independent intellectual property rights and can be applied to various kinds of applications, such as the compression and storage for the surround audio signal, television and telephone conference, mobile audio, online audio service and 4G mobile network.

本课题针对空间环绕声的可升级编码展开研究工作，基于人耳心理声学特性，结合空间挤压技术和头相关传输函数，研究适用于处理环绕音频的空间虚拟声源提取技术、感知重要性排序技术、非均匀空间挤压、分级量化技术、线性插值和双耳虚拟重放技术，实现一种码率在32~128kb/s的多码率可升级空间环绕音频编码算法和环绕声耳机虚拟重放技术。本课题研究为空间环绕音频信号的网络传输提供技术支持，研究成果具有自主知识产权，可应用于电视电话会议、移动音频、在线音频服务和第四带移动通信等领域。

项目摘要

本课题针对空间音频的可升级编码展开研究工作，应用各种信息处理方法和数学模型，提出了多种空间音频处理的新算法，包括：基于经验模态分解的语音与音频通用编码方法，基于信号规整和稀疏变换的语音与音频分层编码方法，基于目标内稀疏特性的多通路音频目标编码方法，基于分析-合成的多声道音频目标编码方法，基于压缩感知的多级多路音频编码方法，水平面三维房间传输函数参数化方法，基于球谐分析的3D多区域声场重放方法，混响环境下基于球型阵列的3D多区域声场重放方法，基于球谐分析的多声道声信号转换方法，基于改进高阶Ambisonic的头相关传输函数扩展方法，基于Ambisonics音频重放系统的距离重现方法，多声道音频的相对距离估计方法，基于柱谐分析的多声源声场重建方法和基于最优对称虚拟麦克风响应的HOA声像重放方法。并综合上述各种方法和技术，开发出了一套多码率可升级空间音频编码算法和环绕声耳机虚拟重放技术。测试结果表明，算法效果均达到了课题提出的指标要求。本课题研究为空间音频信号的网络传输提供技术支持，可应用于电视电话会议、3D电视、移动音频、在线音频服务等领域。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2016

DOI：

发表时间：2019

DOI：

发表时间：2021

DOI：

发表时间：2016

贾懋珅的其他基金

相似国自然基金

基于冗余字典和感知压缩的空间音频对象编码

批准号：61171171

批准年份：2011

负责人：应忍冬

学科分类：F0117

资助金额：56.00

项目类别：面上项目

三维音频中空间方位信息感知编码关键技术研究

批准号：61201169

批准年份：2012

负责人：王晓晨

学科分类：F0101

资助金额：25.00

项目类别：青年科学基金项目

基于张量分析的空间音频信号压缩与重建技术研究

批准号：61571044

批准年份：2015

负责人：王晶

学科分类：F0117

资助金额：60.00

项目类别：面上项目

基于关注度的可分级音频编码方法研究

批准号：61201247

批准年份：2012

负责人：杭波

学科分类：F0108

资助金额：25.00

项目类别：青年科学基金项目

基于空间挤压的可升级环绕音频编码技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于MCPF算法的列车组合定位应用研究

基于主体视角的历史街区地方感差异研究———以北京南锣鼓巷为例

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

贵州织金洞洞穴CO2的来源及其空间分布特征

贾懋珅的其他基金

相似国自然基金