空间线索感知特性及其应用研究

基本信息
批准号:61401319
项目类别:青年科学基金项目
资助金额:24.00
负责人:王恒
学科分类:
依托单位:武汉轻工大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:张聪,郭峰林,阮灵,康镇,李坤,王思,王赞
关键词:
感知特性三维音频空间线索参数编码
结项摘要

The rapid development of the 3D film inspired 3D audio technology and product demand, the 3D audio system needs to configure a large speakers, while vast amounts of data is difficult to apply to real-time broadcast and other bandwidth-limited conditions , and it is difficult to provide 3D listening experience with 3D video in practical applications. In response to these problems, this research the key technologies of 3D audio perceptual characteristics: it will explore the exist mechanism of perceptual redundancy on spatial parameters, traditional perceptual characteristics of audio signal will research expanded from the energy field to the parameter field. We designed a new device to collect optional position in order to establish a 3D sound database and proposed a test method to get the perceptual threshold of location cues in whole 3D space, create representation model of perceived thresholds on 3D spatial location cues. It will provides theoretical support for the study 3D encoding and sound field reconstruction based perceptual characteristics. We will propose framework for perceptual coding of spatial parameters by taking the perceptual mechanism of binaural cue and cue position into the parameters coding, it will remove subjective redundancy and reduce the coding rate of spatial parameters. The research of this paper want to be supporting technology for the international standards of 3D audio and work for participation in the international competition and standardization in the field of 3D audio.

3D影视的飞速发展激发了3D音频技术及产品的需求, 而3D音频系统需大量扬声器,同时海量数据难以在实时直播等带宽受限的条件下应用,因此目前还无法提供与视频内容同步的3D空间声效。针对上述问题,本项目研究基于感知的3D音频关键技术:探究空间参数感知冗余存在机理,将音频信号感知特性研究从传统的能量域扩展到参数域,建立双耳线索感知模型;通过独特的实验装置采集3D空间不同位置的测试音源,获取整个3D空间位置线索感知阈值,建立3D空间位置线索感知阈值的表示模型,为基于感知的3D编码与声场重建等研究提供了理论支撑;将3D空间的双耳线索和位置线索感知机理引入到参数的编码中,提出空间参数的感知无失真编码框架,去除参数的感知冗余,降低了编码码率。本课题在基础理论和关键技术方面的研究成果可望成为国际3D音频标准的支撑技术,为全面参与3D音频领域的国际竞争和标准化工作奠定坚实的基础。

项目摘要

3D影视的飞速发展激发了3D音频技术及产品的需求, 而3D音频系统需大量扬声器,同时海量数据难以在实时直播等带宽受限的条件下应用,因此目前还无法提供与视频内容同步的3D空间声效。本项目在国家自然科学基金的资助下,对空间线索的感知特性及其应用进行研究。.本项目研究双耳线索恰可感知差异与双耳线索和频率的关系,探究了空间参数感知冗余存在机理,将音频信号感知特性研究从传统的能量域扩展到参数域,获取双耳线索的感知阈值与频率和双耳线索的关系,建立双耳线索感知模型。分别从音源信号频率和方位两个维度对双耳线索进行细粒度感知实验,使得建立的模型与人的感知机理更为吻合,对于参数的主观冗余去除具有重要的指导意义。.开展三维空间位置线索感知特性分析与建模研究,探究三维空间中位置线索感知机理,通过设计独特的实验装置采集三维空间不同位置的测试音源,建立测试音源数据库,设计自适应的心理学听力测试方法快速获得整个三维空间位置线索感知阈值,在此基础上建立三维空间位置线索感知敏感度的表示模型。通过曲面拟合可获得整个三维空间的位置线索感知阈值,进而利用数学方法表示方位感知敏感度的变化规律,为基于感知的三维编码与声场重建等研究提供了理论支撑。.研究基于感知的三维音频参数化编码方向,利用三维空间的双耳线索和位置线索的感知特性指导空间参数的量化和编码。将三维空间的双耳线索和位置线索感知机理引入到参数的编码中,提出空间参数的感知无失真编码框架,只量化人耳可感知的参数变化量,去除参数的感知冗余。与现有三维音频编码方法(SLQP)相比,在质量相当的情况下,可降低约 20%的参数编码码率,研究成果对于提高三维音频的压缩效率具有重要意义。.本文在基础理论和关键技术方面的研究成果可望成为国内甚至国际三维音频标准的支撑技术,这将增强我国在高速成长的三维音频产业中的核心竞争力,为全面参与三维音频领域的国际竞争和标准化工作奠定坚实的研究基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
4

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
5

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020

王恒的其他基金

批准号:61301125
批准年份:2013
资助金额:24.00
项目类别:青年科学基金项目
批准号:59206063
批准年份:1992
资助金额:4.50
项目类别:青年科学基金项目
批准号:30170876
批准年份:2001
资助金额:16.00
项目类别:面上项目
批准号:31771617
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:39770670
批准年份:1997
资助金额:11.00
项目类别:面上项目
批准号:61004061
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:41702223
批准年份:2017
资助金额:24.00
项目类别:青年科学基金项目
批准号:61673098
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:11404072
批准年份:2014
资助金额:29.00
项目类别:青年科学基金项目
批准号:38970383
批准年份:1989
资助金额:3.50
项目类别:面上项目
批准号:81200733
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:81873694
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:81171600
批准年份:2011
资助金额:58.00
项目类别:面上项目
批准号:30471590
批准年份:2004
资助金额:21.00
项目类别:面上项目
批准号:51405246
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目

相似国自然基金

1

三维声场中声源水平定位线索感知特性测量与分析

批准号:61201340
批准年份:2012
负责人:涂卫平
学科分类:F0117
资助金额:25.00
项目类别:青年科学基金项目
2

融合多重线索的高质量场景深度感知

批准号:61702078
批准年份:2017
负责人:叶昕辰
学科分类:F0210
资助金额:24.00
项目类别:青年科学基金项目
3

基于多线索交互协同的视觉深度感知方法研究

批准号:61602481
批准年份:2016
负责人:张驰
学科分类:F0605
资助金额:20.00
项目类别:青年科学基金项目
4

线索感知与视觉注意转移的时序交互机制的研究

批准号:31300938
批准年份:2013
负责人:钱谦
学科分类:C0907
资助金额:22.00
项目类别:青年科学基金项目