基于压缩域听觉谱的音频分类与检索算法研究

基本信息

批准号：60872115

项目类别：面上项目

资助金额：26.00

负责人：余小清

学科分类：

依托单位：上海大学

批准年份：2008

结题年份：2011

起止时间：2009-01-01 - 2011-12-31

项目状态：已结题

项目参与者：万旺根,罗发龙,马秀丽,姚劲草,谭海英,常辽豫,刘晗,张开翼

关键词：

压缩域听觉谱特征提取分类检索

结项摘要

随着互联网及多媒体技术的发展，音频数据量呈爆炸式增长，如何快速、准确地对音频信息进行分类检索，已成为急待解决的重要问题。目前互联网及各种数据库中的海量录音音频数据都以压缩格式存储，这些音频大多并非在专业录音棚中录制，故在压缩前混入了环境噪声，压缩过程同时引入了一定噪声，噪声的存在直接影响原有压缩域提取特征方法的表征准确度；压缩音频数据若解压后再抗噪处理，不仅增加计算量，抗噪效果也不理想。针对这些问题，本项目申请提出，直接在压缩域中模仿人耳对传统频谱的预处理操作来抑制噪声，建立压缩域听觉谱数学模型，基于压缩域直接提取高鲁棒性能的听觉谱音频特征，利用近似熵约简算法对所提取的压缩域听觉谱特征进行筛选和优化组合，研究基于熵的相似度度量方法及基于粒度的音频分类检索算法，为在压缩域中准确、快速地对音频信息进行分类和检索提供一种新的有效方法。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3799/dqkx.2019.110

发表时间：2019

DOI：10.3969/j.issn.1004-132x.2022.18.003

发表时间：2022

DOI：10.16798/j.issn.1003-0530.2020.01.008

发表时间：2020

DOI：

发表时间：2017

DOI：10.3788/LOP56.162901

发表时间：2019

余小清的其他基金

相似国自然基金

基于机器听觉及稀疏表示分类的音乐音频与语义符号比对研究

批准号：61101225

批准年份：2011

负责人：关欣

学科分类：F0117

资助金额：25.00

项目类别：青年科学基金项目

基于知识域与数据域协同的图像压缩算法研究

批准号：61202139

批准年份：2012

负责人：徐迈

学科分类：F0210

资助金额：25.00

项目类别：青年科学基金项目

基于Bandelet变换的压缩域图像检索技术研究

批准号：61071189

批准年份：2010

负责人：李登峰

学科分类：F0116

资助金额：36.00

项目类别：面上项目

基于微词汇语义与时空、音频特征融合的视频内容分类算法研究

批准号：61071153

批准年份：2010

负责人：蒋兴浩

学科分类：F0113

资助金额：38.00

项目类别：面上项目

基于压缩域听觉谱的音频分类与检索算法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

岩石/结构面劣化导致巴东组软硬互层岩体强度劣化的作用机制

基于颗粒阻尼的变频空调压缩机管路减振设计

TVBN-ResNeXt:解决动作视频分类的端到端时空双流融合网络

基于小波高阶统计量的数字图像来源取证方法

少模光纤受激布里渊散射效应理论研究

余小清的其他基金

相似国自然基金