基于压缩域听觉谱的音频分类与检索算法研究

基本信息
批准号:60872115
项目类别:面上项目
资助金额:26.00
负责人:余小清
学科分类:
依托单位:上海大学
批准年份:2008
结题年份:2011
起止时间:2009-01-01 - 2011-12-31
项目状态: 已结题
项目参与者:万旺根,罗发龙,马秀丽,姚劲草,谭海英,常辽豫,刘晗,张开翼
关键词:
压缩域听觉谱特征提取分类检索
结项摘要

随着互联网及多媒体技术的发展,音频数据量呈爆炸式增长,如何快速、准确地对音频信息进行分类检索,已成为急待解决的重要问题。目前互联网及各种数据库中的海量录音音频数据都以压缩格式存储,这些音频大多并非在专业录音棚中录制,故在压缩前混入了环境噪声,压缩过程同时引入了一定噪声,噪声的存在直接影响原有压缩域提取特征方法的表征准确度;压缩音频数据若解压后再抗噪处理,不仅增加计算量,抗噪效果也不理想。针对这些问题,本项目申请提出,直接在压缩域中模仿人耳对传统频谱的预处理操作来抑制噪声,建立压缩域听觉谱数学模型,基于压缩域直接提取高鲁棒性能的听觉谱音频特征,利用近似熵约简算法对所提取的压缩域听觉谱特征进行筛选和优化组合,研究基于熵的相似度度量方法及基于粒度的音频分类检索算法,为在压缩域中准确、快速地对音频信息进行分类和检索提供一种新的有效方法。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
2

双吸离心泵压力脉动特性数值模拟及试验研究

双吸离心泵压力脉动特性数值模拟及试验研究

DOI:10.13465/j.cnki.jvs.2020.19.016
发表时间:2020
3

空气电晕放电发展过程的特征发射光谱分析与放电识别

空气电晕放电发展过程的特征发射光谱分析与放电识别

DOI:10.3964/j.issn.1000-0593(2022)09-2956-07
发表时间:2022
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

面向工件表面缺陷的无监督域适应方法

面向工件表面缺陷的无监督域适应方法

DOI:
发表时间:2021

余小清的其他基金

相似国自然基金

1

基于机器听觉及稀疏表示分类的音乐音频与语义符号比对研究

批准号:61101225
批准年份:2011
负责人:关欣
学科分类:F0117
资助金额:25.00
项目类别:青年科学基金项目
2

基于知识域与数据域协同的图像压缩算法研究

批准号:61202139
批准年份:2012
负责人:徐迈
学科分类:F0210
资助金额:25.00
项目类别:青年科学基金项目
3

基于Bandelet变换的压缩域图像检索技术研究

批准号:61071189
批准年份:2010
负责人:李登峰
学科分类:F0116
资助金额:36.00
项目类别:面上项目
4

基于微词汇语义与时空、音频特征融合的视频内容分类算法研究

批准号:61071153
批准年份:2010
负责人:蒋兴浩
学科分类:F0113
资助金额:38.00
项目类别:面上项目