基于机器听觉及稀疏表示分类的音乐音频与语义符号比对研究

基本信息
批准号:61101225
项目类别:青年科学基金项目
资助金额:25.00
负责人:关欣
学科分类:
依托单位:天津大学
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:褚晶辉,白煜,轩秀巍,王俊峰,冯亚楠,蔡微,徐星,秦璐
关键词:
机器听觉音乐乐谱比对序列比对稀疏表示分类器音频内容分析
结项摘要

当前,迫切需要基于内容对海量、丰富的数字音乐资源进行有效定位、分析和检索,但相关系统性能的提升遭遇了音乐音频物理特征与语义内容脱节的瓶颈。因此,音乐音频与语义符号的比对研究是音乐内容分析、检索领域的关键研究问题之一。为此,本课题创新研究思路,拟将音乐音频信号的表示由声源端移至与认知直接相关的听觉端,尝试构建普遍适用于音乐音频各种声源的机器听觉系统,并结合欠定方程最小一范数凸优化的最新研究成果,为音乐音频语义符号比对提供新方法,以解决传统方法难以适应各种复杂多变音乐声源、音频事件,算法不稳定,过拟合等问题,从而达到有效提高音乐音频语义符号比对的准确度和精度的目的。本项目中机器听觉系统由听觉预处理、特征提取和分类判决构成开放式结构,还适用于其他基于内容的音频处理应用。相关研究成果将推动音乐音频内容定位、检索、交互式计算机虚拟乐器陪练、计算机伴奏系统、音乐评价系统等方面的研究。

项目摘要

本课题开展的音乐音频与语义符号比对的研究是音乐内容分析、检索领域的关键研究问题之一,旨在突破音乐音频底层物理特征与语义内容脱节的瓶颈,以期最终实现基于内容对海量、丰富的数字音乐资源进行有效定位、分析和检索。鉴于传统比对方法存在难以适应复杂多变音乐声源、音频事件,算法不稳定,过拟合等问题,本课题采用新的研究思路,将对音乐音频信号的表示由声源端移至与认知直接相关的听觉端,构建了普遍适用于音乐音频各种声源的机器听觉系统,其中结合了借鉴人类认知过程中神经元开启机制的稀疏表示分类方法,为音乐音频语义符号比对提供了新的框架和方法。课题组成员首先深入研究了听觉端音乐音频信号的听觉图像表示,提出了音乐音频的听觉图像特征提取方法,与传统的Mel频率倒谱系数图和时频表示图相比,从听觉图像中提取出的特征,能更好的区分表征音乐语义内容的不同流派及和弦。其次,我们将音乐音频语义符号比对问题归结为以拍点为识别单位的音乐音频语义内容的分类识别问题,提出了基于稀疏表示分类器的和弦识别方法。我们的研究结果表明稀疏表示分类器在和弦识别上较常用的模板匹配方法高2.7%,进一步结合音频的听觉图像特征,取得了较同样考虑了听觉特性的Mel频率倒谱系数图像特征更高的识别率。此外,围绕核心比对问题,我们还提出了基于最大最小距离法的音乐音频节拍跟踪方法,提出了音乐音频多重字典稀疏表示方法,提出了音乐音频中偏差语义内容的检测方法,提出了适合多种乐器的和弦特征提取方法等。本课题中机器听觉系统由听觉预处理、特征提取和分类判决构成开放式结构,还适用于其他基于内容的音频处理应用。相关研究成果将推动音乐音频内容定位、检索、交互式计算机虚拟乐器陪练、计算机伴奏系统、音乐评价系统等方面的研究。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

带有滑动摩擦摆支座的500 kV变压器地震响应

带有滑动摩擦摆支座的500 kV变压器地震响应

DOI:10.13336/j.1003-6520.hve.20200528028
发表时间:2021
2

基于腔内级联变频的0.63μm波段多波长激光器

基于腔内级联变频的0.63μm波段多波长激光器

DOI:10.3788/CJL201946.0801003
发表时间:2019
3

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020
4

具有随机多跳时变时延的多航天器协同编队姿态一致性

具有随机多跳时变时延的多航天器协同编队姿态一致性

DOI:10.7641/CTA.2018.70969
发表时间:2018
5

现代优化理论与应用

现代优化理论与应用

DOI:10.1360/SSM-2020-0035
发表时间:2020

关欣的其他基金

批准号:40261004
批准年份:2002
资助金额:19.00
项目类别:地区科学基金项目
批准号:49761004
批准年份:1997
资助金额:11.00
项目类别:地区科学基金项目
批准号:71303225
批准年份:2013
资助金额:19.00
项目类别:青年科学基金项目

相似国自然基金

1

基于稀疏语义表示的大规模图像分类问题研究

批准号:61262050
批准年份:2012
负责人:李波
学科分类:F0210
资助金额:46.00
项目类别:地区科学基金项目
2

基于压缩域听觉谱的音频分类与检索算法研究

批准号:60872115
批准年份:2008
负责人:余小清
学科分类:F0111
资助金额:26.00
项目类别:面上项目
3

基于微词汇语义与时空、音频特征融合的视频内容分类算法研究

批准号:61071153
批准年份:2010
负责人:蒋兴浩
学科分类:F0113
资助金额:38.00
项目类别:面上项目
4

基于稀疏表示和超图的视频事件语义分析方法研究

批准号:61170126
批准年份:2011
负责人:詹永照
学科分类:F0209
资助金额:55.00
项目类别:面上项目