基于机器听觉及稀疏表示分类的音乐音频与语义符号比对研究

基本信息
批准号:61101225
项目类别:青年科学基金项目
资助金额:25.00
负责人:关欣
学科分类:
依托单位:天津大学
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:褚晶辉,白煜,轩秀巍,王俊峰,冯亚楠,蔡微,徐星,秦璐
关键词:
机器听觉音乐乐谱比对序列比对稀疏表示分类器音频内容分析
结项摘要

当前,迫切需要基于内容对海量、丰富的数字音乐资源进行有效定位、分析和检索,但相关系统性能的提升遭遇了音乐音频物理特征与语义内容脱节的瓶颈。因此,音乐音频与语义符号的比对研究是音乐内容分析、检索领域的关键研究问题之一。为此,本课题创新研究思路,拟将音乐音频信号的表示由声源端移至与认知直接相关的听觉端,尝试构建普遍适用于音乐音频各种声源的机器听觉系统,并结合欠定方程最小一范数凸优化的最新研究成果,为音乐音频语义符号比对提供新方法,以解决传统方法难以适应各种复杂多变音乐声源、音频事件,算法不稳定,过拟合等问题,从而达到有效提高音乐音频语义符号比对的准确度和精度的目的。本项目中机器听觉系统由听觉预处理、特征提取和分类判决构成开放式结构,还适用于其他基于内容的音频处理应用。相关研究成果将推动音乐音频内容定位、检索、交互式计算机虚拟乐器陪练、计算机伴奏系统、音乐评价系统等方面的研究。

项目摘要

本课题开展的音乐音频与语义符号比对的研究是音乐内容分析、检索领域的关键研究问题之一,旨在突破音乐音频底层物理特征与语义内容脱节的瓶颈,以期最终实现基于内容对海量、丰富的数字音乐资源进行有效定位、分析和检索。鉴于传统比对方法存在难以适应复杂多变音乐声源、音频事件,算法不稳定,过拟合等问题,本课题采用新的研究思路,将对音乐音频信号的表示由声源端移至与认知直接相关的听觉端,构建了普遍适用于音乐音频各种声源的机器听觉系统,其中结合了借鉴人类认知过程中神经元开启机制的稀疏表示分类方法,为音乐音频语义符号比对提供了新的框架和方法。课题组成员首先深入研究了听觉端音乐音频信号的听觉图像表示,提出了音乐音频的听觉图像特征提取方法,与传统的Mel频率倒谱系数图和时频表示图相比,从听觉图像中提取出的特征,能更好的区分表征音乐语义内容的不同流派及和弦。其次,我们将音乐音频语义符号比对问题归结为以拍点为识别单位的音乐音频语义内容的分类识别问题,提出了基于稀疏表示分类器的和弦识别方法。我们的研究结果表明稀疏表示分类器在和弦识别上较常用的模板匹配方法高2.7%,进一步结合音频的听觉图像特征,取得了较同样考虑了听觉特性的Mel频率倒谱系数图像特征更高的识别率。此外,围绕核心比对问题,我们还提出了基于最大最小距离法的音乐音频节拍跟踪方法,提出了音乐音频多重字典稀疏表示方法,提出了音乐音频中偏差语义内容的检测方法,提出了适合多种乐器的和弦特征提取方法等。本课题中机器听觉系统由听觉预处理、特征提取和分类判决构成开放式结构,还适用于其他基于内容的音频处理应用。相关研究成果将推动音乐音频内容定位、检索、交互式计算机虚拟乐器陪练、计算机伴奏系统、音乐评价系统等方面的研究。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

路基土水分传感器室内标定方法与影响因素分析

路基土水分传感器室内标定方法与影响因素分析

DOI:10.14188/j.1671-8844.2019-03-007
发表时间:2019
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021

关欣的其他基金

批准号:40261004
批准年份:2002
资助金额:19.00
项目类别:地区科学基金项目
批准号:49761004
批准年份:1997
资助金额:11.00
项目类别:地区科学基金项目
批准号:71303225
批准年份:2013
资助金额:19.00
项目类别:青年科学基金项目

相似国自然基金

1

基于稀疏语义表示的大规模图像分类问题研究

批准号:61262050
批准年份:2012
负责人:李波
学科分类:F0210
资助金额:46.00
项目类别:地区科学基金项目
2

基于压缩域听觉谱的音频分类与检索算法研究

批准号:60872115
批准年份:2008
负责人:余小清
学科分类:F0111
资助金额:26.00
项目类别:面上项目
3

基于微词汇语义与时空、音频特征融合的视频内容分类算法研究

批准号:61071153
批准年份:2010
负责人:蒋兴浩
学科分类:F0113
资助金额:38.00
项目类别:面上项目
4

基于稀疏表示和超图的视频事件语义分析方法研究

批准号:61170126
批准年份:2011
负责人:詹永照
学科分类:F0209
资助金额:55.00
项目类别:面上项目