基于语流音变认知机理建模的语音识别研究

基本信息
批准号:61175019
项目类别:面上项目
资助金额:55.00
负责人:张劲松
学科分类:
依托单位:北京语言大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:解焱陆,曹文,曲波,侯玉霞,邹婷,张美娜,刘敏
关键词:
功能负载语流音变语音识别音位区分性听觉认知
结项摘要

语音是人类进行思想交流最便捷的工具。语音信号由音位(或其它基本声学单元如音节等)衔接而成,其中充满了因各种各样复杂原因导致的语流音变现象。根据音位是否变异可划分为"声学变化"和"音位变异"两大类。能否处理好这两类语流音变现象,是语音识别技术保持高识别精度、走向实用化的关键。本课题在充分分析当前汉语语音识别系统处理语流音变问题技术的基础上,提出从人脑处理语流音变现象的听觉机制出发,来研究更合理地处理语流音变现象的语音识别技术。具体研究内容包括:1.构建描述音位区分性的计算模型:该指标用来模拟先验的语言结构知识对于音位的词汇标志作用的影响。2. 不同颗粒度识别基元区分性的评价 ;3.基于音位区分性的发音识别词典;4.基于上述技术的识别系统构建和多任务测试。本课题对于语音识别技术研究、语流音变规律研究、语流音变的认知机制计算模型等研究有着重要的理论和实践意义。

项目摘要

语音是人类进行思想交流最便捷的工具,但充满了复杂的语流音变现象。我们提出探索人脑处理语流音变的听觉机制,进而研发符合人脑听觉机制的语音识别技术。具体内容包括:1.构建描述音位区分性的计算模型;2.探索语流中的音变特点以及人脑的听知觉加工机制;3.设计基于音位区分性和听知觉机制的语音识别新方法;4.应用研究。.关于音位区分性计算模型,我们提出了基于n-gram语言模型和候选词阵列的音位功能负载(FL)新算法,也是世界上第一个能够建模语境下音位区分重要性的量化算法。我们利用大规模语料库评价了所有声母、韵母、声调对立的FL,并与传统算法进行了对比。结果表明所提模型具有评价指标动态范围较小、稳定可靠的优点,并且还具有可跨语料库比较的独特优势。另外,我们又开展了基于FL的基元聚类和基于语音知觉聚类的比较研究,发现声母的两类聚类树呈现了语音刺激的物理区分性和信息承载重要性的高度一致性特点,为认知语言学的重要理论假设提供了一个量化佐证。.针对语流音变及听知觉机制问题,我们研究了语流的时长变化(节奏)、语流声调变化、协同发音和韵律边界的交互作用、前后鼻音韵母的知觉线索、声调的知觉线索、语谱中的嗓音特征效应、不同人群的听觉机制对比等问题。我们发现:汉语、日语及日本人汉语具有明显的时长节奏差异;阳平双音节词的斜率参数与重音、韵律边界有着显著关联;汉语相邻音节可以基于H&H理论假设来判断协同发音的强弱以及韵律边界的有无;鼻韵母的鼻化元音段含有对于汉语母语者来说最关键的听辨线索;阳平上声的知觉线索是音域的高低,前后调境对于被试的声调知觉有着重要且复杂的影响;语谱中含有丰富的嗓音信息,可以在音高特征缺失的时候有效帮助声调知觉;中日被试关于汉语声调、各种音段的知觉有着显著的差异等。.基于上述发现,我们研究了基于不同识别基元、发音词典的语音识别技术,又探索了基于节奏特征的语种识别、基于知觉关键线索landmark的语音识别新方法,在基于HMM或DNN的各种语音识别任务中都取得了性能改善。.除了传统的语音识别应用外,一些成果被应用到研发新的计算机辅助发音学习技术,包括发音偏误检测、知觉检测和知觉训练、节奏的自动评价等,取得了良好的应用价值。.发表论文42(EI/ISTP:17,其中期刊6,国际会议19,国内会议17),专利申请6(授权5),待发表论文及专利若干。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

伴有轻度认知障碍的帕金森病~(18)F-FDG PET的统计参数图分析

伴有轻度认知障碍的帕金森病~(18)F-FDG PET的统计参数图分析

DOI:10.3760/cma.j.issn.0376-2491.2018.33.004
发表时间:2018
4

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
5

针灸治疗胃食管反流病的研究进展

针灸治疗胃食管反流病的研究进展

DOI:
发表时间:2022

张劲松的其他基金

批准号:81571875
批准年份:2015
资助金额:60.00
项目类别:面上项目
批准号:91117012
批准年份:2011
资助金额:160.00
项目类别:重大研究计划
批准号:81772057
批准年份:2017
资助金额:56.00
项目类别:面上项目
批准号:40871106
批准年份:2008
资助金额:44.00
项目类别:面上项目
批准号:30872836
批准年份:2008
资助金额:31.00
项目类别:面上项目
批准号:30471371
批准年份:2004
资助金额:23.00
项目类别:面上项目
批准号:39900009
批准年份:1999
资助金额:13.00
项目类别:青年科学基金项目
批准号:39370723
批准年份:1993
资助金额:5.00
项目类别:面上项目
批准号:91317306
批准年份:2013
资助金额:200.00
项目类别:重大研究计划
批准号:90717005
批准年份:2007
资助金额:160.00
项目类别:重大研究计划
批准号:81470617
批准年份:2014
资助金额:73.00
项目类别:面上项目
批准号:31040025
批准年份:2010
资助金额:10.00
项目类别:专项基金项目
批准号:31771971
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:31101069
批准年份:2011
资助金额:20.00
项目类别:青年科学基金项目
批准号:31170648
批准年份:2011
资助金额:50.00
项目类别:面上项目
批准号:61602460
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:81270988
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:81870644
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:31530004
批准年份:2015
资助金额:273.00
项目类别:重点项目
批准号:30370130
批准年份:2003
资助金额:21.00
项目类别:面上项目

相似国自然基金

1

基于认知机理的情感语音识别基础研究

批准号:61371193
批准年份:2013
负责人:张雪英
学科分类:F0111
资助金额:78.00
项目类别:面上项目
2

基于电话语音的维吾尔语说话人识别研究

批准号:61063024
批准年份:2010
负责人:吾守尔·斯拉木
学科分类:F0211
资助金额:28.00
项目类别:地区科学基金项目
3

维吾尔语连续语音识别系统研究

批准号:69562001
批准年份:1995
负责人:王昆仑
学科分类:F0111
资助金额:6.00
项目类别:地区科学基金项目
4

混合口音语音识别中自适应分层发音变异模型研究

批准号:60975018
批准年份:2009
负责人:刘轶
学科分类:F0605
资助金额:27.00
项目类别:面上项目