语音评价中的韵律建模和评价方法研究

基本信息
批准号:61305003
项目类别:青年科学基金项目
资助金额:26.00
负责人:李雅
学科分类:
依托单位:中国科学院自动化研究所
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:温正棋,车浩,王洋,刘斌,刘善峰,张冉,巢林林,张大伟,高廷丽
关键词:
韵律建模重音韵律评价语调语音评价
结项摘要

Despite of the great achievement in speech assessment in recent years, the evaluation objects are still limited to the pronunciation quality, vocabulary, fluency of speech, etc., and the assessment of speech prosody remains inadequate and incomplete due to the lack of effective prosody model and prosody assessment methods. However, one's language ability cannot be fully reflected without the prosody manipulation skill. As a matter of fact, prosody is more important in language communication. Based on a large-scale corpus, this project will investigate the prosody modeling and evaluation methods from aspects of auditory perception and its role in language communication. The major work of this project are exploring the stable and non-stable textual and acoustical features of Mandarin prosody; building a prosody-chunk based prosody phrase prediction model; constructing a hierarchical Mandarin stress model based stress detection and evaluation model and discovering the intonation pattern then proposing a similarity based intonation assessment method. With these achievements, this project will further propose an overall assessment method by integrating the prosodic phrase, stress and intonation models. This research could acquire a better understanding of prosody generation in human speech, which is of great scientific importance to the speech understanding and cognition, and also provide a theoretical and practical basis to the development of Computer-assisted language learning system, spoken language assessment, Text-to-Speech system etc.

由于目前语音评价中缺乏有效的韵律模型以及韵律评价方法,现有语音评价多局限于发音质量、词汇以及流利度等方面的评估,对语音中的韵律评估还不够完善,无法真实反映学习者的语言能力。针对该问题,本项目将从听觉感知角度入手,建立适用于语音评价的大规模韵律标注语料库,结合韵律在语言交流中的重要作用,深入探索语音评价中的韵律建模和评价方法。重点从文本特征和声学特征层面探讨韵律的稳定与非稳定性特征;建立基于韵律组块的韵律短语预测模型;构建基于层级重音模型的重音检测和评价方法;挖掘语调稳定模式并提出基于相似性的语调评价方法。在以上研究基础上提出融合韵律短语、重音和语调的非线性韵律整体评价算法。本项目将有助于加深人们对韵律加工过程的理解,对促进言语理解和认知的研究具有重要科学意义,也能为计算机辅助语言学习系统、口语评测、语音合成等研究提供必要的理论和实践基础。

项目摘要

本项目将从听觉感知角度入手,建立包含陈述、疑问、感叹等不同韵律表现力的大规模韵律标注语料库,深入研究了语音评价中的韵律建模和评价方法。重点在大语料库的基础上,从文本特征和声学特征层面研究了韵律的声学特征和表现;并建立融合句法结构的韵律短语预测模型,以及基于增强字向量的韵律短语预测模型;对汉语连续语流中的时长约束关系进行了分析建模,并采用极限学习机的方法提高了汉语时长预测模型的准确率;构建了基于层级重音模型的重音检测、生成和评价方法;挖掘陈述、疑问、感叹等不同语调模式的特征,在语气识别任务以及语气生成任务上进行了验证。本项目的研究成果将有助于加深人们对韵律加工过程的理解,对促进言语理解和认知的研究具有重要科学意义,也能为计算机辅助语言学习系统、口语评测、语音合成等研究提供必要的理论和实践基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

基于结构滤波器的伺服系统谐振抑制

基于结构滤波器的伺服系统谐振抑制

DOI:10.3788/OPE.20192708.1811
发表时间:2019
4

基于可拓学倾斜软岩巷道支护效果评价方法

基于可拓学倾斜软岩巷道支护效果评价方法

DOI:10.13545/j.cnki.jmse.2020.03.008
发表时间:2020
5

极区电离层对流速度的浅层神经网络建模与分析

极区电离层对流速度的浅层神经网络建模与分析

DOI:10.6038/cjg2022p0255
发表时间:2022

相似国自然基金

1

蒙古语语音合成中韵律建模方法的研究

批准号:60465001
批准年份:2004
负责人:呼和
学科分类:F0605
资助金额:21.00
项目类别:地区科学基金项目
2

面向语音合成的维吾尔语韵律特征及其建模方法研究

批准号:61063023
批准年份:2010
负责人:地里木拉提·吐尔逊
学科分类:F0211
资助金额:25.00
项目类别:地区科学基金项目
3

汉语TTS系统中的韵律建模新方法的研究

批准号:69875008
批准年份:1998
负责人:蔡莲红
学科分类:F0605
资助金额:11.00
项目类别:面上项目
4

第二语言韵律焦点产出、合成与评价的研究

批准号:61573187
批准年份:2015
负责人:陈莹
学科分类:F0605
资助金额:16.00
项目类别:面上项目