面向新疆少数民族汉语语言学习的自动发音错误检测方法的研究

基本信息

批准号：60965002

项目类别：地区科学基金项目

资助金额：24.00

负责人：黄浩

学科分类：

依托单位：新疆大学

批准年份：2009

结题年份：2012

起止时间：2010-01-01 - 2012-12-31

项目状态：已结题

项目参与者：于清,艾山·吾买尔,赵丹,买合木提,哈力丹,刘建明

关键词：

新疆双语教学语音识别发音错误检测语言学习

结项摘要

加快新疆少数民族双语教学是促进新疆人才和经济发展的重要因素。本课题将面向连续语音的口语发音检测方法应用于新疆少数民族的汉语交互式语言学习中，利用语音学、语言学的研究成果，对母语非汉语的少数民族汉语学习者的口语发音错误进行分析。针对发音规则设计语料文本并采集语音数据，对数据进行详细的发音质量的标注。通过人工总结或统计学习的方法对少数民族汉语学习者容易产生的错误建立混淆规则。建立完整的语音识别系统，将混淆规则与语音识别结合起来，有效地检测音素、音调的正确度。在少数民族的汉语发音库的基础上建立发音检测的细分声学模型以获得更为精确的检测结果；研究利用音位学属性的自动标注，分析说话人发音音位变化并与正确的音位特征进行比较，给出发音器官运动方式的正确指导。通过实验验证所提出的方法并进行分析，得到自动发音检测应用中语音识别的新方法和新见解，并建立接近实用的面向少数民族汉语语言学习的发音错误检测系统。

项目摘要

在数据采集方面：针对新疆维吾尔族说话人的汉语发音水平和熟练度，确定了朗读文本，朗读文本包括单字、词以及短句。并在此基础上针对不同说话人继续进行语音库的扩充。目前为止，针对维吾尔族成人说话人的发音错误检错任务，录制了刚在我校二、三年级大学生维吾尔族大学生(民考民)发音数据库，目前共男女共150人数据。邀请富有标注经验的专家对非标准数据进行了人工标注，得到了各个音素段的音素发音、声调发音的缺陷、错误，整句的流畅度标注结果。..编写建立发音错误检错的基线实验系统平台，包括根据朗读文本强制对齐获得音素的起止时间，计算声学模型得分和声调模型以及音素与声调的后验概率等，并综合各种模型得分获得最终的音素、声调检错结果。在针对字、词、短句的数据上进行了声母、韵母、声调的检错实验，进行了全局门限和分音素独立门限的选取实验。根据目前已经有的模型以及检错算法，编写了基于Windows平台的发音错误检测的演示程序，能够与用户进行直接交互，对用户的语音输入字、词、短句进行检错。..为了提高发音错误检测系统的性能，提出一种声学模型的区分性训练方法。该方法将发音错误检测的F1值的最大化作为模型参数的训练准则。采用Sigmoid 函数对值函数进行平滑构造目标函数，并利用构造弱意义辅助函数的方法以及扩展Baum-Welch形式的参数更新公式进行优化。提出在模型参数更新与音素门限同时优化的策略保证目标函数增长的单调性。发音错误检测实验表明该方法能够有效地增大训练和测试数据检错的F1值。同时训练数据和测试数据上的精确度、召回率以及检测正确度都有明显改进。..对基于语音识别任务的lattice中区分性的模型组合进行了研究。上下文相关的区分性模型组合已经显示了其有效性，但其局限在于引入大的模型权重参数集，在数据有限时容易导致区分性权重训练过拟合。针对该问题，提出利用决策树进行上下文建模，采用最小音子错误准则构建决策树以获得最优上下文相关权重参数集。通过评估目标函数的一阶近似增量来加速最优问题集的选择，并利用精细问题集来获得更好的声学区分能力。基于多模型组合的语音识别实验表明，该方法能够增强权重训练对过拟合的鲁棒性。..报告还对新疆维吾尔族说话人的汉语发音词典以及在语音识别中的自适应研究、基于区分性准则的特征变换进行了简要阐述。报告最后对项目期间参与的国内外学术交流以及人才培养情况进行了总结。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.3969/j.issn.1000-4440.2021.03.031

发表时间：2021

黄浩的其他基金

批准号：40706042

批准年份：2007

资助金额：18.00

项目类别：青年科学基金项目

批准号：41905019

批准年份：2019

资助金额：27.00

项目类别：青年科学基金项目

批准号：81173099

批准年份：2011

资助金额：40.00

项目类别：面上项目

批准号：81660595

批准年份：2016

资助金额：36.50

项目类别：地区科学基金项目

批准号：41872036

批准年份：2018

资助金额：65.00

项目类别：面上项目

批准号：81803493

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：60273077

批准年份：2002

资助金额：22.00

项目类别：面上项目

批准号：81902582

批准年份：2019

资助金额：21.00

项目类别：青年科学基金项目

批准号：61663044

批准年份：2016

资助金额：42.00

项目类别：地区科学基金项目

批准号：31900703

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：61365005

批准年份：2013

资助金额：45.00

项目类别：地区科学基金项目

批准号：51408081

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：61502347

批准年份：2015

资助金额：21.00

项目类别：青年科学基金项目

批准号：81760247

批准年份：2017

资助金额：34.00

项目类别：地区科学基金项目

批准号：41102007

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

相似国自然基金

发音错误自动检测方法的研究及其在语言学习中的应用

批准号：60772165

批准年份：2007

负责人：王岚

学科分类：F0111

资助金额：25.00

项目类别：面上项目

面向拉萨语的自动发音错误检测方法研究

批准号：61250012

批准年份：2012

负责人：欧珠

学科分类：F0605

资助金额：20.00

项目类别：专项基金项目

成年聋人发音错误检测中的语音学特征方法研究

批准号：61005020

批准年份：2010

负责人：刘明辉

学科分类：F0605

资助金额：19.00

项目类别：青年科学基金项目

基于语义分析的汉语文本错误自动侦测与纠错方法

批准号：61070119

批准年份：2010

负责人：张仰森

学科分类：F0211

资助金额：33.00

项目类别：面上项目

面向新疆少数民族汉语语言学习的自动发音错误检测方法的研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于国产化替代环境下高校计算机教学的研究

基于改进LinkNet的寒旱区遥感图像河流识别方法

二维FM系统的同时故障检测与控制

现代优化理论与应用

黄曲霉毒素B1检测与脱毒方法最新研究进展

黄浩的其他基金

海岛生态安全对城市化的响应-以厦门岛及其周边岛屿为例

基于最优化理论的双偏振雷达台风降雨反演技术研究

一种干预沙眼衣原体持续性感染的新模式：黄芩苷影响下的CPAF作用途径及关联效应

虎耳草抗金黄色葡萄球菌活性成分分析及其诱导耐药性的基因组与蛋白组学研究

滇西昌宁-孟连带石炭-二叠纪䗴类之生物地层与古地理分析

基于MRM靶向定量的蛋白分析技术在疾病生物标志物精准检测中的应用——以chemerin为例

一种新型超高密度磁、光混合记录关键技术研究

超级增强子介导lncRNA-PCSE1促进前列腺癌转移的机制研究

基于无监督学习方法的口语理解与人机对话行为研究

ICK调控少突胶质细胞发育的机制研究

口语对话系统技术在自由表述语言学习中的应用研究-以新疆少数民族学生的普通话学习为例

穿斗式木结构抗震机理及抗震加固方法研究

大数据环境下稀有类数据挖掘研究

EphB3通过鸟嘌呤核苷酸交换因子调控癫痫发生及其分子细胞机制研究

滇西保山地块二叠纪蜓类的古生物地理学研究

相似国自然基金