面向高准确率语音转写的用户反馈学习与识别结果优化

基本信息

批准号：61202209

项目类别：青年科学基金项目

资助金额：22.00

负责人：王向东

学科分类：

依托单位：中国科学院计算技术研究所

批准年份：2012

结题年份：2015

起止时间：2013-01-01 - 2015-12-31

项目状态：已结题

项目参与者：钱跃良,赵希君,张博宁,张虹,王云芝,陈启华,杨阳

关键词：

语音识别自适应语音转写纠错语言模型

结项摘要

In this project, research on methods of user feed-back learning and recognition result refining for speech transcription systems will be conducted based on current work on error correction in speech recognition and computer-assisted speech transcription. In current systems, the achievement of high accuracy depends on manual error correction and is time-consuming when recognition error rates are high. This project will focus on the research of fast re-recognition based on user feed-back, automatic error correction based on repeated words matching, and on-line supervised language model adaptation using feed-back texts. With these techniques， a system will be developed which can learn from user's feedbacks and improve the performance continuously, resulting in high accuracy with little human interaction. Compared to current methods such as acoustic and languange model adaptation, the approaches proposed take advantages of information of user feed-backs and can achieve higher performance.

近年来，自动语音识别技术取得了长足进展，但面向真实场景的语音转写技术仍然无法满足应用需求。当前出现了一批融合用户反馈的语音识别系统，但这些系统只利用用户反馈信息进行错误修正，高准确率的取得完全依赖于人的操作，无法实现高效的语音转写。针对这一问题，本项目拟研究面向高准确率语音转写的用户反馈学习与识别结果优化方法，研究可融合非确定性反馈的反馈后快速重新识别、基于反馈历史的词汇学习和重复性错误自动修正、基于修正文本的语言模型自适应等关键技术，实现一种利用用户反馈信息不断学习和提高的语音识别系统：用户的每次修正反馈，都会影响当前句的识别结果，与用户修正的字相关联的错误可得到自动修正；同时，系统学习反馈涉及的词汇，调整内部模型，避免相似的错误再次发生。与当前已有的语音识别模型自适应方法相比，本项目研究的方法充分利用了用户反馈中包含的丰富信息，学习更有针对性，对识别性能的提升更为明显。

项目摘要

项目面向高准确率语音转写的需求，研究面向高准确率语音转写的用户反馈学习和识别结果优化方法，该方法充分利用用户的反馈信息进行识别结果的优化和系统内部模型的自适应学习，从而使系统在使用中不断提高，只需较少的人工反馈即可实现高准确率的语音转写。项目研究了可融合非确定性反馈的反馈后快速重新识别、基于反馈历史的词汇学习和重复性错误自动修正、基于修正文本的语言模型自适应三项关键技术，并实现了一个融合用户反馈的语音识别原型系统。在可融合非确定性反馈的反馈后快速重新识别方面，提出了融合非确定性反馈和音节混淆信息的词网格调整和重解码算法。算法可支持确定性和非确定性反馈，根据反馈信息对词网格进行调整并进行快速重解码，实现对候选列表的动态调整。通过快速重新识别，一方面可充分利用识别结果中上下文约束对非确定性反馈的结果进行排序和选择，另一方面基于已修正的部分对尚未修正的识别结果进行调整，得到更为优化的结果。在基于反馈历史的词汇学习和重复性错误自动修正方面，提出了基于快速模板匹配的词汇学习和重复性错误自动修正算法。算法结合自动识别和人工反馈，可将集外词加入识别系统词典并设置其语言模型概率；同时，还自动学习重复出现词的识别结果特征并在后续识别时进行快速匹配和自动纠错，从而避免同一个词被反复识别错误。在基于修正文本的语言模型自适应方面，研发了两种基于修正文本的“关联有监督”语言模型自适应技术，分别是基于修正文本融合预先训练的基于主题的语言模型的方法，以及基于修正文本及互联网语料扩充的语言模型自适应算法。与当前普遍采用的无监督自适应相比，避免了采用识别结果时存在的因识别错误导致预测主题出现偏差的问题，性能可得到较大幅度提升。以上述关键技术为基础，研发了一个融合用户反馈的语音识别系统。针对汉语的特点，首次采用了基于汉字候选列表的反馈方式和交互界面，辅助用户快速进行反馈和修正。系统集成了非确定性反馈处理、候选列表动态调整、词汇学习、重复词错误自动修正、语言模型自适应等算法，实现了一个可以方便接收用户反馈、并利用用户反馈不断学习和提高的语音转写系统。项目研发的算法和系统解决了已有方法存在的问题，具有重要的创新性和实用价值，达到了该研究方向的领先水平。相关成果可应用于语音输入法、语音识别、语音转写等系统中，具有重要的产业应用价值。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：

发表时间：2020

DOI：10.13973/j.cnki.robot.210412

发表时间：2022

王向东的其他基金

批准号：81670704

批准年份：2016

资助金额：61.00

项目类别：面上项目

批准号：40839904

批准年份：2008

资助金额：250.00

项目类别：联合基金项目

批准号：81170814

批准年份：2011

资助金额：58.00

项目类别：面上项目

批准号：50671027

批准年份：2006

资助金额：29.00

项目类别：面上项目

批准号：49602021

批准年份：1996

资助金额：10.00

项目类别：青年科学基金项目

批准号：81873409

批准年份：2018

资助金额：57.00

项目类别：面上项目

批准号：30870922

批准年份：2008

资助金额：32.00

项目类别：面上项目

批准号：81370881

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：51673004

批准年份：2016

资助金额：61.00

项目类别：面上项目

批准号：50878077

批准年份：2008

资助金额：35.00

项目类别：面上项目

批准号：30400495

批准年份：2004

资助金额：21.00

项目类别：青年科学基金项目

批准号：81270099

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：81570894

批准年份：2015

资助金额：57.00

项目类别：面上项目

批准号：40272004

批准年份：2002

资助金额：31.00

项目类别：面上项目

相似国自然基金

复杂环境下语音数据的目标识别与内容转写

批准号：U1736202

批准年份：2017

负责人：王岚

学科分类：F0605

资助金额：251.00

项目类别：联合基金项目

面向语音识别的抗噪支持向量机优化算法

批准号：61072087

批准年份：2010

负责人：张雪英

学科分类：F0113

资助金额：32.00

项目类别：面上项目

面向可穿戴用户行为识别的增量学习方法研究

批准号：61572471

批准年份：2015

负责人：陈益强

学科分类：F0209

资助金额：64.00

项目类别：面上项目

基于用户行为的搜索结果全页面优化研究

批准号：61902209

批准年份：2019

负责人：毛佳昕

学科分类：F0211

资助金额：24.00

项目类别：青年科学基金项目

面向高准确率语音转写的用户反馈学习与识别结果优化

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

二维FM系统的同时故障检测与控制

扶贫资源输入对贫困地区分配公平的影响

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

王向东的其他基金

NR4A1 通过上调Survivin、WT1及GPX1的表达以抵抗活性氧所致胰岛β细胞的凋亡

上扬子地区石炭纪碳酸盐岩（储层）分布规律与下伏不整合关系

生长激素信号降低与肥胖发生关系的分子机制研究

稀土Ce对钢铁锈层相形成和转化的作用机理研究

保山地区石炭纪珊瑚居群.种内变异及生物相研究

OPNr-PIK3CD通路调节AECOPD气道上皮细胞炎症和重塑的特异性作用和分子机制

生长激素受体的膜上酶解及其对信号传导的调节

NR4A1抵抗胰岛β细胞内质网应激所致细胞凋亡及相关分子机制研究

聚乳酸非均相结晶诱导CO2发泡的机理研究

混凝土初始损伤及损伤参数的尺寸效应研究

变应原Toll样受体识别和相关信号转导机制研究

骨桥蛋白在慢性阻塞性肺病急性发作期对PI3K-δ及IL-17F调控机理研究

TMEM16A对人鼻黏膜黏蛋白合成的调控机制研究

石炭、二叠纪柯坪珊瑚科的分类、演化及环境研究

相似国自然基金