本项目基于语音、语言处理技术的最新进展,在已有研究成果的基础上,开展语音识别中若干关键问题的研究。主要包括:1、在语音识别系统中充分利用词法、句法、语义等较高层次的语言学知识,集成多层语言学知识构建语言模型;2、在加权有限状态转换器(WFST)框架下,实现多层语言模型的合并与优化,使各层模型充分利用其它层模型提供的语言学信息,有效克服传统自然语言分层串行处理引起的错误累积;3、在语音识别解码阶段,利用WFST实现声学模型和语言模型的结合,从而给出性能优异的一个语音识别全局解码算法。本研究可为在语音识别中引入高层语言学知识以及融合声学模型和语言模型的高效全局解码算法,提出新的思路和方法。同时,为提高语音识别系统性能,以及推动高度自然、便捷的人机交互技术的发展做出积极贡献。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
多语言语音识别声学建模理论和容错识别新方法研究
基于发音特征的汉语语音识别分层解码方法研究
基于语言学特征的多语言自动语音识别方法研究
面向小数据语音建模的跨语言迁移学习研究