深入、系统开展面向语音识别应用的汉语语音知识研究,其中包括:探索最适合表征声源PF、发音方式PF和发音位置PF的汉语辅音(声母)APs特征,进而实现汉语辅音的最佳分类,并应用于汉语语音流中声学建模单元Landmarks的标定,提高段模型汉语语音识别声学建模和解码搜索的精度和效率;系统、深入研究全路径模式表征方式的全局最优准则指导的段模型汉语语音识别方法,探索出一条更准确表征语音流发音规律、优于传统优化准则的统计语音识别方法的新途径,使基于段模型语音识别方法无论是在解码搜索、还是在声学建模等方面实现大的跨越,最终的集语音知识和全局最优准则指导的段模型汉语LVCSR系统的误识率比HMM系统至少下降20%,且系统能够达到实时响应。本项研究对于探索语音识别研究的新方法具有重要的学术价值、对于开发出在公众信息服务领域(如:通信、金融、娱乐、教育和互联网等)语音识别系统具有良好实用价值和广泛应用前景。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
拥堵路网交通流均衡分配模型
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于知识的汉语连续语音识别和理解
海上立体搜救全局最优化模型与知识库支持方法研究
基于Lattice的汉语语音主题分类方法研究
汉语连续语音识别的声学语音学模型研究