语音识别产品不同于实验室演示系统,能否走向实用取决于在实际应用条件下,满足用户的实际需求。首先,训练集语音样本必须符合使用时的实际应用条件,也就是在预计使用群体(不同年龄和性别,各种口音)中按预计使用环境(各种电话类型和噪音环境)进行训练集的语音样本收集。收集样本充分覆盖实际应用条件的方方面面。建立语音识别声学模型分三个基本部分:特征抽取、模式化分和时间对准。对于我们选取的语音特征参数,需要能够将各类样本的特征参数点完全划分开。对于模式划分,我们需要在混合高斯分布(GMM)计算最大似然值(ML)和K近邻法进行比较。对于时间对准,目前还不够完善,需要认真探索解决。为了认证这一途径的正确性,我们选择0-9十个数字加上*和#所有电话机上的十二个键作为语音识别系统的识别字表,在实际应用条件下,识别率至少达到99%以上,使做成语音识别产品时真正能够走向实用。本项目着重研究实用语音识别系统的关键技术。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
基于全模式全聚焦方法的裂纹超声成像定量检测
实用专家系统
属性加密实用化关键技术研究
声母和韵母切分的汉语语音识别研究
随机大系统在非李氏意义下的实用稳定性与实用镇定