本项目结合内耳听神经计算模型、听觉感知理论、说话人识别和语种识别技术进行创新性研究,提高噪声环境下,电话语音说话人识别和语种识别系统的性能。这也是目前国际上语音技术研究发展的重要方向之一。本项目主要包括8个方面的研究内容:(1)基于内耳听神经分析机理和听感知计算模型的特征参数提取方法。(2)语音中长时(高层)信息特征提取方法以及在说话人识别和语种识别系统中的建模方法。(3)新型稳健(抗噪)说话人识别模型和语种识别模型。(4)说话人切分和说话人聚类算法。(5)说话人识别和语种识别可信测度和拒识模型。(6)针对环境因素说话人识别模型、语种识别模型、语言模型的无监督快速自适应方法。(7)结合关键词和音素识别的语种识别算法。(8)决策阶段并行处理算法与信息融合处理模型。结合以上的研究成果实现针对电话语音的说话人识别和语种识别系统,并在实际环境中进行检验。该研究具有重大的理论意义和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
基于SSVEP 直接脑控机器人方向和速度研究
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
听觉计算模型及其在说话人识别中的应用
噪声和短语音条件下的说话人识别
基于因子分析的会话语音说话人识别研究
基于电话语音的维吾尔语说话人识别研究