基于听觉感知模型的说话人识别和语音语种识别新方法研究

基本信息
批准号:60572083
项目类别:面上项目
资助金额:23.00
负责人:刘加
学科分类:
依托单位:清华大学
批准年份:2005
结题年份:2008
起止时间:2006-01-01 - 2008-12-31
项目状态: 已结题
项目参与者:扈旻,刘长娥,钟山,李曜,路向峰,孟莎,李科,宋辉,侯韬
关键词:
说话人识别内耳神经模型听觉感知计算模型语种识别
结项摘要

本项目结合内耳听神经计算模型、听觉感知理论、说话人识别和语种识别技术进行创新性研究,提高噪声环境下,电话语音说话人识别和语种识别系统的性能。这也是目前国际上语音技术研究发展的重要方向之一。本项目主要包括8个方面的研究内容:(1)基于内耳听神经分析机理和听感知计算模型的特征参数提取方法。(2)语音中长时(高层)信息特征提取方法以及在说话人识别和语种识别系统中的建模方法。(3)新型稳健(抗噪)说话人识别模型和语种识别模型。(4)说话人切分和说话人聚类算法。(5)说话人识别和语种识别可信测度和拒识模型。(6)针对环境因素说话人识别模型、语种识别模型、语言模型的无监督快速自适应方法。(7)结合关键词和音素识别的语种识别算法。(8)决策阶段并行处理算法与信息融合处理模型。结合以上的研究成果实现针对电话语音的说话人识别和语种识别系统,并在实际环境中进行检验。该研究具有重大的理论意义和应用价值。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

刘加的其他基金

批准号:61273268
批准年份:2012
资助金额:83.00
项目类别:面上项目
批准号:60272016
批准年份:2002
资助金额:24.00
项目类别:面上项目
批准号:69772020
批准年份:1997
资助金额:10.00
项目类别:面上项目
批准号:60776800
批准年份:2007
资助金额:28.00
项目类别:联合基金项目
批准号:69975007
批准年份:1999
资助金额:12.00
项目类别:面上项目

相似国自然基金

1

听觉计算模型及其在说话人识别中的应用

批准号:69635020
批准年份:1996
负责人:迟惠生
学科分类:F0605
资助金额:60.00
项目类别:重点项目
2

噪声和短语音条件下的说话人识别

批准号:61370034
批准年份:2013
负责人:张卫强
学科分类:F0605
资助金额:82.00
项目类别:面上项目
3

基于因子分析的会话语音说话人识别研究

批准号:11504406
批准年份:2015
负责人:杨琳
学科分类:A2305
资助金额:24.00
项目类别:青年科学基金项目
4

基于电话语音的维吾尔语说话人识别研究

批准号:61063024
批准年份:2010
负责人:吾守尔·斯拉木
学科分类:F0211
资助金额:28.00
项目类别:地区科学基金项目