面向海量语音信息处理的垃圾过滤和数据选择方法研究

基本信息
批准号:61005019
项目类别:青年科学基金项目
资助金额:21.00
负责人:张卫强
学科分类:
依托单位:清华大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:何亮,栗志意,李曜,邓妍,单煜翔,钱彦旻,袁桦,陈红红,陈谐
关键词:
说话人识别海量数据垃圾过滤语种识别数据选择
结项摘要

本项目结合语种识别和说话人识别的具体应用,针对海量语音数据垃圾过滤和数据选择问题进行创新研究,这既是目前国际上重要的研究热点,也是语音信息处理系统推向实用化的核心技术。本项目主要包括8个方面的研究内容:(1)结合信号处理和统计模式识别方法,研究稳健的垃圾数据的过滤技术。(2)针对不同信道情况,研究高效的噪声消除算法。(3)研究复杂信道条件下稳健的端点检测处理技术。(4)结合因子分析技术研究说话人分割和聚类算法。(5)结合先验知识研究语种分割和聚类算法。(6)研究垃圾数据干扰说话人识别的机理,从理论上探索说话人识别依赖严重预处理的根源。(7)研究不同类型语音对说话人识别的影响,对说话人识别的数据选择提供理论指导。(8)研究数据选择算法,去除大量重复的和无代表性的数据。通过以上研究成果,大大提高复杂环境和实际应用条件下语种识别和说话人识别准确率和稳健性。该研究具有重大的理论意义和应用价值。

项目摘要

本项目结合语种识别和说话人识别的具体应用,针对海量语音数据垃圾过滤和数据选择问题进行创新研究,探究前端不同类型数据对后端特征提取和模型训练造成影响的本质,完善各种数据预处理算法的性能,提高复杂信道和实际应用条件下语种识别和说话人识别系统的识别率和稳健性。整个研究按计划进行,按质按量地完成了本项目的研究工作。研究中获得多项有价值的成果:(1)研究稳健的垃圾数据的过滤技术,结合信号处理和统计模式识别方法,构建了一种高效的垃圾过滤系统,可快速准确过滤电话中的拨号音、提示音、传真、彩铃音乐等垃圾信号。(2)研究高效的噪声消除算法,对比了维纳滤波和Mel域维纳滤波,结果表明Mel域维纳滤波在噪声条件下可以提高说话人识别的性能。(3)研究复杂信道条件下稳健的端点检测处理技术,提出一种基于交叉熵顺序统计滤波的语音端点检测算法,提高了端点检测的稳健性。(4)研究说话人分割和聚类算法,提出一种基于K均值和因子分析的说话人分割聚类算法,改善了说话人分割聚类的性能。 (5)结合先验知识研究语种分割和聚类算法,提出一种联合语种识别的新型连续语音识别算法,可以在语音识别的同时高效地进行语种的分割和识别。(6)研究垃圾数据干扰说话人识别的机理,发现了语音在每个高斯分量上呈现一种“随机”分布,而噪声却集中在少数的高斯分量上,基本摸清了噪声影响说话人识别的本质,为后续研究奠定了基础。(7)研究不同类型语音对说话人识别的影响,对辅音进行筛选,去除无益于说话人识别的干扰辅音音素,去除静音干扰音,从而实现对语音的择优选取,提高了说话人识别的性能。(8)研究数据选择算法,提出了一种两阶段的音位特征选择算法,提高了语种识别的性能。通过以上研究成果,大大提高复杂环境和实际应用条件下语种识别和说话人识别准确率和稳健性。. 采用本项目成果,构建了面向海量数据的垃圾过滤系统一套,该系统2013年参加国内某单位的招标评测,电话语音垃圾过滤准确率达99.67%,在四家国内知名单位中排名第一。采用本项目成果,构建说话人识别系统,2012年参加NIST说话人评测,在全世界58家参赛单位中,带噪电话语音核心测试排名第五。. 在本项目研究过程中,发表或录用期刊论文24篇(其中SCI论文7篇)、会议论文21篇、书籍章节1篇,申请国家发明专利3项,培养博士研究生9名,硕士研究生4名。各项指标超过项目计划要求。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018

张卫强的其他基金

批准号:U1836219
批准年份:2018
资助金额:249.00
项目类别:联合基金项目
批准号:41807233
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:61370034
批准年份:2013
资助金额:82.00
项目类别:面上项目

相似国自然基金

1

基于群学习的移动垃圾语音过滤模型研究

批准号:61001070
批准年份:2010
负责人:王非
学科分类:F0102
资助金额:23.00
项目类别:青年科学基金项目
2

层次化海量图像型垃圾邮件过滤体系中的关键问题研究

批准号:61171193
批准年份:2011
负责人:严寒冰
学科分类:F0116
资助金额:60.00
项目类别:面上项目
3

面向海量体数据的高清绘制方法研究

批准号:61070114
批准年份:2010
负责人:梁荣华
学科分类:F0214
资助金额:32.00
项目类别:面上项目
4

面向电信海量数据的群体关系数据挖掘研究

批准号:60402011
批准年份:2004
负责人:吴斌
学科分类:F0113
资助金额:20.00
项目类别:青年科学基金项目