本课题从提高语音识别技术的实用性出发,根据语音识别领域的发展趋势,针对口语语音的特殊性,系统深入地研究:1)口语语音中非语音信息的分类规则和检测方法,分析其时频特征与语音信号时频特征的区别,寻找关键的区分特征;2)填音及人为非语音行为信息(呼吸声、咳嗽声、笑声、掌声、喧闹声等)的声学模型研究,这些信息对语音识别性能有重要影响;3)非语音信号与语音信号(声学模型)在辩识方面的相互影响分析,并寻找相应的处理对策;4)计算听觉场景分析方法在语音识别中的应用方法研究。.该项目的研究内容是国家自然科学基金鼓励研究内容,也是人工智能技术的重要研究内容,理论上极具挑战性,是语音识别领域的关键问题之一。在应用上,对改善人机界面的友善性、提高人机交互的人性化,促进政府信息服务自动化、语音信息接入设备及系统、银行、交通信息咨询自动服务系统、多媒体监控系统等的推广,加快我国信息产业的发展有重要作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
低轨卫星通信信道分配策略
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理
汉语自动语音识别的语音导引特征的提取
汉语连续语音识别的声学语音学模型研究
语音识别可信测度和拒识模型新方法研究
基于现代语音处理技术的中医声诊信息自动识别的研究