本课题从提高语音识别技术的实用性出发,根据语音识别领域的发展趋势,针对口语语音的特殊性,系统深入地研究:1)口语语音中非语音信息的分类规则和检测方法,分析其时频特征与语音信号时频特征的区别,寻找关键的区分特征;2)填音及人为非语音行为信息(呼吸声、咳嗽声、笑声、掌声、喧闹声等)的声学模型研究,这些信息对语音识别性能有重要影响;3)非语音信号与语音信号(声学模型)在辩识方面的相互影响分析,并寻找相应的处理对策;4)计算听觉场景分析方法在语音识别中的应用方法研究。.该项目的研究内容是国家自然科学基金鼓励研究内容,也是人工智能技术的重要研究内容,理论上极具挑战性,是语音识别领域的关键问题之一。在应用上,对改善人机界面的友善性、提高人机交互的人性化,促进政府信息服务自动化、语音信息接入设备及系统、银行、交通信息咨询自动服务系统、多媒体监控系统等的推广,加快我国信息产业的发展有重要作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展
基于改进LinkNet的寒旱区遥感图像河流识别方法
长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移
信息熵-保真度联合度量函数的单幅图像去雾方法
汉语自动语音识别的语音导引特征的提取
汉语连续语音识别的声学语音学模型研究
语音识别可信测度和拒识模型新方法研究
基于现代语音处理技术的中医声诊信息自动识别的研究