随着互联网的迅速发展和普及,网络上的各种音频数据急剧增加,基于内容的跨语言语音检索方法将成为新一代网络搜索引擎和音频检索的核心技术。本课题主要针对汉语和英语进行基于内容的跨语言语音检索技术的创新性研究,重点包括8个方面内容:(1)针对汉英双语检索的高性能稳健语音识别技术;(2)用于语音检索的中英文混合的文档索引和检索技术;(3)汉语和英语语音关键词检测技术;(4)音频分段、分类与聚类算法以及说话内容主题分析;(5)针对汉英双语的查询扩展技术和文档扩展技术;(6)语音文档相似度分析技术和语义分析技术;(7)基于多模型的信息融合和检索结果的排序方法;(8)多语种识别和固定音频检索方法。本课题困难在于如何有效地将语音识别、语义分析和信息检索技术相融合构建出统一框架进行基于内容的信息检索。研究中将以大规模的广播语音库、电话语音库、会议录音库作为训练和评价资源库。该研究具有重大的理论意义和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
低轨卫星通信信道分配策略
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
基于分层语言模型的蒙古语跨语言检索的Rerank方法研究
面向汉语-泰语跨语言新闻事件检索方法研究
基于双语文档反馈的跨语言信息检索研究
基于端到端的多语言语音内容与语言种类联合识别技术的研究