随着信息化时代的到来,越来越多的语音信息以数据库的形式保存下来,如何在其中快速准确地查找到用户感兴趣的内容,实现按语音内容的信息检索,已成为多媒体处理领域的研究热点之一。语音检索是一个未成熟的且极具潜力的研究领域,还存在很多问题需要解决。本项目将根据汉语语音的特点,以及目前汉语语音检索研究中存在的不足,以基于子词网格的汉语语音检索技术为切入点,深入研究其中的若干关键问题,包括:汉语语音检索中子词基元的选择、有效通用的混合索引策略、索引结构的精细处理,以及实现高效可靠的置信测度等。通过研究,力求在上述关键技术上获得突破,为汉语语音检索的实用化提供理论和方法。.语音检索技术可广泛用于对广播/电视、会议记录、语音邮件、电话录音等包含语音信息的多媒体文档进行基于内容的检索、审查和有效监控;它也是数字图书馆中实现音频信息检索的重要技术之一。开展语音检索技术的研究具有重要的理论意义和实用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
环境信息披露会影响分析师盈余预测吗?
国际比较视野下我国开放政府数据的现状、问题与对策
水文水力学模型及其在洪水风险分析中的应用
基于体素化图卷积网络的三维点云目标检测方法
复杂环境下语音数据的说话人识别及关键词检索
复杂环境下语音数据的说话人识别及关键词关联检索
面向连续语音的哈萨克语关键词识别技术研究
汉语耳语音感知中关键技术研究