基于内容的跨语言语音检索方法研究

基本信息

批准号：60776800

项目类别：联合基金项目

资助金额：28.00

负责人：刘加

学科分类：

依托单位：清华大学

批准年份：2007

结题年份：2010

起止时间：2008-01-01 - 2010-12-31

项目状态：已结题

项目参与者：王海林,孟莎,李曜,钟山,宋辉,何亮,邓研,单煜翔,张卫强

关键词：

非结构化信息检索语音文档检索跨语言信息检索多语种语音识别

结项摘要

随着互联网的迅速发展和普及，网络上的各种音频数据急剧增加，基于内容的跨语言语音检索方法将成为新一代网络搜索引擎和音频检索的核心技术。本课题主要针对汉语和英语进行基于内容的跨语言语音检索技术的创新性研究，重点包括8个方面内容：（1）针对汉英双语检索的高性能稳健语音识别技术；（2）用于语音检索的中英文混合的文档索引和检索技术；（3）汉语和英语语音关键词检测技术；（4）音频分段、分类与聚类算法以及说话内容主题分析；（5）针对汉英双语的查询扩展技术和文档扩展技术；（6）语音文档相似度分析技术和语义分析技术；（7）基于多模型的信息融合和检索结果的排序方法；（8）多语种识别和固定音频检索方法。本课题困难在于如何有效地将语音识别、语义分析和信息检索技术相融合构建出统一框架进行基于内容的信息检索。研究中将以大规模的广播语音库、电话语音库、会议录音库作为训练和评价资源库。该研究具有重大的理论意义和应用价值。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：2020

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：

发表时间：2021

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

刘加的其他基金

批准号：61273268

批准年份：2012

资助金额：83.00

项目类别：面上项目

批准号：60272016

批准年份：2002

资助金额：24.00

项目类别：面上项目

批准号：69772020

批准年份：1997

资助金额：10.00

项目类别：面上项目

批准号：60572083

批准年份：2005

资助金额：23.00

项目类别：面上项目

批准号：69975007

批准年份：1999

资助金额：12.00

项目类别：面上项目

相似国自然基金

基于分层语言模型的蒙古语跨语言检索的Rerank方法研究

批准号：61063017

批准年份：2010

负责人：侯宏旭

学科分类：F0211

资助金额：8.00

项目类别：地区科学基金项目

面向汉语-泰语跨语言新闻事件检索方法研究

批准号：61462054

批准年份：2014

负责人：王红斌

学科分类：F0211

资助金额：45.00

项目类别：地区科学基金项目

基于双语文档反馈的跨语言信息检索研究

批准号：60873105

批准年份：2008

负责人：齐浩亮

学科分类：F0211

资助金额：34.00

项目类别：面上项目

基于端到端的多语言语音内容与语言种类联合识别技术的研究

批准号：61901466

批准年份：2019

负责人：徐及

学科分类：F0117

资助金额：25.00

项目类别：青年科学基金项目

基于内容的跨语言语音检索方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

基于改进LinkNet的寒旱区遥感图像河流识别方法

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

信息熵-保真度联合度量函数的单幅图像去雾方法

刘加的其他基金

多语言语音识别声学建模理论和容错识别新方法研究

高鉴别特性的汉语非特定人连续语音识别声学模型研究

稳健（抗噪）语音识别新方法研究

基于听觉感知模型的说话人识别和语音语种识别新方法研究

语音识别可信测度和拒识模型新方法研究

相似国自然基金