跨语言信息检索中的机器翻译研究

基本信息
批准号:61173100
项目类别:面上项目
资助金额:55.00
负责人:黄德根
学科分类:
依托单位:大连理工大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:马建军,李丽双,周惠巍,冯秋香,浑洁絮,王晔,杨田,佟德琴,刘钦
关键词:
功能短语机器翻译可嵌套模板函数跨语言检索
结项摘要

互联网信息在全球范围共享的主要障碍是多语言问题,跨语言信息检索(CLIR)是解决该问题的有效方法之一。但是,现有的跨语言信息检索的精确率过低,没有达到实用的水平,提高跨语言信息检索系统性能的关键是提高检索语句的翻译精度。本项目从中英文两种语言的信息检索入手,研究跨语言信息检索中机器翻译的若干关键技术。针对跨语言信息检索及机器翻译的特点,从三个方面提高机器翻译的精确率:一是考虑从单语检索结果中提取出检索语句本身的多种词法信息,为检索语句的翻译提供细粒度词法信息,从而提高检索语句的翻译精度;二是提出一种融合短语结构和句法功能的功能短语,把对翻译要素的考虑提前到句法分析阶段,提高句法结构歧义的消歧率和机器翻译的精确率;三是提出可嵌套模板函数和统计方法等多模型结合的机器翻译方法,提高含复杂结构的句子或短语的翻译精度。其中,后两种方法对一般机器翻译的研究也具有重要意义和应用价值。

项目摘要

围绕跨语言信息检索中机器翻译的若干关键问题展开了深入研究,主要研究内容包括汉语自动分词与词法分析、跨语言信息检索的语言资源建设、短语识别算法、双语命名实体和术语的自动挖掘、机器翻译模型研究等相关研究。取得研究结果:(1)提出了一种新的句法结构歧义消解方法,将英汉机器翻译中的英语句法结构歧义转化为功能名词短语的识别,并提出一种统计与规则结合的功能名词短语识别方法;(2)提出了统计与规则融合的系列算法,并在名词短语识别、双语命名实体挖掘、时间表达式识别、模糊限制信息检测、新词识别等自然语言处理任务上获得了较优的实验结果;(3)提出了一种基于汉字与音节转换概率的音译算法,建立了汉英双向音译模型,并将音译模型和基于短语的统计机器翻译融合,显著提高了复杂结构短语和句子的翻译精度。研究结果表明:功能名词短语应用到机器翻译领域,可以消除部分复杂名词短语的结构歧义,从而达到提高现有机器翻译系统性能的目的。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
3

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
4

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

DOI:10.5846/stxb202009292521
发表时间:2021
5

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

DOI:10.13249/j.cnki.sgs.2020.08.003
发表时间:2020

黄德根的其他基金

批准号:61672127
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:U1936109
批准年份:2019
资助金额:70.00
项目类别:联合基金项目

相似国自然基金

1

基于双语文档反馈的跨语言信息检索研究

批准号:60873105
批准年份:2008
负责人:齐浩亮
学科分类:F0211
资助金额:34.00
项目类别:面上项目
2

维吾尔、哈萨克、柯尔克孜文跨语言信息检索技术研究

批准号:61262063
批准年份:2012
负责人:维尼拉·木沙江
学科分类:F0211
资助金额:46.00
项目类别:地区科学基金项目
3

基于互连网络环境的汉英跨语言信息检索研究

批准号:69983009
批准年份:1999
负责人:杜林
学科分类:F0211
资助金额:12.00
项目类别:专项基金项目
4

面向资源不对等语言对的个性化深度跨语言信息检索研究

批准号:61876062
批准年份:2018
负责人:周栋
学科分类:F0606
资助金额:64.00
项目类别:面上项目