跨语言信息检索中的机器翻译研究

基本信息
批准号:61173100
项目类别:面上项目
资助金额:55.00
负责人:黄德根
学科分类:
依托单位:大连理工大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:马建军,李丽双,周惠巍,冯秋香,浑洁絮,王晔,杨田,佟德琴,刘钦
关键词:
功能短语机器翻译可嵌套模板函数跨语言检索
结项摘要

互联网信息在全球范围共享的主要障碍是多语言问题,跨语言信息检索(CLIR)是解决该问题的有效方法之一。但是,现有的跨语言信息检索的精确率过低,没有达到实用的水平,提高跨语言信息检索系统性能的关键是提高检索语句的翻译精度。本项目从中英文两种语言的信息检索入手,研究跨语言信息检索中机器翻译的若干关键技术。针对跨语言信息检索及机器翻译的特点,从三个方面提高机器翻译的精确率:一是考虑从单语检索结果中提取出检索语句本身的多种词法信息,为检索语句的翻译提供细粒度词法信息,从而提高检索语句的翻译精度;二是提出一种融合短语结构和句法功能的功能短语,把对翻译要素的考虑提前到句法分析阶段,提高句法结构歧义的消歧率和机器翻译的精确率;三是提出可嵌套模板函数和统计方法等多模型结合的机器翻译方法,提高含复杂结构的句子或短语的翻译精度。其中,后两种方法对一般机器翻译的研究也具有重要意义和应用价值。

项目摘要

围绕跨语言信息检索中机器翻译的若干关键问题展开了深入研究,主要研究内容包括汉语自动分词与词法分析、跨语言信息检索的语言资源建设、短语识别算法、双语命名实体和术语的自动挖掘、机器翻译模型研究等相关研究。取得研究结果:(1)提出了一种新的句法结构歧义消解方法,将英汉机器翻译中的英语句法结构歧义转化为功能名词短语的识别,并提出一种统计与规则结合的功能名词短语识别方法;(2)提出了统计与规则融合的系列算法,并在名词短语识别、双语命名实体挖掘、时间表达式识别、模糊限制信息检测、新词识别等自然语言处理任务上获得了较优的实验结果;(3)提出了一种基于汉字与音节转换概率的音译算法,建立了汉英双向音译模型,并将音译模型和基于短语的统计机器翻译融合,显著提高了复杂结构短语和句子的翻译精度。研究结果表明:功能名词短语应用到机器翻译领域,可以消除部分复杂名词短语的结构歧义,从而达到提高现有机器翻译系统性能的目的。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

病毒性脑炎患儿脑电图、神经功能、免疫功能及相关因子水平检测与意义

病毒性脑炎患儿脑电图、神经功能、免疫功能及相关因子水平检测与意义

DOI:10.13210/j.cnki.jhmu.20190508.001
发表时间:2019
2

基于MCPF算法的列车组合定位应用研究

基于MCPF算法的列车组合定位应用研究

DOI:
发表时间:2016
3

骨外器官来源外泌体对骨骼调控作用的研究进展

骨外器官来源外泌体对骨骼调控作用的研究进展

DOI:10.13376/j.cbls/2021092
发表时间:2021
4

融合字符串特征的维吾尔语形态切分

融合字符串特征的维吾尔语形态切分

DOI:
发表时间:2022
5

我国哮喘病患者可避免住院现状分析

我国哮喘病患者可避免住院现状分析

DOI:
发表时间:2020

黄德根的其他基金

批准号:61672127
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:U1936109
批准年份:2019
资助金额:70.00
项目类别:联合基金项目

相似国自然基金

1

基于双语文档反馈的跨语言信息检索研究

批准号:60873105
批准年份:2008
负责人:齐浩亮
学科分类:F0211
资助金额:34.00
项目类别:面上项目
2

维吾尔、哈萨克、柯尔克孜文跨语言信息检索技术研究

批准号:61262063
批准年份:2012
负责人:维尼拉·木沙江
学科分类:F0211
资助金额:46.00
项目类别:地区科学基金项目
3

基于互连网络环境的汉英跨语言信息检索研究

批准号:69983009
批准年份:1999
负责人:杜林
学科分类:F0211
资助金额:12.00
项目类别:专项基金项目
4

面向资源不对等语言对的个性化深度跨语言信息检索研究

批准号:61876062
批准年份:2018
负责人:周栋
学科分类:F0606
资助金额:64.00
项目类别:面上项目