基于语言理解的机器翻译方法研究

基本信息
批准号:60975053
项目类别:面上项目
资助金额:33.00
负责人:宗成庆
学科分类:
依托单位:中国科学院自动化研究所
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:周玉,鉴萍,张家俊,李茂西,刘鹏,夏睿,庄涛,汪昆,王志国
关键词:
机器翻译语言生成自然语言理解语义理解
结项摘要

本项目将针对目前统计机器翻译面临的几个关键问题:如何从双语语料中有效获取翻译知识的问题、如何在解码中快速搜索最优路径的问题和如何生成高质量的译文等问题,研究面向机器翻译的自然语言理解方法,建立基于自然语言理解的统计翻译新框架,有效提高机器翻译的译文质量。项目将在以下几个方面进行深入研究和探索:(1)充分借鉴和利用已有的语言知识资源,研究构建面向机器翻译的汉语动词知识库,提出面向机器翻译的源语言(以汉语为例)句法、语义一体化理解方法;(2)研究基于自然语言理解的统计机器翻译理论,建立语言知识与统计模型协调工作的机器翻译新方法;(3)针对译文(以英语为例)生成问题,建立基于源语言语义和目标语言语法双重约束下的译文生成方法;(4)提出基于领域划分的机器翻译模型自适应方法。本项目开展的研究工作具有重要的理论意义和应用价值。

项目摘要

本项目针对目前统计机器翻译面临的几个关键问题:如何从双语语料中有效获取翻译知识的问题、如何准确理解源语言句子的语义,并将语义知识融入翻译模型和如何改进翻译系统译文质量等问题,开展了一系列研究,取得的主要技术进展和研究成果归纳如下:(1)构建了面向汉外机器翻译的汉语基本动词描述词表,并探索了基于汉语动词分析的汉外机器翻译方法。(2)提出了源语言句法增强的串到树的翻译模型,该模型采用模糊规则匹配概率在译文推导过程中加强规则的区分性,使得所用规则充分尊重源语言的句法信息。实验表明,该模型统计显著地优于基本的基于串到短语结构树的翻译模型。(3)提出了基于谓词论元结构转换的统计翻译模型,很好地将谓词论元结构结合到了已有的统计机器翻译模型中,有效地改进了译文的质量,为统计机器翻译方法研究提供了新的思路和框架。(4)提出了汉英双语联合进行语义角色标注的方法,突破了已有方法只是针对单语种的语义角色标注问题开展工作,或者双语分别进行语义角色标注的方法的局限性,为语义角色标注方法研究开辟了新的蹊径。(5)提出了汉英命名实体识别与对齐的联合方法和普通集外词翻译的新方法,进一步改善了机器翻译系统的译文质量。(6)在本项目资助下共发表学术论文32篇,被国际期刊录用论文3篇,获一项学术会议最佳论文奖;申请国家发明专利4项,获7项软件著作权登记;培养研究生12名,其中一人获得中国科学院“朱李月华优秀博士生奖”;组织国际学术会议2次,国内学术会议1次。达到了项目预期的目标,取得了预期的成果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021
3

平行图像:图像生成的一个新型理论框架

平行图像:图像生成的一个新型理论框架

DOI:10.16451/j.cnki.issn1003-6059.201707001
发表时间:2017
4

零样本学习综述

零样本学习综述

DOI:10.3778/j.issn.1002-8331.2106-0133
发表时间:2021
5

基于关系对齐的汉语虚词抽象语义表示与分析

基于关系对齐的汉语虚词抽象语义表示与分析

DOI:
发表时间:2020

宗成庆的其他基金

批准号:60575043
批准年份:2005
资助金额:26.00
项目类别:面上项目
批准号:60375018
批准年份:2003
资助金额:23.00
项目类别:面上项目
批准号:60175012
批准年份:2001
资助金额:18.00
项目类别:面上项目
批准号:U1836221
批准年份:2018
资助金额:260.00
项目类别:联合基金项目
批准号:61333018
批准年份:2013
资助金额:300.00
项目类别:重点项目

相似国自然基金

1

基于语言理解的机器翻译译文自动评价方法研究

批准号:61203313
批准年份:2012
负责人:李茂西
学科分类:F0606
资助金额:24.00
项目类别:青年科学基金项目
2

语音机器翻译中的语言分析和理解研究

批准号:69772003
批准年份:1997
负责人:陈肇雄
学科分类:F01
资助金额:15.00
项目类别:面上项目
3

基于理解的汉英机器翻译理论和方法研究

批准号:68775023
批准年份:1987
负责人:姚天顺
学科分类:F0606
资助金额:4.00
项目类别:面上项目
4

融合语言知识与统计模型的机器翻译方法研究

批准号:60736014
批准年份:2007
负责人:刘群
学科分类:F0211
资助金额:180.00
项目类别:重点项目