基于语言理解的机器翻译方法研究

基本信息

批准号：60975053

项目类别：面上项目

资助金额：33.00

负责人：宗成庆

学科分类：

依托单位：中国科学院自动化研究所

批准年份：2009

结题年份：2012

起止时间：2010-01-01 - 2012-12-31

项目状态：已结题

项目参与者：周玉,鉴萍,张家俊,李茂西,刘鹏,夏睿,庄涛,汪昆,王志国

关键词：

机器翻译语言生成自然语言理解语义理解

结项摘要

本项目将针对目前统计机器翻译面临的几个关键问题：如何从双语语料中有效获取翻译知识的问题、如何在解码中快速搜索最优路径的问题和如何生成高质量的译文等问题，研究面向机器翻译的自然语言理解方法，建立基于自然语言理解的统计翻译新框架，有效提高机器翻译的译文质量。项目将在以下几个方面进行深入研究和探索：（1）充分借鉴和利用已有的语言知识资源，研究构建面向机器翻译的汉语动词知识库，提出面向机器翻译的源语言（以汉语为例）句法、语义一体化理解方法；（2）研究基于自然语言理解的统计机器翻译理论，建立语言知识与统计模型协调工作的机器翻译新方法；（3）针对译文（以英语为例）生成问题，建立基于源语言语义和目标语言语法双重约束下的译文生成方法；（4）提出基于领域划分的机器翻译模型自适应方法。本项目开展的研究工作具有重要的理论意义和应用价值。

项目摘要

本项目针对目前统计机器翻译面临的几个关键问题：如何从双语语料中有效获取翻译知识的问题、如何准确理解源语言句子的语义，并将语义知识融入翻译模型和如何改进翻译系统译文质量等问题，开展了一系列研究，取得的主要技术进展和研究成果归纳如下：(1)构建了面向汉外机器翻译的汉语基本动词描述词表，并探索了基于汉语动词分析的汉外机器翻译方法。(2)提出了源语言句法增强的串到树的翻译模型，该模型采用模糊规则匹配概率在译文推导过程中加强规则的区分性，使得所用规则充分尊重源语言的句法信息。实验表明，该模型统计显著地优于基本的基于串到短语结构树的翻译模型。(3)提出了基于谓词论元结构转换的统计翻译模型，很好地将谓词论元结构结合到了已有的统计机器翻译模型中，有效地改进了译文的质量，为统计机器翻译方法研究提供了新的思路和框架。(4)提出了汉英双语联合进行语义角色标注的方法，突破了已有方法只是针对单语种的语义角色标注问题开展工作，或者双语分别进行语义角色标注的方法的局限性，为语义角色标注方法研究开辟了新的蹊径。(5)提出了汉英命名实体识别与对齐的联合方法和普通集外词翻译的新方法，进一步改善了机器翻译系统的译文质量。(6)在本项目资助下共发表学术论文32篇，被国际期刊录用论文3篇，获一项学术会议最佳论文奖；申请国家发明专利4项，获7项软件著作权登记；培养研究生12名，其中一人获得中国科学院“朱李月华优秀博士生奖”；组织国际学术会议2次，国内学术会议1次。达到了项目预期的目标，取得了预期的成果。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.7524/j.issn.0254-6108.2021021801

发表时间：2022

DOI：10.12005/orms.2019.0029

发表时间：2019

DOI：

发表时间：2022

DOI：10.19907/j.0490-6756.2021.067001

发表时间：2021

DOI：10.13865/j.cnki.cjbmb.2021.02.1587

发表时间：2021

宗成庆的其他基金

批准号：60575043

批准年份：2005

资助金额：26.00

项目类别：面上项目

批准号：60375018

批准年份：2003

资助金额：23.00

项目类别：面上项目

批准号：60175012

批准年份：2001

资助金额：18.00

项目类别：面上项目

批准号：U1836221

批准年份：2018

资助金额：260.00

项目类别：联合基金项目

批准号：61333018

批准年份：2013

资助金额：300.00

项目类别：重点项目

相似国自然基金

基于语言理解的机器翻译译文自动评价方法研究

批准号：61203313

批准年份：2012

负责人：李茂西

学科分类：F0606

资助金额：24.00

项目类别：青年科学基金项目

语音机器翻译中的语言分析和理解研究

批准号：69772003

批准年份：1997

负责人：陈肇雄

学科分类：F01

资助金额：15.00

项目类别：面上项目

基于理解的汉英机器翻译理论和方法研究

批准号：68775023

批准年份：1987

负责人：姚天顺

学科分类：F0606

资助金额：4.00

项目类别：面上项目

融合语言知识与统计模型的机器翻译方法研究

批准号：60736014

批准年份：2007

负责人：刘群

学科分类：F0211

资助金额：180.00

项目类别：重点项目

基于语言理解的机器翻译方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

水中溴代消毒副产物的生成综述

基于直觉模糊二元语义交互式群决策的技术创新项目选择

融合字符串特征的维吾尔语形态切分

考虑时空相关随机行驶时间的车辆路径问题模型与算法

鞘氨醇激酶-磷酸鞘氨醇轴在血管生成相关性疾病中的作用

宗成庆的其他基金

基于话语理解的交互式口语翻译方法研究

基于对话内容的高鲁棒性信息提取方法研究

基于儿童心理分析的图解式汉语口语自动解析方法研究

基于知识的智能机器翻译方法研究

汉语多层次语篇分析理论方法研究与应用

相似国自然基金