本项目将针对目前统计机器翻译面临的几个关键问题:如何从双语语料中有效获取翻译知识的问题、如何在解码中快速搜索最优路径的问题和如何生成高质量的译文等问题,研究面向机器翻译的自然语言理解方法,建立基于自然语言理解的统计翻译新框架,有效提高机器翻译的译文质量。项目将在以下几个方面进行深入研究和探索:(1)充分借鉴和利用已有的语言知识资源,研究构建面向机器翻译的汉语动词知识库,提出面向机器翻译的源语言(以汉语为例)句法、语义一体化理解方法;(2)研究基于自然语言理解的统计机器翻译理论,建立语言知识与统计模型协调工作的机器翻译新方法;(3)针对译文(以英语为例)生成问题,建立基于源语言语义和目标语言语法双重约束下的译文生成方法;(4)提出基于领域划分的机器翻译模型自适应方法。本项目开展的研究工作具有重要的理论意义和应用价值。
本项目针对目前统计机器翻译面临的几个关键问题:如何从双语语料中有效获取翻译知识的问题、如何准确理解源语言句子的语义,并将语义知识融入翻译模型和如何改进翻译系统译文质量等问题,开展了一系列研究,取得的主要技术进展和研究成果归纳如下:(1)构建了面向汉外机器翻译的汉语基本动词描述词表,并探索了基于汉语动词分析的汉外机器翻译方法。(2)提出了源语言句法增强的串到树的翻译模型,该模型采用模糊规则匹配概率在译文推导过程中加强规则的区分性,使得所用规则充分尊重源语言的句法信息。实验表明,该模型统计显著地优于基本的基于串到短语结构树的翻译模型。(3)提出了基于谓词论元结构转换的统计翻译模型,很好地将谓词论元结构结合到了已有的统计机器翻译模型中,有效地改进了译文的质量,为统计机器翻译方法研究提供了新的思路和框架。(4)提出了汉英双语联合进行语义角色标注的方法,突破了已有方法只是针对单语种的语义角色标注问题开展工作,或者双语分别进行语义角色标注的方法的局限性,为语义角色标注方法研究开辟了新的蹊径。(5)提出了汉英命名实体识别与对齐的联合方法和普通集外词翻译的新方法,进一步改善了机器翻译系统的译文质量。(6)在本项目资助下共发表学术论文32篇,被国际期刊录用论文3篇,获一项学术会议最佳论文奖;申请国家发明专利4项,获7项软件著作权登记;培养研究生12名,其中一人获得中国科学院“朱李月华优秀博士生奖”;组织国际学术会议2次,国内学术会议1次。达到了项目预期的目标,取得了预期的成果。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
平行图像:图像生成的一个新型理论框架
零样本学习综述
基于关系对齐的汉语虚词抽象语义表示与分析
基于语言理解的机器翻译译文自动评价方法研究
语音机器翻译中的语言分析和理解研究
基于理解的汉英机器翻译理论和方法研究
融合语言知识与统计模型的机器翻译方法研究