基于语言理解的机器翻译译文自动评价方法研究

基本信息

批准号：61203313

项目类别：青年科学基金项目

资助金额：24.00

负责人：李茂西

学科分类：

依托单位：江西师范大学

批准年份：2012

结题年份：2015

起止时间：2013-01-01 - 2015-12-31

项目状态：已结题

项目参与者：江爱文,王晓庆,罗文兵,龚小龙,王飞,文辉,蔡桂秀,潘敏

关键词：

语义一体化句法机器译文自动评价马尔可夫逻辑网络双语联合标注语言理解词语

结项摘要

Automatic evaluation of machine translation is critical to promote the rapid development of machine translation. It not only plays an important role on measuring the performance of machine translation, but also guides feature weights tuning or rules optimization in the development of machine translation system. Due to the source sentences is not being fully utilized, character-level knowledge of Chinese translation is difficult to obtain and exploit, and the deep semantic knowledge is difficult to be appropriately introduced in current automatic evaluation process, this project will investigate and delve deeply in the following areas: (1) study the analyzing and understanding approach that oriented automatic evaluation of machine translation, combine with the source sentence to analyze the translation in order to decrease the difficulty caused by translation error and improve the accuracy of synonym, syntactic, semantic analysis; (2) study the approach to obtain and exploit character-level knowledge of Chinese translation, explore the way used Markov logic network to transfer learn the charcter-level knowledge of Chinese translation based on the word-level analysis results of Chinese translation; (3) investigate the new framework of automatic evaluation of machine translation, that integrated lexical, syntactic, semantic knowledge into the new framework, reduce the computational complexity by the structure of the probabilitic graph. The final objective of this project is to improve effectively the correlation between the new metric and human judgment.

机器翻译译文质量的自动评价方法是推动机器翻译技术快速发展的一条重要途径。它不仅在机器翻译系统性能测量中发挥着重要作用，而且在系统开发中指导着特征参数的调整或规则的优化。针对目前机器翻译译文自动评价过程中不充分利用源语言句子的作用、汉语译文中汉字层面的语言知识难以获取与应用、深层次语义知识难以适当的引入等问题，本项目在以下方面进行深入的研究和探索：（1）研究面向译文自动评价的译文分析与理解方法，结合源语言句子进行译文分析，减少翻译错误给译文分析带来的困难，提高译文中近义词、句法、语义分析的准确率；（2）研究汉语译文汉字层面的语言知识获取与应用方法，在词语层面的译文分析结果上，探索利用马尔可夫逻辑网络迁移学习汉字层面的深层次语言知识；（3）研究融合词语、句法、语义一体化的机器翻译译文自动评价新框架，通过概率图结构降低计算复杂度。本项目最终目标是提高译文自动评价方法与人工评价的相关性。

项目摘要

机器翻译系统输出译文质量的自动评价方法是推动机器翻译技术快速发展的一条重要途径。针对目前机器翻译译文自动评价过程中不充分利用源语言句子的作用、汉语译文中汉字层面的语言知识难以获取与应用、深层次语义知识难以适当的引入等问题，本项目进行了如下的研究：. （1）提出运用间接隐马尔可夫模型，以源语言句子作为机器译文和人工参考译文语义对齐的桥梁进行译文自动评价；通过分析汉语译文的特点，采用汉字作为词语匹配的单位并结合汉语译文词序的惩罚进行汉语译文的自动评价；利用词形的相似性，对该模型进行泛化用以评价英语和其他欧洲语言机器译文。. （2）为了更好地引入与译文质量相关的不同特征，我们把译文质量自动评价看作是一个排序学习的问题：如何对多个机器翻译系统输出译文按质量进行排序，并采用当前具有代表性的基于排列的排序学习方法, ListMLE和ListNet，进行译文自动评价。与启发式方法相比，该方法的一个显著优点是方便地吸收不同层次的语言知识作为特征用以进行译文评价。. （3）提出通过构建词的Markov网络，从目标语言的单语文本中抽取复述的方法,并利用抽取的复述知识匹配机器译文和人工参考译文中具有相同语义、不同表达方式的词或短语，实验结果表明该方法与使用双语对齐语料的复述抽取方法具有很强的可比性。. 在项目研究过程中，共发表学术论文8篇；成功申请软件著作权2项；培养硕士研究生6名。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2016

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.13973/j.cnki.robot.210412

发表时间：2022

李茂西的其他基金

批准号：61462044

批准年份：2014

资助金额：46.00

项目类别：地区科学基金项目

批准号：61662031

批准年份：2016

资助金额：40.00

项目类别：地区科学基金项目

相似国自然基金

深度挖掘人工译文信息的机器翻译自动评价方法研究

批准号：61602284

批准年份：2016

负责人：于惠

学科分类：F0211

资助金额：20.00

项目类别：青年科学基金项目

基于语言理解的机器翻译方法研究

批准号：60975053

批准年份：2009

负责人：宗成庆

学科分类：F0606

资助金额：33.00

项目类别：面上项目

机器翻译与自然语言处理系统的自动评价

批准号：69373043

批准年份：1993

负责人：俞士汶

学科分类：F0211

资助金额：6.00

项目类别：面上项目

语音机器翻译中的语言分析和理解研究

批准号：69772003

批准年份：1997

负责人：陈肇雄

学科分类：F01

资助金额：15.00

项目类别：面上项目

基于语言理解的机器翻译译文自动评价方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于MCPF算法的列车组合定位应用研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

新型树启发式搜索算法的机器人路径规划

现代优化理论与应用

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

李茂西的其他基金

基于深度学习的机器译文质量估计方法研究

自动后处理和语法错误校正驱动的译文质量提高方法

相似国自然基金