Automatic evaluation of machine translation is critical to promote the rapid development of machine translation. It not only plays an important role on measuring the performance of machine translation, but also guides feature weights tuning or rules optimization in the development of machine translation system. Due to the source sentences is not being fully utilized, character-level knowledge of Chinese translation is difficult to obtain and exploit, and the deep semantic knowledge is difficult to be appropriately introduced in current automatic evaluation process, this project will investigate and delve deeply in the following areas: (1) study the analyzing and understanding approach that oriented automatic evaluation of machine translation, combine with the source sentence to analyze the translation in order to decrease the difficulty caused by translation error and improve the accuracy of synonym, syntactic, semantic analysis; (2) study the approach to obtain and exploit character-level knowledge of Chinese translation, explore the way used Markov logic network to transfer learn the charcter-level knowledge of Chinese translation based on the word-level analysis results of Chinese translation; (3) investigate the new framework of automatic evaluation of machine translation, that integrated lexical, syntactic, semantic knowledge into the new framework, reduce the computational complexity by the structure of the probabilitic graph. The final objective of this project is to improve effectively the correlation between the new metric and human judgment.
机器翻译译文质量的自动评价方法是推动机器翻译技术快速发展的一条重要途径。它不仅在机器翻译系统性能测量中发挥着重要作用,而且在系统开发中指导着特征参数的调整或规则的优化。针对目前机器翻译译文自动评价过程中不充分利用源语言句子的作用、汉语译文中汉字层面的语言知识难以获取与应用、深层次语义知识难以适当的引入等问题,本项目在以下方面进行深入的研究和探索:(1)研究面向译文自动评价的译文分析与理解方法,结合源语言句子进行译文分析,减少翻译错误给译文分析带来的困难,提高译文中近义词、句法、语义分析的准确率;(2)研究汉语译文汉字层面的语言知识获取与应用方法,在词语层面的译文分析结果上,探索利用马尔可夫逻辑网络迁移学习汉字层面的深层次语言知识;(3)研究融合词语、句法、语义一体化的机器翻译译文自动评价新框架,通过概率图结构降低计算复杂度。本项目最终目标是提高译文自动评价方法与人工评价的相关性。
机器翻译系统输出译文质量的自动评价方法是推动机器翻译技术快速发展的一条重要途径。针对目前机器翻译译文自动评价过程中不充分利用源语言句子的作用、汉语译文中汉字层面的语言知识难以获取与应用、深层次语义知识难以适当的引入等问题,本项目进行了如下的研究:. (1)提出运用间接隐马尔可夫模型,以源语言句子作为机器译文和人工参考译文语义对齐的桥梁进行译文自动评价;通过分析汉语译文的特点,采用汉字作为词语匹配的单位并结合汉语译文词序的惩罚进行汉语译文的自动评价;利用词形的相似性,对该模型进行泛化用以评价英语和其他欧洲语言机器译文。. (2)为了更好地引入与译文质量相关的不同特征,我们把译文质量自动评价看作是一个排序学习的问题:如何对多个机器翻译系统输出译文按质量进行排序,并采用当前具有代表性的基于排列的排序学习方法, ListMLE和ListNet,进行译文自动评价。与启发式方法相比,该方法的一个显著优点是方便地吸收不同层次的语言知识作为特征用以进行译文评价。. (3)提出通过构建词的Markov网络,从目标语言的单语文本中抽取复述的方法,并利用抽取的复述知识匹配机器译文和人工参考译文中具有相同语义、不同表达方式的词或短语,实验结果表明该方法与使用双语对齐语料的复述抽取方法具有很强的可比性。. 在项目研究过程中,共发表学术论文8篇;成功申请软件著作权2项;培养硕士研究生6名。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
城市轨道交通车站火灾情况下客流疏散能力评价
基于FTA-BN模型的页岩气井口装置失效概率分析
深度挖掘人工译文信息的机器翻译自动评价方法研究
基于语言理解的机器翻译方法研究
机器翻译与自然语言处理系统的自动评价
语音机器翻译中的语言分析和理解研究