基于语言理解的机器翻译译文自动评价方法研究

基本信息
批准号:61203313
项目类别:青年科学基金项目
资助金额:24.00
负责人:李茂西
学科分类:
依托单位:江西师范大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:江爱文,王晓庆,罗文兵,龚小龙,王飞,文辉,蔡桂秀,潘敏
关键词:
语义一体化句法机器译文自动评价马尔可夫逻辑网络双语联合标注语言理解词语
结项摘要

Automatic evaluation of machine translation is critical to promote the rapid development of machine translation. It not only plays an important role on measuring the performance of machine translation, but also guides feature weights tuning or rules optimization in the development of machine translation system. Due to the source sentences is not being fully utilized, character-level knowledge of Chinese translation is difficult to obtain and exploit, and the deep semantic knowledge is difficult to be appropriately introduced in current automatic evaluation process, this project will investigate and delve deeply in the following areas: (1) study the analyzing and understanding approach that oriented automatic evaluation of machine translation, combine with the source sentence to analyze the translation in order to decrease the difficulty caused by translation error and improve the accuracy of synonym, syntactic, semantic analysis; (2) study the approach to obtain and exploit character-level knowledge of Chinese translation, explore the way used Markov logic network to transfer learn the charcter-level knowledge of Chinese translation based on the word-level analysis results of Chinese translation; (3) investigate the new framework of automatic evaluation of machine translation, that integrated lexical, syntactic, semantic knowledge into the new framework, reduce the computational complexity by the structure of the probabilitic graph. The final objective of this project is to improve effectively the correlation between the new metric and human judgment.

机器翻译译文质量的自动评价方法是推动机器翻译技术快速发展的一条重要途径。它不仅在机器翻译系统性能测量中发挥着重要作用,而且在系统开发中指导着特征参数的调整或规则的优化。针对目前机器翻译译文自动评价过程中不充分利用源语言句子的作用、汉语译文中汉字层面的语言知识难以获取与应用、深层次语义知识难以适当的引入等问题,本项目在以下方面进行深入的研究和探索:(1)研究面向译文自动评价的译文分析与理解方法,结合源语言句子进行译文分析,减少翻译错误给译文分析带来的困难,提高译文中近义词、句法、语义分析的准确率;(2)研究汉语译文汉字层面的语言知识获取与应用方法,在词语层面的译文分析结果上,探索利用马尔可夫逻辑网络迁移学习汉字层面的深层次语言知识;(3)研究融合词语、句法、语义一体化的机器翻译译文自动评价新框架,通过概率图结构降低计算复杂度。本项目最终目标是提高译文自动评价方法与人工评价的相关性。

项目摘要

机器翻译系统输出译文质量的自动评价方法是推动机器翻译技术快速发展的一条重要途径。针对目前机器翻译译文自动评价过程中不充分利用源语言句子的作用、汉语译文中汉字层面的语言知识难以获取与应用、深层次语义知识难以适当的引入等问题,本项目进行了如下的研究:. (1)提出运用间接隐马尔可夫模型,以源语言句子作为机器译文和人工参考译文语义对齐的桥梁进行译文自动评价;通过分析汉语译文的特点,采用汉字作为词语匹配的单位并结合汉语译文词序的惩罚进行汉语译文的自动评价;利用词形的相似性,对该模型进行泛化用以评价英语和其他欧洲语言机器译文。. (2)为了更好地引入与译文质量相关的不同特征,我们把译文质量自动评价看作是一个排序学习的问题:如何对多个机器翻译系统输出译文按质量进行排序,并采用当前具有代表性的基于排列的排序学习方法, ListMLE和ListNet,进行译文自动评价。与启发式方法相比,该方法的一个显著优点是方便地吸收不同层次的语言知识作为特征用以进行译文评价。. (3)提出通过构建词的Markov网络,从目标语言的单语文本中抽取复述的方法,并利用抽取的复述知识匹配机器译文和人工参考译文中具有相同语义、不同表达方式的词或短语,实验结果表明该方法与使用双语对齐语料的复述抽取方法具有很强的可比性。. 在项目研究过程中,共发表学术论文8篇;成功申请软件著作权2项;培养硕士研究生6名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
5

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019

李茂西的其他基金

批准号:61462044
批准年份:2014
资助金额:46.00
项目类别:地区科学基金项目
批准号:61662031
批准年份:2016
资助金额:40.00
项目类别:地区科学基金项目

相似国自然基金

1

深度挖掘人工译文信息的机器翻译自动评价方法研究

批准号:61602284
批准年份:2016
负责人:于惠
学科分类:F0211
资助金额:20.00
项目类别:青年科学基金项目
2

基于语言理解的机器翻译方法研究

批准号:60975053
批准年份:2009
负责人:宗成庆
学科分类:F0606
资助金额:33.00
项目类别:面上项目
3

机器翻译与自然语言处理系统的自动评价

批准号:69373043
批准年份:1993
负责人:俞士汶
学科分类:F0211
资助金额:6.00
项目类别:面上项目
4

语音机器翻译中的语言分析和理解研究

批准号:69772003
批准年份:1997
负责人:陈肇雄
学科分类:F01
资助金额:15.00
项目类别:面上项目