面向篇章翻译的关键技术研究与实现

基本信息

批准号：61403379

项目类别：青年科学基金项目

资助金额：26.00

负责人：周玉

学科分类：

依托单位：中国科学院自动化研究所

批准年份：2014

结题年份：2017

起止时间：2015-01-01 - 2017-12-31

项目状态：已结题

项目参与者：涂眉,李小青,向露,张志琳,杨海彤,亢晓勉

关键词：

篇章分析连贯性分析衔接性分析篇章翻译语义分析

结项摘要

Currently, the most popular machine translation models are based on sentence-level, which makes many discourse structure and semantic information missing that resulting in a lot of translation problems. In order to solve these problems, we propose a novel translation framework to do translation on discourse-level, which can greatly improve the translation fluency and readability. The main contents of this proposal include: (1) From the perspective of discourse-oriented translation, study on the annotation guideline to build a large scale of monolingual and bilingual discourse-level corpus; (2) Study on how to build an automatic parser based on the tagged corpus to express a discourse as the corresponding semantic tree; (3) Study on how to build a reasonable framework to make full use of the discourse structure and semantic information for translation and study on the corresponding algorithms of training and decoding; (4) Design an effective evaluation method for the discourse-based model. The research achievements will explore new ideas for the discourse-based translation and the expected research results will promote the development in translation community, which has important theoretical significance and practical value.

目前主流的机器翻译方法都是建立在句子级别上，由于缺失了句子之间的上下文关联信息，往往导致很多在篇章层面才能获取到的结构和语义信息严重缺失，使得翻译的流畅性和可理解性都很差，因此，本项目紧紧围绕篇章翻译的关键技术展开如下创新性研究：（1）研究面向篇章翻译的语料库标注理论和方法，构建服务于篇章翻译的较大规模篇章标注语料库；（2）研究面向篇章翻译的篇章语义结构树分析方法，建立层次化的篇章逻辑结构语义树；（3）研究基于篇章语义树的翻译模型及其训练和解码算法；（4）构建面向篇章翻译的译文自动评估方法。本项目的研究工作必将为基于语料库的机器翻译方法探索新的研究思路，并面向实际应用，拓展和发展篇章理解理论，对于丰富和发展机器翻译方法及篇章分析理论都具有重要的理论意义和应用价值。

项目摘要

目前主流的机器翻译方法都是以句子为单位进行逐句翻译，这样就导致很多在篇章层面才能获取的结构和语义信息严重缺失，使得翻译的流畅性和可理解性都非常差强人意。因此，迫切需要构建面向篇章的全新翻译模式，来提供更多更全面的结构和语义信息，提高翻译的可读性。.在这种目标导向下，本项目紧紧围绕篇章翻译的关键技术展开了一系列相关研究，主要包括：（1）深入调研了当前主流篇章语料库标注理论方法，建立了一整套可计算的面向翻译的篇章标注理论和标注规范，并构建了服务于汉英篇章翻译的较大规模篇章标注语料库；（2）深入考察了当前主流篇章语义结构树分析方法，并建立了面向汉英翻译的层次化篇章逻辑结构语义树标注体系和自动分析工具；（3）在前述语料库和分析工具支撑下，提出了一种全新的基于篇章分析的翻译模式，该模式能够将篇章结构和语义信息很好地迁移并融合到篇章翻译模型中，保证了译文和源语言在修辞关系上的一致性，提高了解码器对源语言逻辑结构的敏感性，从而显著改善译文的流畅性和可理解度；（4）提出一种译文篇章单元完整性评价方法，该方法从带篇章单元标注信息的目标语言语料中，自动学习如何预测译文的篇章单元完整性，并在源语言篇章单元的约束下对翻译候选的完整性进行打分，通过对目标译文篇章单元的完整性评估，帮助翻译系统有效改善译文质量。本项目的研究工作必将为基于语料库的机器翻译方法探索新的研究思路，对于丰富和发展机器翻译方法及篇章分析理论都具有重要的理论研究意义和工程应用价值。.三年来，项目总体进展一切顺利，所有研究计划已按要求完成。共发表学术论文11篇，被国际顶级期刊录用论文3篇；申请国家发明专利4项，获得3项软件著作权登记；培养研究生7名，达到了项目的预期目标和成果。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：2016

DOI：10.19713/j.cnki.43-1423/u.t20201185

发表时间：2021

DOI：

发表时间：2018

DOI：10.16383/j.aas.2016.c150880

发表时间：2016

周玉的其他基金

批准号：61171022

批准年份：2011

资助金额：63.00

项目类别：面上项目

批准号：61571208

批准年份：2015

资助金额：67.00

项目类别：面上项目

批准号：81400437

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：31871888

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：90505011

批准年份：2005

资助金额：35.00

项目类别：重大研究计划

批准号：59972006

批准年份：1999

资助金额：15.00

项目类别：面上项目

批准号：U1504622

批准年份：2015

资助金额：27.00

项目类别：联合基金项目

批准号：50872025

批准年份：2008

资助金额：30.00

项目类别：面上项目

批准号：30771657

批准年份：2007

资助金额：28.00

项目类别：面上项目

批准号：50632020

批准年份：2006

资助金额：167.00

项目类别：重点项目

批准号：60971011

批准年份：2009

资助金额：32.00

项目类别：面上项目

相似国自然基金

面向多层次篇章语义的机器翻译理论、方法与实现

批准号：61432013

批准年份：2014

负责人：张民

学科分类：F0211

资助金额：350.00

项目类别：重点项目

基于句法结构和篇章结构的统计机器翻译关键技术研究

批准号：61373095

批准年份：2013

负责人：张民

学科分类：F0211

资助金额：79.00

项目类别：面上项目

应用于面向问题的自动文摘任务的篇章分析关键技术研究

批准号：60875042

批准年份：2008

负责人：李素建

学科分类：F03

资助金额：28.00

项目类别：面上项目

面向科技文献的机器翻译关键技术研究

批准号：60873167

批准年份：2008

负责人：吕雅娟

学科分类：F0211

资助金额：30.00

项目类别：面上项目

面向篇章翻译的关键技术研究与实现

{{i.achievement_title}}

暂无此项成果

其他相关文献

玉米叶向值的全基因组关联分析

监管的非对称性、盈余管理模式选择与证监会执法效率?

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

硬件木马:关键问题研究进展及新动向

基于SSVEP 直接脑控机器人方向和速度研究

周玉的其他基金

基于多价免疫生物传感器的原料乳中多种蛋白高通量检测新方法研究

纳米金粒子介导的复合探针的设计合成及其在多环芳烃分析检测中的应用研究

BACH2基因在视网膜色素变性疾病发病中的作用机制研究

基于磁纳米微球和金纳米粒子双探针介导的有机磷农药（OPs）检测技术研究

承载、防热和透波一体化陶瓷基复合材料及其应用基础研究

压电陶瓷颗粒对结构陶瓷力学行为的影响规律及机理

可拓神经网络的研究及其在分类器设计方面的应用

微珠烧结多孔钛微弧氧化涂层的形成机制与生物相容性

以广谱单链抗体(ScFv)为探针筛检水环境及水产品中中毒性藻毒素

自韧a-sialon陶瓷材料的微结构控制及其高温性能的相关基础研究

基于重组抗体的水环境中痕量重金属高通量检测技术研究

相似国自然基金