Recent years have witnessed the rapid development of neural machine translation (NMT), which has become the new mainstream technique in the area of machine translation. However, in the absence of explicit linguistic knowledge (e.g., syntax and semantics), the popular NMT model tends to produce improper translations, like unfaithful translation, under-translation, and over-translation. This proposal aims to explore modeling sentence-level structures and semantics for NMT from two perspectives: modeling sentence-level syntax, word/phrase semantics, and sentence-level shallow semantics for NMT to generate faithful translations, and modeling structures and relations among clauses for better translating long sentences. The main research content of the proposal includes: 1) modeling syntax for NMT; 2) modeling word/phrase semantics for NMT; 3) modeling sentence shallow semantics for NMT; and 4) modeling clause-level rhetorical structures and relations for NMT.
近年来,基于深度学习的神经机器翻译方法获得迅速发展,已成为目前的主流方法。不过,主流NMT模型在翻译过程中缺乏对句子的结构和语义信息的有效利用,经常会出现译文跑偏现象,包括错翻、漏翻和过翻等。本项目在前面研究的基础上,分别从句子内部和子句间,系统深入探索融合句子级结构与语义的神经机器翻译方法:一方面从句子内部句法结构、词/短语/句子语义信息控制句子译文的跑偏;二是如何从子句间的结构和语义角度控制长句译文的跑偏。主要研究内容包括:1) 研究融合句法结构的神经机器翻译方法;2) 研究融合词/短语语义的神经机器翻译方法;3) 研究融合句子浅层语义的神经机器翻译方法;和4) 研究融合子句间修辞结构和语义关系的神经机器翻译方法。
近年来,基于深度学习的神经机器翻译方法获得迅速发展,已成为目前的主流方法。不过,主流NMT模型在翻译过程中缺乏对句子的结构和语义信息的有效利用,经常会出现译文跑偏现象,包括错翻、漏翻和过翻等。本项目在前面研究的基础上,分别从句子内部和子句间,系统深入探索融合句子级结构与语义的神经机器翻译方法:一方面从句子内部句法结构、词/短语/句子语义信息控制句子译文的跑偏;二是如何从子句间的结构和语义角度控制长句译文的跑偏。主要研究内容包括:1) 研究融合句法结构的神经机器翻译方法;2) 研究融合词/短语语义的神经机器翻译方法;3) 研究融合句子浅层语义的神经机器翻译方法;和4) 研究融合子句间修辞结构和语义关系的神经机器翻译方法。四年来项目按计划推进,顺利完成了各项工作,主要成果有:1) 提出了融合词法和句法的句子对齐和机器翻译模型;2) 提出了融合句子语义的一系列神经机器翻译模型;3) 提出了融合文档内句间结构的一系列文档级神经机器翻译模型;4) 提出了一系列句子语义(AMR)分析模型。上述成果的取得,为今后的神经机器翻译研究提供了基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
硬件木马:关键问题研究进展及新动向
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
基于句子语义结构的统计机器翻译研究
句子阅读中语义整合的神经机制
句子语义的视觉表示研究
汉语句子理解中语义和句法整合的认知神经机制