While it has been claimed since the inception of machine translation, semantic models are the goals for statistical machine translation (SMT) to achieve human-like translation, most popular translation models (e.g., phrase-based, hierarchical phrase-based, and tree-based) are semantics free. As to use shallow semantic parsing output, this proposal focuses on two key issues in sentence level semantic structure – driven SMT: one is to analyze how and what semantic information is lost in traditional SMT systems; and the other is to explore how to avoid such loss in translation. The main research content of the proposal include:.1) Explore sentence level semantic structure knowledge and design an effective framework to keep the semantic knowledge unchanged in translation;.2) Design reasonable sentence-level semantic structures which suite machine translation, and explore the transformation of semantic structures from source side to target side;.3) Explore sentence level semantic structure – driven SMT, i.e., the approaches to incorporating sentence-level semantic structure translation into SMT systems as to guide translation.
基于语义的统计机器翻译(SMT)一直是研究者追求的目标。目前,主流SMT模型(例如短语模型、层次短语模型和树模型)在翻译过程中很少利用句子的语义信息。本项目将在前期研究的基础上,重点研究基于句子语义结构的SMT技术亟需解决的两个核心问题:一是分析现在SMT系统在句子的翻译过程中发生了哪些语义信息的缺失;二是研究如何在SMT系统中有效控制这种缺失。主要研究内容包括:1)充分发掘能够提高SMT质量的语义结构信息,设计合理有效的句子级语义控制框架;2)设计合理的句子级语义结构表示,并探索语义结构的映射,即给定源端语言的语义结构,将其转换映射为目标语言的语义结构;3)探索基于语义结构的句子翻译,即给定了句子源端语义结构及其目标端的映射,如何综合这些信息到SMT中,也就是说如何用源端和目标端的语义结构来指导现有的SMT技术。
基于语义的机器翻译一直是研究者追求的目标。目前,主流统计机器翻译模型(简称SMT, 例如短语模型 、层次短语模型和树模型等)在翻译过程中很少利用句子的语义信息。本项目将在前期研究的基础上,一个研究重点是探索基于句子语义的SMT技术,将统计机器翻译分为两个过程:语义分析和语言生成。语义分析将翻译的源语言解析为其在语义上等价的语义表达式,然后语言生成将语义表达式以目标端语言输出。..本项目的另一个研究重点是探索融入句法的神经机器翻译(简称NMT, 例如序列到序列模型等)研究,通过循环神经网络为每个源端单词捕获它的句法表示,提出三种不同的模型将句法表示添加到序列到序列模型中,实现融入句法信息的神经机器翻译。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
融合句子级结构与语义的神经机器翻译研究
基于词汇语义的统计机器翻译研究
基于篇章语义的文档级统计机器翻译研究
句子语义的视觉表示研究