基于句子语义结构的统计机器翻译研究

基本信息
批准号:61401295
项目类别:青年科学基金项目
资助金额:25.00
负责人:李军辉
学科分类:
依托单位:苏州大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:孙静,惠浩添,朱珊珊,陈亚东
关键词:
统计机器翻译语义结构浅层语义分析语义结构映射谓词论元结构
结项摘要

While it has been claimed since the inception of machine translation, semantic models are the goals for statistical machine translation (SMT) to achieve human-like translation, most popular translation models (e.g., phrase-based, hierarchical phrase-based, and tree-based) are semantics free. As to use shallow semantic parsing output, this proposal focuses on two key issues in sentence level semantic structure – driven SMT: one is to analyze how and what semantic information is lost in traditional SMT systems; and the other is to explore how to avoid such loss in translation. The main research content of the proposal include:.1) Explore sentence level semantic structure knowledge and design an effective framework to keep the semantic knowledge unchanged in translation;.2) Design reasonable sentence-level semantic structures which suite machine translation, and explore the transformation of semantic structures from source side to target side;.3) Explore sentence level semantic structure – driven SMT, i.e., the approaches to incorporating sentence-level semantic structure translation into SMT systems as to guide translation.

基于语义的统计机器翻译(SMT)一直是研究者追求的目标。目前,主流SMT模型(例如短语模型、层次短语模型和树模型)在翻译过程中很少利用句子的语义信息。本项目将在前期研究的基础上,重点研究基于句子语义结构的SMT技术亟需解决的两个核心问题:一是分析现在SMT系统在句子的翻译过程中发生了哪些语义信息的缺失;二是研究如何在SMT系统中有效控制这种缺失。主要研究内容包括:1)充分发掘能够提高SMT质量的语义结构信息,设计合理有效的句子级语义控制框架;2)设计合理的句子级语义结构表示,并探索语义结构的映射,即给定源端语言的语义结构,将其转换映射为目标语言的语义结构;3)探索基于语义结构的句子翻译,即给定了句子源端语义结构及其目标端的映射,如何综合这些信息到SMT中,也就是说如何用源端和目标端的语义结构来指导现有的SMT技术。

项目摘要

基于语义的机器翻译一直是研究者追求的目标。目前,主流统计机器翻译模型(简称SMT, 例如短语模型 、层次短语模型和树模型等)在翻译过程中很少利用句子的语义信息。本项目将在前期研究的基础上,一个研究重点是探索基于句子语义的SMT技术,将统计机器翻译分为两个过程:语义分析和语言生成。语义分析将翻译的源语言解析为其在语义上等价的语义表达式,然后语言生成将语义表达式以目标端语言输出。..本项目的另一个研究重点是探索融入句法的神经机器翻译(简称NMT, 例如序列到序列模型等)研究,通过循环神经网络为每个源端单词捕获它的句法表示,提出三种不同的模型将句法表示添加到序列到序列模型中,实现融入句法信息的神经机器翻译。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

李军辉的其他基金

批准号:61876120
批准年份:2018
资助金额:62.00
项目类别:面上项目
批准号:30900705
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:50975292
批准年份:2009
资助金额:34.00
项目类别:面上项目
批准号:50675227
批准年份:2006
资助金额:32.00
项目类别:面上项目
批准号:51275536
批准年份:2012
资助金额:85.00
项目类别:面上项目
批准号:21802115
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:81171814
批准年份:2011
资助金额:58.00
项目类别:面上项目
批准号:81472246
批准年份:2014
资助金额:55.00
项目类别:面上项目
批准号:51409106
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目

相似国自然基金

1

融合句子级结构与语义的神经机器翻译研究

批准号:61876120
批准年份:2018
负责人:李军辉
学科分类:F0606
资助金额:62.00
项目类别:面上项目
2

基于词汇语义的统计机器翻译研究

批准号:61403269
批准年份:2014
负责人:熊德意
学科分类:F0606
资助金额:25.00
项目类别:青年科学基金项目
3

基于篇章语义的文档级统计机器翻译研究

批准号:61305088
批准年份:2013
负责人:贡正仙
学科分类:F0606
资助金额:25.00
项目类别:青年科学基金项目
4

句子语义的视觉表示研究

批准号:90920006
批准年份:2009
负责人:王小捷
学科分类:F0211
资助金额:50.00
项目类别:重大研究计划