融合句子级结构与语义的神经机器翻译研究

基本信息
批准号:61876120
项目类别:面上项目
资助金额:62.00
负责人:李军辉
学科分类:
依托单位:苏州大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:贡正仙,李亚超,夏庆荣,韩冬,丁颖,葛东来,张凯
关键词:
词义神经机器翻译句法结构句子浅层语义子句间结构与语义
结项摘要

Recent years have witnessed the rapid development of neural machine translation (NMT), which has become the new mainstream technique in the area of machine translation. However, in the absence of explicit linguistic knowledge (e.g., syntax and semantics), the popular NMT model tends to produce improper translations, like unfaithful translation, under-translation, and over-translation. This proposal aims to explore modeling sentence-level structures and semantics for NMT from two perspectives: modeling sentence-level syntax, word/phrase semantics, and sentence-level shallow semantics for NMT to generate faithful translations, and modeling structures and relations among clauses for better translating long sentences. The main research content of the proposal includes: 1) modeling syntax for NMT; 2) modeling word/phrase semantics for NMT; 3) modeling sentence shallow semantics for NMT; and 4) modeling clause-level rhetorical structures and relations for NMT.

近年来,基于深度学习的神经机器翻译方法获得迅速发展,已成为目前的主流方法。不过,主流NMT模型在翻译过程中缺乏对句子的结构和语义信息的有效利用,经常会出现译文跑偏现象,包括错翻、漏翻和过翻等。本项目在前面研究的基础上,分别从句子内部和子句间,系统深入探索融合句子级结构与语义的神经机器翻译方法:一方面从句子内部句法结构、词/短语/句子语义信息控制句子译文的跑偏;二是如何从子句间的结构和语义角度控制长句译文的跑偏。主要研究内容包括:1) 研究融合句法结构的神经机器翻译方法;2) 研究融合词/短语语义的神经机器翻译方法;3) 研究融合句子浅层语义的神经机器翻译方法;和4) 研究融合子句间修辞结构和语义关系的神经机器翻译方法。

项目摘要

近年来,基于深度学习的神经机器翻译方法获得迅速发展,已成为目前的主流方法。不过,主流NMT模型在翻译过程中缺乏对句子的结构和语义信息的有效利用,经常会出现译文跑偏现象,包括错翻、漏翻和过翻等。本项目在前面研究的基础上,分别从句子内部和子句间,系统深入探索融合句子级结构与语义的神经机器翻译方法:一方面从句子内部句法结构、词/短语/句子语义信息控制句子译文的跑偏;二是如何从子句间的结构和语义角度控制长句译文的跑偏。主要研究内容包括:1) 研究融合句法结构的神经机器翻译方法;2) 研究融合词/短语语义的神经机器翻译方法;3) 研究融合句子浅层语义的神经机器翻译方法;和4) 研究融合子句间修辞结构和语义关系的神经机器翻译方法。四年来项目按计划推进,顺利完成了各项工作,主要成果有:1) 提出了融合词法和句法的句子对齐和机器翻译模型;2) 提出了融合句子语义的一系列神经机器翻译模型;3) 提出了融合文档内句间结构的一系列文档级神经机器翻译模型;4) 提出了一系列句子语义(AMR)分析模型。上述成果的取得,为今后的神经机器翻译研究提供了基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020

李军辉的其他基金

批准号:30900705
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:50975292
批准年份:2009
资助金额:34.00
项目类别:面上项目
批准号:50675227
批准年份:2006
资助金额:32.00
项目类别:面上项目
批准号:51275536
批准年份:2012
资助金额:85.00
项目类别:面上项目
批准号:21802115
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:81171814
批准年份:2011
资助金额:58.00
项目类别:面上项目
批准号:81472246
批准年份:2014
资助金额:55.00
项目类别:面上项目
批准号:61401295
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:51409106
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目

相似国自然基金

1

基于句子语义结构的统计机器翻译研究

批准号:61401295
批准年份:2014
负责人:李军辉
学科分类:F0113
资助金额:25.00
项目类别:青年科学基金项目
2

句子阅读中语义整合的神经机制

批准号:31100811
批准年份:2011
负责人:朱祖德
学科分类:C0907
资助金额:24.00
项目类别:青年科学基金项目
3

句子语义的视觉表示研究

批准号:90920006
批准年份:2009
负责人:王小捷
学科分类:F0211
资助金额:50.00
项目类别:重大研究计划
4

汉语句子理解中语义和句法整合的认知神经机制

批准号:30970894
批准年份:2009
负责人:王穗苹
学科分类:C0907
资助金额:30.00
项目类别:面上项目