基于深度句法的统计机器翻译方法研究

基本信息
批准号:61672138
项目类别:面上项目
资助金额:16.00
负责人:肖桐
学科分类:
依托单位:东北大学
批准年份:2016
结题年份:2017
起止时间:2017-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:张春良,战学刚,迟呈英,张美娜,杜权,王强,李洋,杨木润,胡博杰
关键词:
翻译优化统计机器翻译解码算法句法分析训练算法
结项摘要

Statistical machine translation (SMT) has been intensively studied for years. Many models have been developed, ranging from word-based models to phrase-based models and conventional syntax-based models. In spite of the great interests by the SMT community, it is more difficult to improve conventional syntax-based systems. A fundamental issue that arises is: how to introduce deep syntax into SMT and develop multi-level syntax-based approaches for next generation of machine translation...In this proposal, we propose to address this issue in two aspects: 1) we investigate methods to represent deep syntax for machine translation; 2) we investigate deep syntax-based methods for machine translation. In particular, we explore derivation-based SMT approaches. All research outcomes will be integrated into the NiuTrans SMT platform and will be released for public.

统计机器翻译已经从基于词的模型发展到基于短语和基于传统句法的模型。虽然基于传统句法表示的机器翻译已经受到很多研究者的关注,但是直接沿用单语句法分析中的句法表示形式,并进行相应的建模已经进入了平台期。如何在机器翻译中使用深度句法信息并构建基于多层次句法的机器翻译框架已经成为了当前机器翻译中的主要问题之一。本项目拟围绕此问题展开研究工作,主要研究内容包括:1)研究面向机器翻译的深度句法表示形式;2)研究翻译推导模型,并探索基于多层次句法的统计机器翻译框架。最终,本项目的研究成果会被集成到NiuTrans开源平台中,为学术界共享使用。

项目摘要

统计机器翻译已经从基于词的模型发展到基于短语和基于传统句法的模型。虽然基于传统句法表示的机器翻译已经受到很多研究者的关注,但是直接沿用单语句法分析中的句法表示形式,并进行相应的建模已经进入了平台期。如何在深度神经网络进行机器翻译并且在这个过程中融入句法信息是当今自然语言处理领域的主要问题之一。本项目拟围绕此问题展开研究工作,主要研究内容包括:1)研究面向深度神经语言模型和翻译模型的并行训练方法;2)研究源语言句法信息在神经机器翻译的集成方法;3)研究基于句法的可实用化机器翻译方法。本项目的研究成果包括4篇高水平论文(其中2篇领域顶级会议及期刊论文IJCAI和EMNLP),培养了5名研究生。研究成果最终集成在NiuTrans系统中。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
2

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020
3

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019
4

基于混合优化方法的大口径主镜设计

基于混合优化方法的大口径主镜设计

DOI:10.3788/AOS202040.2212001
发表时间:2020
5

变可信度近似模型及其在复杂装备优化设计中的应用研究进展

变可信度近似模型及其在复杂装备优化设计中的应用研究进展

DOI:10.3901/jme.2020.24.219
发表时间:2020

肖桐的其他基金

批准号:41501117
批准年份:2015
资助金额:24.00
项目类别:青年科学基金项目
批准号:61300097
批准年份:2013
资助金额:28.00
项目类别:青年科学基金项目
批准号:61876035
批准年份:2018
资助金额:62.00
项目类别:面上项目

相似国自然基金

1

基于主干成分的句法统计机器翻译模型研究

批准号:61300097
批准年份:2013
负责人:肖桐
学科分类:F0211
资助金额:28.00
项目类别:青年科学基金项目
2

基于句法结构和篇章结构的统计机器翻译关键技术研究

批准号:61373095
批准年份:2013
负责人:张民
学科分类:F0211
资助金额:79.00
项目类别:面上项目
3

基于句法结构和语义框架的机器翻译自动评价方法研究

批准号:61379086
批准年份:2013
负责人:刘群
学科分类:F0211
资助金额:73.00
项目类别:面上项目
4

基于图的统计机器翻译方法研究

批准号:61003111
批准年份:2010
负责人:巢文涵
学科分类:F0211
资助金额:7.00
项目类别:青年科学基金项目