Statistical machine translation (SMT) has been intensively studied for years. Many models have been developed, ranging from word-based models to phrase-based models and conventional syntax-based models. In spite of the great interests by the SMT community, it is more difficult to improve conventional syntax-based systems. A fundamental issue that arises is: how to introduce deep syntax into SMT and develop multi-level syntax-based approaches for next generation of machine translation...In this proposal, we propose to address this issue in two aspects: 1) we investigate methods to represent deep syntax for machine translation; 2) we investigate deep syntax-based methods for machine translation. In particular, we explore derivation-based SMT approaches. All research outcomes will be integrated into the NiuTrans SMT platform and will be released for public.
统计机器翻译已经从基于词的模型发展到基于短语和基于传统句法的模型。虽然基于传统句法表示的机器翻译已经受到很多研究者的关注,但是直接沿用单语句法分析中的句法表示形式,并进行相应的建模已经进入了平台期。如何在机器翻译中使用深度句法信息并构建基于多层次句法的机器翻译框架已经成为了当前机器翻译中的主要问题之一。本项目拟围绕此问题展开研究工作,主要研究内容包括:1)研究面向机器翻译的深度句法表示形式;2)研究翻译推导模型,并探索基于多层次句法的统计机器翻译框架。最终,本项目的研究成果会被集成到NiuTrans开源平台中,为学术界共享使用。
统计机器翻译已经从基于词的模型发展到基于短语和基于传统句法的模型。虽然基于传统句法表示的机器翻译已经受到很多研究者的关注,但是直接沿用单语句法分析中的句法表示形式,并进行相应的建模已经进入了平台期。如何在深度神经网络进行机器翻译并且在这个过程中融入句法信息是当今自然语言处理领域的主要问题之一。本项目拟围绕此问题展开研究工作,主要研究内容包括:1)研究面向深度神经语言模型和翻译模型的并行训练方法;2)研究源语言句法信息在神经机器翻译的集成方法;3)研究基于句法的可实用化机器翻译方法。本项目的研究成果包括4篇高水平论文(其中2篇领域顶级会议及期刊论文IJCAI和EMNLP),培养了5名研究生。研究成果最终集成在NiuTrans系统中。
{{i.achievement_title}}
数据更新时间:2023-05-31
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
物联网中区块链技术的应用与挑战
一种改进的多目标正余弦优化算法
基于混合优化方法的大口径主镜设计
变可信度近似模型及其在复杂装备优化设计中的应用研究进展
基于主干成分的句法统计机器翻译模型研究
基于句法结构和篇章结构的统计机器翻译关键技术研究
基于句法结构和语义框架的机器翻译自动评价方法研究
基于图的统计机器翻译方法研究