基于强化学习的神经机器翻译研究

基本信息

批准号：61876174

项目类别：面上项目

资助金额：16.00

负责人：冯洋

学科分类：

依托单位：中国科学院计算技术研究所

批准年份：2018

结题年份：2019

起止时间：2019-01-01 - 2019-12-31

项目状态：已结题

项目参与者：刘群,张金超,马青松,张文,李京谕,薛海洋

关键词：

策略梯度算法神经机器翻译强化学习序列到序列模型双向翻译

结项摘要

Recently reinforcement learning has shown its superiority on machine translation and drawn more attention. It works by adjusting the behavior of the agent according to the defined rewards so that the agent can take the action which leads to a high reward. In this project, we apply reinforcement learning to resolve the problem caused by the discrepancy of target context between training and test. We take as the teacher the model which uses as context the previous words from ground truth translation, and take as the student the model which uses as context the previous word generated by the model, then use the probabilities from the teacher as rewards to guide the training of the student under the framework of reinforcement learning.

最近强化学习在机器翻译中表现出优异的性能，受到越来越多的关注。它通过定义的奖励函数来调整当前智能体的行为，使得智能体倾向于采用奖励高的行动。本项目采用强化学习的方法来解决神经机器翻译中由于训练和测试使用的上文不一致引起模型偏差的问题。我们将以参考译文中的词为上文得到模型作为老师模型，将以模型生成的词作为上文得到的模型作为学生模型，用老师模型生成奖励来指导学生模型进行优化。

项目摘要

神经机器翻译中的曝光偏差问题受到了人们越来越多的关注。曝光偏差是指神经机器翻译模型的词级别优化方法中存在的训练与测试不一致的现象。目前，通常的解决方案是使用序列级训练方法来缓解模型的曝光偏差问题，对模型的序列级训练则一般是基于强化学习算法来实现。在本项目中，一方面，我们提出了谕示词方法，通过在训练时向模型输入一定的谕示词来减小训练与测试的差异，在基于强化学习的序列级训练方法外探索了缓解曝光偏差问题的另一种思路。实验表明，谕示词方法能有效地缓解翻译模型的曝光偏差、提升模型的翻译质量；另一方面，我们进一步地探索了强化学习算法在神经机器翻译上的应用，验证了序列级训练在非自回归模型上的有效性。实验表明，对非自回归模型进行基于强化学习的序列级训练能有效地提升模型的翻译质量、减少译文中的过翻译、漏翻译错误。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13210/j.cnki.jhmu.20190508.001

发表时间：2019

DOI：

发表时间：

DOI：

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2018

冯洋的其他基金

批准号：11904053

批准年份：2019

资助金额：27.00

项目类别：青年科学基金项目

相似国自然基金

面向神经机器翻译的结构学习方法研究

批准号：61876035

批准年份：2018

负责人：肖桐

学科分类：F0606

资助金额：62.00

项目类别：面上项目

基于神经机器翻译的电网故障诊断

批准号：51877079

批准年份：2018

负责人：张旭

学科分类：E0704

资助金额：55.00

项目类别：面上项目

基于结构信息的神经网络机器翻译研究

批准号：61772261

批准年份：2017

负责人：黄书剑

学科分类：F0211

资助金额：59.00

项目类别：面上项目

基于神经网络的蒙汉机器翻译研究

批准号：61762072

批准年份：2017

负责人：王斯日古楞

学科分类：F0211

资助金额：38.00

项目类别：地区科学基金项目

基于强化学习的神经机器翻译研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

病毒性脑炎患儿脑电图、神经功能、免疫功能及相关因子水平检测与意义

妊娠对雌性大鼠冷防御性肩胛间区棕色脂肪组织产热的影响及其机制

基于铁路客流分配的旅客列车开行方案调整方法

一种基于多层设计空间缩减策略的近似高维优化方法

神经退行性疾病发病机制的研究进展

冯洋的其他基金

MnBi2Te4边态输运和磁性的空间分辨研究

相似国自然基金