基于强化学习的神经机器翻译研究

基本信息
批准号:61876174
项目类别:面上项目
资助金额:16.00
负责人:冯洋
学科分类:
依托单位:中国科学院计算技术研究所
批准年份:2018
结题年份:2019
起止时间:2019-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:刘群,张金超,马青松,张文,李京谕,薛海洋
关键词:
策略梯度算法神经机器翻译强化学习序列到序列模型双向翻译
结项摘要

Recently reinforcement learning has shown its superiority on machine translation and drawn more attention. It works by adjusting the behavior of the agent according to the defined rewards so that the agent can take the action which leads to a high reward. In this project, we apply reinforcement learning to resolve the problem caused by the discrepancy of target context between training and test. We take as the teacher the model which uses as context the previous words from ground truth translation, and take as the student the model which uses as context the previous word generated by the model, then use the probabilities from the teacher as rewards to guide the training of the student under the framework of reinforcement learning.

最近强化学习在机器翻译中表现出优异的性能,受到越来越多的关注。它通过定义的奖励函数来调整当前智能体的行为,使得智能体倾向于采用奖励高的行动。本项目采用强化学习的方法来解决神经机器翻译中由于训练和测试使用的上文不一致引起模型偏差的问题。我们将以参考译文中的词为上文得到模型作为老师模型,将以模型生成的词作为上文得到的模型作为学生模型,用老师模型生成奖励来指导学生模型进行优化。

项目摘要

神经机器翻译中的曝光偏差问题受到了人们越来越多的关注。曝光偏差是指神经机器翻译模型的词级别优化方法中存在的训练与测试不一致的现象。目前,通常的解决方案是使用序列级训练方法来缓解模型的曝光偏差问题,对模型的序列级训练则一般是基于强化学习算法来实现。在本项目中,一方面,我们提出了谕示词方法,通过在训练时向模型输入一定的谕示词来减小训练与测试的差异,在基于强化学习的序列级训练方法外探索了缓解曝光偏差问题的另一种思路。实验表明,谕示词方法能有效地缓解翻译模型的曝光偏差、提升模型的翻译质量;另一方面,我们进一步地探索了强化学习算法在神经机器翻译上的应用,验证了序列级训练在非自回归模型上的有效性。实验表明,对非自回归模型进行基于强化学习的序列级训练能有效地提升模型的翻译质量、减少译文中的过翻译、漏翻译错误。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021

冯洋的其他基金

批准号:11904053
批准年份:2019
资助金额:27.00
项目类别:青年科学基金项目

相似国自然基金

1

面向神经机器翻译的结构学习方法研究

批准号:61876035
批准年份:2018
负责人:肖桐
学科分类:F0606
资助金额:62.00
项目类别:面上项目
2

基于神经机器翻译的电网故障诊断

批准号:51877079
批准年份:2018
负责人:张旭
学科分类:E0704
资助金额:55.00
项目类别:面上项目
3

基于结构信息的神经网络机器翻译研究

批准号:61772261
批准年份:2017
负责人:黄书剑
学科分类:F0211
资助金额:59.00
项目类别:面上项目
4

基于神经网络的蒙汉机器翻译研究

批准号:61762072
批准年份:2017
负责人:王斯日古楞
学科分类:F0211
资助金额:38.00
项目类别:地区科学基金项目