基于用户反馈的多策略翻译在线融合方法研究

基本信息
批准号:61272384
项目类别:面上项目
资助金额:80.00
负责人:杨沐昀
学科分类:
依托单位:哈尔滨工业大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:齐浩亮,陈鄞,朱俊国,孙叔琦,王晓春,齐丽敏,朱晓宁,张宇,李绪维
关键词:
多策略翻译用户反馈在线学习
结项摘要

With the pressing demands on translation service brought by the Internet, the MT technology is faced with the challenge to meet the complex and flexible end user needs. The hybrid MT is a promising solution to this issue owing to its pursuing to combine the merits of various existing MT methods. In contrast to the up-to-date system combination technology, this project treats the hybrid MT as an online learning task to combine proper MT results for different users' needs. Starting from an examination on current system combination techniques, this project first tries to resolve the duplicate feature space issue between the system combination and the translation modeling process via feature mining. Then, it explores to build a user-centered rather than translation-quality-centered measure via user feedbacks for translation optimization, so as to eliminate the bias for SMT among current automatic evaluation metrics. Finally, the project investigates into the construction of an online ranking model to enable an dynamic multi-strategy MT process to different real user needs. In addition, the attainments of this project would be informative on how to combine the multiple translation knowledges and translation models for a personalized MT result.

随着互联网时代对机器翻译的需求凸显,如何利用现有翻译技术满足广泛灵活的用户需求已成为机器翻译研究的巨大挑战。多策略机器翻译方法旨在融合多种翻译模型的优势,是解决这一问题的合理对策。与现有系统融合不同,本课题将多策略翻译视为一种满足多变用户需求的在线学习问题。课题首先以译文融合特征挖掘为基础,尝试解决译文融合时使用的特征与翻译建模过程同构的问题;进而分析翻译系统用户的行为,从中量化用户满意度而不单纯是译文质量作为融合目标,以解决现有自动翻译评价倾向于SMT结果的偏置问题;最终针对复杂多样的实际翻译需求,引入在线学习机制,探索实现基于在线排序学习的多策略翻译融合方法。课题目的是研究适用于机器翻译问题的在线机器学习方法,实现一个性能良好的基于在线学习的多策略机器翻译模型,为建立一种能够综合利用多种翻译模型和翻译知识以满足用户个性需求的多策略翻译机理进行有益的探索。

项目摘要

随着互联网时代机器翻译服务需求的日益增加,如何迅速、高效利用用户使用过程中产生的翻译反馈来持续改进机器翻译性能、满足各种翻译需求,提升用户体验成为一个日益迫切的挑战。课题研究主要围绕以下三个方面(共十项研究要点)展开:.. 在翻译用户反馈的获取与分析方面,课题主要探索了翻译反馈的众包获取、基于用户反馈信息和多粒度融合的机器翻译自动评价方法、和翻译反馈缺失信息的预测三个问题。提出了一种基于多粒度融合的机器翻译自动评价方法,发表在人工智能领域顶级会议IJCAI’2013上,实验结果优于此前国际公开技术评测中的最好性能。.. 在翻译反馈的多策略融合方面,课题组开展了四项研究:基于规则的翻译反馈融合方法、基于实例的翻译反馈融合方法、基于统计的翻译反馈融合关键技术、和基于伪反馈的翻译译文优化研究。其中基于实例的翻译反馈融合技术可以提高公开翻译引擎的性能0.64个BELU得分,超过该任务上的评测最好成绩;基于深度学习的翻译反馈篇章级建模能够刻划句子以上层面的翻译信息,提升70%以上的句子翻译质量;基于伪反馈的翻译译文优化方法可以在缺乏反馈的情况下,提升通用翻译引擎质量19.4%。.. 在面向译文融合的在线学习方法方面,开展了在线翻译训练模型的分析与改进、面向翻译反馈融合的短文本在线学习方法和面向翻译反馈的排序学习方法研究。针对句子级翻译反馈的在线学习,课题设计了一种融合历史信息的在线学习算法,解决了传统在线学习算法用于短文本数据性能不佳的问题。还提出了一种时间敏感的排序学习方法,解决了无优先级信息的翻译反馈上的排序损失函数设计。上述两种方法在微博的过滤和检索任务上,均超过了以往评测中的最好成绩。.. 课题研究表明,虽然互联网翻译用户的反馈并不像他们的搜索行为那样容易获得,但是即使是小规模的翻译反馈对于统计机器翻译的性能提升作用仍然不可忽视。在有限的翻译反馈数据上,综合采用多种翻译策略,可以用户提供定制的个性化的翻译结果,进一步提升用户体验。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022

杨沐昀的其他基金

批准号:60773066
批准年份:2007
资助金额:26.00
项目类别:面上项目

相似国自然基金

1

面向辅助翻译的多模型融合方法研究

批准号:61402478
批准年份:2014
负责人:汪昆
学科分类:F0211
资助金额:26.00
项目类别:青年科学基金项目
2

基于多通道混合融合的在线学习方法研究

批准号:60603073
批准年份:2006
负责人:王绪刚
学科分类:F0209
资助金额:27.00
项目类别:青年科学基金项目
3

基于观测序列反馈的多源导航信息融合方法研究

批准号:61903378
批准年份:2019
负责人:冯波
学科分类:F0307
资助金额:25.00
项目类别:青年科学基金项目
4

基于在线多源冲突数据融合分类方法的信用评级研究

批准号:71701116
批准年份:2017
负责人:董媛香
学科分类:G0112
资助金额:18.00
项目类别:青年科学基金项目