混合策略的机器翻译方法研究

基本信息
批准号:61172101
项目类别:面上项目
资助金额:57.00
负责人:宋金平
学科分类:
依托单位:中国电子信息产业发展研究院
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:谢立宏,袁琦,王天华,何颖,郝秀文,邓桂蕊,李想
关键词:
混合策略统计机器翻译传统多引擎机器翻译
结项摘要

2009年国际评测表明,数据驱动和知识驱动机器翻译的译文质量不相上下,仅采用单一的方法很难满足用户的需要,对统计和规则机器翻译的译文错误分析表明,不同机器翻译系统所出现的错误类型是互补的,将不同方法进行混合成了提高机器翻译质量的合理途径。本项目将研究一种将统计与传统基于实例、模板和规则的多引擎方法进行深层结合的混合策略的机器翻译方法,首先利用传统多引擎对输入句子进行剖析并生成句法树,然后采用自顶向下的策略遍历该句法树,对句法树中的单个节点和部分跨句法的连续节点,取其叶节点的原文与统计机器翻译所训练出的短语翻译概率表进行智能匹配,利用短语翻译表的译文来达到提高输出译文流利度和准确度的目的。本项目提出的方法既利用了统计翻译引擎所提供的细粒度知识,又利用了句法树在解决句子的深层和长距离相关性问题方面的优势,因此能显著提高机器翻译的译文质量。本课题的研究成果将有力推动混合引擎机器翻译技术的发展。

项目摘要

本项目研究统计与传统基于实例、模板和规则的多引擎方法进行深层结合的混合策略的机器翻译方法,一方面利用了统计机器翻译的细粒度知识来丰富传统多引擎翻译的数据资源,另一方面充分利用传统多引擎翻译在句法分析,翻译模板匹配翻译及译文调序方面的优势。本项目的研究内容包括统计短语翻译表和传统多引擎深层结合的方法、统计与规则相结合的翻译模板的自动提取、基于句法树和语言模型的统计短语表智能搜索匹配算法3个部分。本项目取得的重要结果是通过实验研究和理论分析,特别是提取的统计翻译表和翻译模版显著改进了机器翻译译文质量。本项目通过提取的特定领域统计表中的术语及语言模型矫正不准确的翻译,混合翻译系统相较于基线的统计机器翻译系统和传统的多引擎翻译系统的BLEU值分别提高了约2% 和7%。本项目的科学意义在于结合数据驱动和知识驱动的混合机器翻译, 鉴于不同的机器翻译方法之间存在着优势互补的特点,多范式融合的方法成为提高机器翻译质量的合理途径。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
2

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
3

多空间交互协同过滤推荐

多空间交互协同过滤推荐

DOI:10.11896/jsjkx.201100031
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

基于资本驱动的新型互联网营造系统初探

基于资本驱动的新型互联网营造系统初探

DOI:
发表时间:2016

宋金平的其他基金

相似国自然基金

1

基于图的统计机器翻译方法研究

批准号:61003111
批准年份:2010
负责人:巢文涵
学科分类:F0211
资助金额:7.00
项目类别:青年科学基金项目
2

基于知识的智能机器翻译方法研究

批准号:U1836221
批准年份:2018
负责人:宗成庆
学科分类:F0606
资助金额:260.00
项目类别:联合基金项目
3

基于语言理解的机器翻译方法研究

批准号:60975053
批准年份:2009
负责人:宗成庆
学科分类:F0606
资助金额:33.00
项目类别:面上项目
4

基于深度句法的统计机器翻译方法研究

批准号:61672138
批准年份:2016
负责人:肖桐
学科分类:F0211
资助金额:16.00
项目类别:面上项目