2009年国际评测表明,数据驱动和知识驱动机器翻译的译文质量不相上下,仅采用单一的方法很难满足用户的需要,对统计和规则机器翻译的译文错误分析表明,不同机器翻译系统所出现的错误类型是互补的,将不同方法进行混合成了提高机器翻译质量的合理途径。本项目将研究一种将统计与传统基于实例、模板和规则的多引擎方法进行深层结合的混合策略的机器翻译方法,首先利用传统多引擎对输入句子进行剖析并生成句法树,然后采用自顶向下的策略遍历该句法树,对句法树中的单个节点和部分跨句法的连续节点,取其叶节点的原文与统计机器翻译所训练出的短语翻译概率表进行智能匹配,利用短语翻译表的译文来达到提高输出译文流利度和准确度的目的。本项目提出的方法既利用了统计翻译引擎所提供的细粒度知识,又利用了句法树在解决句子的深层和长距离相关性问题方面的优势,因此能显著提高机器翻译的译文质量。本课题的研究成果将有力推动混合引擎机器翻译技术的发展。
本项目研究统计与传统基于实例、模板和规则的多引擎方法进行深层结合的混合策略的机器翻译方法,一方面利用了统计机器翻译的细粒度知识来丰富传统多引擎翻译的数据资源,另一方面充分利用传统多引擎翻译在句法分析,翻译模板匹配翻译及译文调序方面的优势。本项目的研究内容包括统计短语翻译表和传统多引擎深层结合的方法、统计与规则相结合的翻译模板的自动提取、基于句法树和语言模型的统计短语表智能搜索匹配算法3个部分。本项目取得的重要结果是通过实验研究和理论分析,特别是提取的统计翻译表和翻译模版显著改进了机器翻译译文质量。本项目通过提取的特定领域统计表中的术语及语言模型矫正不准确的翻译,混合翻译系统相较于基线的统计机器翻译系统和传统的多引擎翻译系统的BLEU值分别提高了约2% 和7%。本项目的科学意义在于结合数据驱动和知识驱动的混合机器翻译, 鉴于不同的机器翻译方法之间存在着优势互补的特点,多范式融合的方法成为提高机器翻译质量的合理途径。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于多模态信息特征融合的犯罪预测算法研究
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
多空间交互协同过滤推荐
多源数据驱动CNN-GRU模型的公交客流量分类预测
基于资本驱动的新型互联网营造系统初探
基于图的统计机器翻译方法研究
基于知识的智能机器翻译方法研究
基于语言理解的机器翻译方法研究
基于深度句法的统计机器翻译方法研究