在统计机器翻译中,除了语料库的规模之外,如何充分利用语料库至关重要。典型的机器翻译方法,其基本假设是:语料库中的句对都是高质量的翻译对,且句对之间互相独立,该假设过于严格。因此,本课题将针对此问题进行深入研究,试图放松该假设的强约束,基本思路是:基于图构造语料库中句对或者句子之间的内部联系,利用形成的拓扑结构,研究如何提高翻译模型的质量和解码的质量。具体包括:1、基于图的语料库质量评价模型和优化方法研究,力求使得高质量的句对在训练翻译模型时获得更大的比重,以提高翻译模型的质量;2、基于图的语料库选择方法研究,确保获得语料库的完备集合,保证翻译质量的同时,耗费最少的计算或人工翻译等资源;3、基于图的解码方法研究,利用语料库的内部结构来指导解码的完成,提高翻译的质量。本课题将阐明语料库的拓扑结构对机器翻译的影响机制,给出基于图的语料库优化和选择算法以及解码算法,形成基于图的统计机器翻译框架。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
基于多色集合理论的医院异常工作流处理建模
药食兼用真菌蛹虫草的液体发酵培养条件优化
现代优化理论与应用
高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析
基于深度句法的统计机器翻译方法研究
基于短语结构转换模板的统计机器翻译方法研究
基于词汇语义的统计机器翻译研究
基于句子语义结构的统计机器翻译研究