基于图的统计机器翻译方法研究

基本信息

批准号：61003111

项目类别：青年科学基金项目

资助金额：7.00

负责人：巢文涵

学科分类：

依托单位：北京航空航天大学

批准年份：2010

结题年份：2011

起止时间：2011-01-01 - 2011-12-31

项目状态：已结题

项目参与者：百晓,尹晓诗,张春晖,王君,胡必云,赵小建,付蔚,常达

关键词：

语料库选择统计机器翻译语料库优化图解码

结项摘要

在统计机器翻译中，除了语料库的规模之外，如何充分利用语料库至关重要。典型的机器翻译方法，其基本假设是：语料库中的句对都是高质量的翻译对，且句对之间互相独立，该假设过于严格。因此，本课题将针对此问题进行深入研究，试图放松该假设的强约束，基本思路是：基于图构造语料库中句对或者句子之间的内部联系，利用形成的拓扑结构，研究如何提高翻译模型的质量和解码的质量。具体包括：1、基于图的语料库质量评价模型和优化方法研究，力求使得高质量的句对在训练翻译模型时获得更大的比重，以提高翻译模型的质量；2、基于图的语料库选择方法研究，确保获得语料库的完备集合，保证翻译质量的同时，耗费最少的计算或人工翻译等资源；3、基于图的解码方法研究，利用语料库的内部结构来指导解码的完成，提高翻译的质量。本课题将阐明语料库的拓扑结构对机器翻译的影响机制，给出基于图的语料库优化和选择算法以及解码算法，形成基于图的统计机器翻译框架。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2020

DOI：

发表时间：2021

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.7498/aps.68.20181682

发表时间：2019

巢文涵的其他基金

相似国自然基金

基于深度句法的统计机器翻译方法研究

批准号：61672138

批准年份：2016

负责人：肖桐

学科分类：F0211

资助金额：16.00

项目类别：面上项目

基于短语结构转换模板的统计机器翻译方法研究

批准号：60573188

批准年份：2005

负责人：刘群

学科分类：F0211

资助金额：23.00

项目类别：面上项目

基于词汇语义的统计机器翻译研究

批准号：61403269

批准年份：2014

负责人：熊德意

学科分类：F0606

资助金额：25.00

项目类别：青年科学基金项目

基于句子语义结构的统计机器翻译研究

批准号：61401295

批准年份：2014

负责人：李军辉

学科分类：F0113

资助金额：25.00

项目类别：青年科学基金项目

基于图的统计机器翻译方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于多色集合理论的医院异常工作流处理建模

药食兼用真菌蛹虫草的液体发酵培养条件优化

现代优化理论与应用

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

巢文涵的其他基金

相似国自然基金