互译语言形态非对称的统计机器翻译模型构造方法研究

基本信息
批准号:61070099
项目类别:面上项目
资助金额:32.00
负责人:李淼
学科分类:
依托单位:中国科学院合肥物质科学研究院
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:雪艳,陈雷,张浩东,淑琴,胡泽林,乌达巴拉,曾伟辉,李文,朱海
关键词:
统计机器翻译形态分析模型融合
结项摘要

在统计机器翻译过程中,由于互译语言(源语言与目标语言)形态结构不对称,极易造成译文错误。2005年以来,将语言学形态知识应用于统计机器翻译的方法引起了国内外学者的广泛关注,并围绕英语/捷克语、英语/土耳其语等形态非对称语言的机器翻译开展了研究。我国少数民族语言大多属于形态丰富语言(屈折语、黏着语),而汉语属非形态语言(孤立语)。在汉/民机器翻译中,由于语言形态结构不对称,经常导致译文在语法、语义、语用等层面出现错误。本项目针对上述问题,拟开展以下研究:1、多层级的形态分析方法;2、形态信息与统计模型融合策略;3、融合形态信息机器翻译解码算法;并以语言形态差异较大的汉/蒙统计机器翻译为例,开展相关实验。.通过上述研究,探索应用形态学知识构建统计模型的机制;为形态丰富的屈折语和黏着语的形态处理提出有效的解决方案;为互译语言形态非对称的统计机器翻译模型构造理论方法提供新思路和依据。

项目摘要

在统计机器翻译系统中,由于互译语言形态结构不对称,极易造成译文错误。我国少数民族语言大多属于形态丰富语言(屈折语、黏着语),而汉语属非形态语言(孤立语)。在汉/民机器翻译中,由于语言形态结构不对称,经常导致译文在语法、语义、语用等层面出现错误。针对上述问题,在本项目中我们研究了多层级的形态分析方法,为形态丰富的屈折语和黏着语的形态处理提出了有效的解决方案;重点突破了应用形态学知识构建统计模型(尤其是调序模型)的机制,为互译语言形态非对称的统计机器翻译模型构造理论方法提供了新思路和依据;以语言形态差异较大的汉语和蒙古语为例,在机器翻译系统中进行实验验证;探索了基于Web的汉蒙语言资源自动挖掘技术,为中文语言资源联盟提供了一定的汉蒙平行语料。在2011年和2013年全国机器翻译研讨会(CWMT)的评测项目中,我们取得了良好的成绩,验证了本项目的研究成果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

李淼的其他基金

批准号:10226030
批准年份:2002
资助金额:2.50
项目类别:数学天元基金项目
批准号:11335012
批准年份:2013
资助金额:240.00
项目类别:重点项目
批准号:71603035
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:50949038
批准年份:2009
资助金额:9.00
项目类别:专项基金项目
批准号:30871451
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:10501032
批准年份:2005
资助金额:15.00
项目类别:青年科学基金项目
批准号:11675271
批准年份:2016
资助金额:58.00
项目类别:面上项目
批准号:90403030
批准年份:2004
资助金额:25.00
项目类别:重大研究计划
批准号:11371263
批准年份:2013
资助金额:50.00
项目类别:面上项目
批准号:81803453
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:81771304
批准年份:2017
资助金额:54.00
项目类别:面上项目
批准号:10535060
批准年份:2005
资助金额:120.00
项目类别:重点项目
批准号:10847201
批准年份:2008
资助金额:20.00
项目类别:专项基金项目
批准号:51705371
批准年份:2017
资助金额:22.00
项目类别:青年科学基金项目
批准号:51408335
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:81400016
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:10971146
批准年份:2009
资助金额:24.00
项目类别:面上项目
批准号:61273329
批准年份:2012
资助金额:82.00
项目类别:面上项目
批准号:11275247
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:31802169
批准年份:2018
资助金额:24.00
项目类别:青年科学基金项目
批准号:40702011
批准年份:2007
资助金额:20.00
项目类别:青年科学基金项目
批准号:81703468
批准年份:2017
资助金额:20.10
项目类别:青年科学基金项目
批准号:10975172
批准年份:2009
资助金额:38.00
项目类别:面上项目
批准号:11247602
批准年份:2012
资助金额:20.00
项目类别:专项基金项目
批准号:61572462
批准年份:2015
资助金额:64.00
项目类别:面上项目

相似国自然基金

1

融合语言知识与统计模型的机器翻译方法研究

批准号:60736014
批准年份:2007
负责人:刘群
学科分类:F0211
资助金额:180.00
项目类别:重点项目
2

基于主题模型的枢轴语言统计机器翻译研究

批准号:61303082
批准年份:2013
负责人:苏劲松
学科分类:F0211
资助金额:27.00
项目类别:青年科学基金项目
3

融入语言学知识的汉蒙统计机器翻译研究

批准号:61063014
批准年份:2010
负责人:王斯日古楞
学科分类:F0211
资助金额:28.00
项目类别:地区科学基金项目
4

基于语言理解的机器翻译方法研究

批准号:60975053
批准年份:2009
负责人:宗成庆
学科分类:F0606
资助金额:33.00
项目类别:面上项目