基于句法结构和篇章结构的统计机器翻译关键技术研究

基本信息
批准号:61373095
项目类别:面上项目
资助金额:79.00
负责人:张民
学科分类:
依托单位:苏州大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:陈文亮,贡正仙,李生,黄艳伟,刘欢欢
关键词:
双语句法推导句法结构篇章结构统计句法机器翻译
结项摘要

Structured knowledge of natural languages at syntactic and discourse levels is one kind of the most important features of natural languages. Statistical syntax-based machine translation treats machine translation as a process of converting source structures to target ones at single sentence level. Therefore, cross-language structure divergence and cross-sentence discourse information deficiency are two fundamental issues for the state-of-the-art statistical syntax-based machine translation. This proposal aims to focus on the following researches to address the two fundamental issues aforementioned: 1) from bilingual alignment and mapping viewpoints, study weakly-supervised and unsupervised bilingual grammar induction algorithms, automatically construct machine translation-oriented bilingual grammar rule systems and mapping mechanisms in order to solve the cross-language structure divergence issue; 2) establish the discourse-based model for statistical machine translation in order to impose consistent discourse structures and fundamental discourse features between source and target languages, and thus fill in the discourse information deficiency in the state-of-the-art statistical machine translation research. The research achievements from this proposal will establish the foundation of theory and technology for next generation syntax-based statistical machine translation, and provide guidance to deep semantic structures-based statistical machine translation in the future.

语言的结构性,包括句法和篇章等结构信息,是语言的基本特征之一。统计句法机器翻译把翻译看作是一个从源语言到目标语言的句法结构转换过程,而这种转换过程目前是以单一句子为基本单位进行的。因此,跨语言句法结构差异性和跨句子篇章结构信息的缺失是目前统计句法机器翻译面临的两个核心问题。本项目拟围绕这两个问题展开以下创新性研究:1)从双语映射角度出发,研究弱指导和无指导的双语句法推导算法,自动构建适合机器翻译的双语句法规则体系和映射机制,进而解决跨语言句法结构差异性;2)建立篇章级翻译模型,使得源语言篇章结构信息和篇章基本特征在目标语言中得到体现,使生成的目标语言具有良好的篇章一致性,进而填补机器翻译中篇章信息缺失这一研究空白。本项目预期成果不仅可以为下一代统计句法机器翻译奠定理论和技术基础,同时也可以为未来基于深层语义结构信息的统计机器翻译提供借鉴。

项目摘要

本项目研究语言间的结构性差异,从句法级别和篇章级别研究双语间的差异并对此建模,从而使统计机器翻译模型更好地处理跨语言句法结构差异性和跨句子篇章结构信息的缺失问题。本项目分别从两个方面开展研究:1)从双语句法映射角度出发,研究基于弱指导和无指导的双语句法推导,从而解决跨语言句法结构差异性;2)从双语篇章结构的映射角度出发,研究双语篇章话题分布以及双语篇章词汇语义等连接关系,从而改进机器翻译篇章级别的一致性和准确性。这两个方面的研究为统计机器翻译提供了理论和技术基础,在国际顶级学术期刊和学术会议发表论作,并就句法结构分析和机器翻译研究分别出版了两本专著,为未来基于深层语义结构信息的机器翻译研究提供参考和借鉴。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
3

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020
4

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
5

古戏台传音的秘密

古戏台传音的秘密

DOI:
发表时间:2021

张民的其他基金

批准号:21404084
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:61372119
批准年份:2013
资助金额:76.00
项目类别:面上项目
批准号:61872146
批准年份:2018
资助金额:63.00
项目类别:面上项目
批准号:61771355
批准年份:2017
资助金额:67.00
项目类别:面上项目
批准号:31870447
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:30871593
批准年份:2008
资助金额:33.00
项目类别:面上项目
批准号:30972042
批准年份:2009
资助金额:30.00
项目类别:面上项目
批准号:61432013
批准年份:2014
资助金额:350.00
项目类别:重点项目
批准号:61502171
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:61072008
批准年份:2010
资助金额:30.00
项目类别:面上项目
批准号:41571236
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:60507007
批准年份:2005
资助金额:24.00
项目类别:青年科学基金项目
批准号:31171781
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:31470520
批准年份:2014
资助金额:87.00
项目类别:面上项目
批准号:60871070
批准年份:2008
资助金额:37.00
项目类别:面上项目
批准号:31200353
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:61372004
批准年份:2013
资助金额:83.00
项目类别:面上项目

相似国自然基金

1

基于篇章语义的文档级统计机器翻译研究

批准号:61305088
批准年份:2013
负责人:贡正仙
学科分类:F0606
资助金额:25.00
项目类别:青年科学基金项目
2

基于深度句法的统计机器翻译方法研究

批准号:61672138
批准年份:2016
负责人:肖桐
学科分类:F0211
资助金额:16.00
项目类别:面上项目
3

基于句法结构和语义框架的机器翻译自动评价方法研究

批准号:61379086
批准年份:2013
负责人:刘群
学科分类:F0211
资助金额:73.00
项目类别:面上项目
4

基于主干成分的句法统计机器翻译模型研究

批准号:61300097
批准年份:2013
负责人:肖桐
学科分类:F0211
资助金额:28.00
项目类别:青年科学基金项目