面向专利文献的统计机器翻译语境分析

基本信息
批准号:61303152
项目类别:青年科学基金项目
资助金额:22.00
负责人:何彦青
学科分类:
依托单位:中国科学技术信息研究所
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:王惠临,张均胜,高影繁,石崇德,屈鹏,李永锋
关键词:
专利文献统计机器翻译语境分析
结项摘要

Statistical machine translation system for patent texts still can not really meet the quality requirements of the actual translation. It can neither provide a reliable translation strategy for long sentences in patent texts, nor automatically employ the context of the source texts to translate patent discourse. So it is combined with rule-based machine translation or plays a role of a human translation aids. The application will organically combine the analysis of long sentences together with context analysis and propose automatic contextual analysis of statistical machine translation. In order to solve the key problems for the patent texts, the focuses in this research are listed as follows: 1)High precision of Long sentence analysis for patent texts to simplify the complex long sentence; 2)Context analysis based on appropriate semantic unit for patent texts to improve the semantic understanding ability of machine translation system; 3) Context based statistical machine translation for patent texts to obtain target translation. The overcome of key technologies in the application will greatly enhance the ability of the automatic context analysis of machine translation systems for patent texts and provide statistical machine translation system with higher accuracy, which not only has important theoretical innovation in the machine translation, but also has important application value for patent texts processing.

直至目前,面向专利文献的统计机器翻译系统尚不能满足文献翻译的实际需要,它未能提供一种切实可行的长句翻译策略,也无法利用上下文语境来实现篇章的翻译。因此它大多作为人工翻译的辅助工具或与规则系统融合使用。本研究尝试着将专利文献的长句分析和上下文语境分析有机地结合起来,提出具备自动专利语境分析功能的统计机器翻译方法。该方法针对专利文献机器翻译中的关键问题与技术难点,分别提出"高精度的专利文献的长句分析方法"用于进行专利文本的复杂长句简化、"适中语义粒度的专利文献上下文语境分析功能"用以加深机器翻译系统对句子乃至篇章的语义理解以及"基于专利语境的统计机器翻译模型"以生成目标翻译。该项研究中关键技术的攻克,将极大地提高机器翻译系统对于专利文献的语境自动分析能力,获得准确率更高的统计机器翻译系统,这不仅在机器翻译领域具有重要的理论创新意义,而且在专利文献处理中具有重要的应用价值。

项目摘要

面向专利文献的统计机器翻译系统常常不能满足文献翻译的实际需要, 它未能提供一种切实可行的长句翻译策略,也无法利用上下文语境来实现篇章的翻译。因此 它大多作为人工翻译的辅助工具或与规则系统融合使用。本研究针对专利文献进行术语识别和翻译、长句简化、浅层语义分析等技术形成上下文语境,提出具备自动专利语境分析功能的统计机器翻译方法。该方法着力解决专利文献机器翻译中的关键问题与技术难点,分别提出“较高精度的专利文献的长句分析方法”用于进行专利文本的复杂长句简化、“融合多粒度概念信息体的专利文献上下文语境分析功能”用以加深机器翻译系统对句子乃至篇章的语义理解以及“基于专利语境的统计机器翻译系统以生成目标翻译。该项研究中关键技术的攻克,提高了机器翻译系统对于专利文献的语境自动分析能力,获得了准确率更高的统计机器翻译系统。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

何彦青的其他基金

相似国自然基金

1

面向科技文献的机器翻译关键技术研究

批准号:60873167
批准年份:2008
负责人:吕雅娟
学科分类:F0211
资助金额:30.00
项目类别:面上项目
2

面向低资源语言机器翻译的跨语言语境化向量表示与迁移研究

批准号:61902024
批准年份:2019
负责人:李洪政
学科分类:F0211
资助金额:27.00
项目类别:青年科学基金项目
3

面向统计机器翻译的同步短语树结构归约机制研究

批准号:61273319
批准年份:2012
负责人:段湘煜
学科分类:F0606
资助金额:80.00
项目类别:面上项目
4

面向辅助翻译的统计机器翻译自诊断和自纠错方法研究

批准号:61100085
批准年份:2011
负责人:杜金华
学科分类:F0211
资助金额:23.00
项目类别:青年科学基金项目