The research on methods of Japanese Chinese machine translation plays an important significance on Chinese economy,national defense and the construction of national security.This application proposes a Japanese Chinese machine translation method integrating dependency grammar and case grammar into a new proposed Case-Dependency Grammar, which innovation is mainly reflected in: proposing a description form on case dependency syntax and a machine translation meathod of Case Dependency tree to string model based.The main contents include: 1)Japanese Case Dependency structure's description and its formal definition; 2)Japanese Case Dependency syntactic analysis's algorithm design and implementation, rules and parameter learning; 3)method based on Case Dependency structure tree to string translation,including translating mathematics models,training and decoding. We will thoroughly explore the formal description based on the case dependency structure tree to string model,large-scale real text oriented translation rules extraction and probability estimation, and efficient decoding algorithom.In this study,the research strategy mainly by statistics ,supplemented by the rule will be adopted.By implementing high-quality Japanese to Chinese translation system ,we can provide a reference to experience and methods of theoretical basis for statistical machine translation based on syntax between adhesion language and Chinese.
日汉机器翻译方法研究对我国国防、国家安全和经济建设具有重要意义。 .本项目提出了融合依存树到串模型和格语法的日汉机器翻译方法,创新性主要体现在:充分利用日语格语法特点,提出一种新的格依存句法结构描述形式和一种基于格依存树到串模型的机器翻译方法;主要研究内容包括:1)日语格依存结构描述及其形式化定义;2)日语格依存句法分析算法设计实现、规则或参数学习等;3)基于格依存结构的树到串翻译方法,包括翻译数学模型,训练和解码。 我们将深入探索基于格依存结构的树到串模型的形式化描述、面向大规模真实文本的翻译规则抽取和概率估计以及高效解码算法等问题。本研究拟采用统计为主规则为辅的研究策略,通过实现高质量的日汉翻译系统,为黏着语系与孤立语系间的基于句法的统计机器翻译实现提供借鉴经验和方法理论依据。
研究背景:.日汉机器翻译方法研究对我国的国防、国家安全和经济建设具有重要意义。..主要研究内容:.本项目提出了融合依存树到串模型和格语法的日汉机器翻译方法,创新性主要体现在:充分利用日语格语法特点,提出一种新的格依存句法结构描述形式和一种基于格依存树到串模型的机器翻译方法;主要研究内容包括:1)日语格依存结构描述及其形式化定义;2)日语格依存句法分析算法设计实现、规则或参数学习等;3)基于格依存结构的树到串翻译方法,包括翻译数学模型,训练和解码。..重要结果:.围绕本项目的主要研究内容展开研发工作,取得了丰硕的研究成果。共发表期刊论文和会议论文共计30余篇,其中包括Coling、EMNLP、ACL等顶级会议论文3篇、以及SCI论文4篇、EI论文5篇,核心期刊17篇。申报国家级发明专利9项,授权发明专利6项。培养硕士生20余人,博士生4人。..关键数据及其科学意义:.本项目注重机器翻译理论研究的同时,在培养研究生过程中,注重系统研发,并积累了大量的研究数据,累计构建了机器翻译平行语料库5千多万句对,其中,英汉平行语料库4千多万句对、日英汉平行语料库500万句对、日汉新闻领域500万句对、日汉词典150万词、日语动词词典4万词、日语格框架库52万词、日语名词格框架库16万词、日汉命名实体翻译对100万词。同时,还搭建了以日英汉三种不同语言为中心的机器翻译研发平台,包括基于规则/实例/统计机器翻译、以及神经网络机器翻译等系统。.本研究采用统计为主规则为辅的研究策略,实现了高质量的日汉翻译系统,为黏着语系与孤立语系间的基于句法的统计机器翻译实现提供借鉴经验和方法理论依据,并具有较大的实用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
基于FTA-BN模型的页岩气井口装置失效概率分析
串到树统计机器翻译的若干关键技术研究
基于汉英双向树串模型的统计机器翻译研究
基于树到串藏语句法翻译若干关键技术研究
藏语依存树库的构建