Dependency parsing is one of the most important research topics in natural language processing. The previous studies for dependency parsing focus on parsing monolingual sentences. In recent years, bitext dependency parsing is getting more and more attention because there is a large amount of unlabeled bilingual sentences available for applications, such as dependency-based statistical machine translation (SMT). ..This project aims to improve bitext dependency parsing and build a platform for Chinese-English bitext dependency parsing. The main content includes: 1) proposing supervised bitext dependency parsing models; 2) exploiting features based on large-scale data; 3) building a learning framework for interaction between bitext dependency parsing and SMT; and 4) Integrating the above techniques to improve the performance of Chinese-English bitext dependency parsing and dependency-based SMT. The current research on bitext dependency parsing is in the very beginning stage. This project will make important contributions for Chinese syntax parsing and machine translation.
依存句法分析是自然语言处理的一个核心研究问题。已有研究主要基于单语文本,即输入单语句子,输出对应的依存树。由于大规模双语对齐文本的出现和依存句法驱动的统计机器翻译的应用需求,最近几年双语依存句法分析日益受到重视。本项目重点研究基于汉英双语对齐文本的依存句法分析,即汉英双语依存句法分析。主要研究内容包括:1)研究有指导的双语依存句法分析模型定义、解码算法和特征表示;2)研究基于大规模语料的特征表示和特征的领域自适应问题;3)探索双语依存句法分析和统计机器翻译的交互学习机制;4)集成上述研究成果,构造一个统一的基于图模型的汉英双语依存句法分析平台。当前汉英双语依存句法分析研究还处于起步阶段,本项目的开展将为汉语句法分析技术和机器翻译研究作出重要贡献,具有重要的研究价值和应用价值。
依存结构句法分析是对句子进行结构分析,以得到句子中词与词之间依赖关系的处理过程。作为自然语言处理和中文信息处理领域的核心研究课题之一,依存句法分析已经被广泛应用于其它自然语言处理任务中。已有研究主要基于单语文本,即输入单语句子,输出对应的依存树。由于大规模双语对齐文本的出现和依存句法驱动的统计机器翻译的应用需求,最近几年双语依存句法分析日益受到重视。本项目重点研究基于汉英双语对齐文本的依存句法分析,即汉英双语依存句法分析。项目开展三年来,课题组主要在如下方面进行探索研究:1)提出新的句法分析模型,并研究词性标注和句法分析的联合模型;2)利用大规模语料提出基于依存语言模型的特征表示和特征自动变换方法;3)探索中英文之间约束,研究自动语法推导和句法映射;4)研究如何与后续应用之间的交互。主要成果如下:1)出版英文专著一本;2)发表12篇论文,其中领域内顶级会议论文6篇、IEEE期刊论文4篇;3)两次国际重要会议讲习报告(Tutorial);4)申请专利3项;5)培养4名硕士生和1名博士生;6)实现一个汉英双语依存分析平台。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
二维FM系统的同时故障检测与控制
扶贫资源输入对贫困地区分配公平的影响
基于直观图的三支概念获取及属性特征分析
LTNE条件下界面对流传热系数对部分填充多孔介质通道传热特性的影响
汉英双语者词汇产出和理解过程中双语控制中枢的有效连通性研究
知识驱动的汉语网络文本依存句法分析
汉语依存句法分析若干关键技术研究
依存句法分析子结构可信度计算研究