汉英双语依存句法分析模型和算法研究

基本信息
批准号:61203314
项目类别:青年科学基金项目
资助金额:24.00
负责人:陈文亮
学科分类:
依托单位:苏州大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:贾震斌,王步康,王荣洋,庞磊,华秀丽
关键词:
双语树库依存句法分析依存语言模型大规模语料特征表示
结项摘要

Dependency parsing is one of the most important research topics in natural language processing. The previous studies for dependency parsing focus on parsing monolingual sentences. In recent years, bitext dependency parsing is getting more and more attention because there is a large amount of unlabeled bilingual sentences available for applications, such as dependency-based statistical machine translation (SMT). ..This project aims to improve bitext dependency parsing and build a platform for Chinese-English bitext dependency parsing. The main content includes: 1) proposing supervised bitext dependency parsing models; 2) exploiting features based on large-scale data; 3) building a learning framework for interaction between bitext dependency parsing and SMT; and 4) Integrating the above techniques to improve the performance of Chinese-English bitext dependency parsing and dependency-based SMT. The current research on bitext dependency parsing is in the very beginning stage. This project will make important contributions for Chinese syntax parsing and machine translation.

依存句法分析是自然语言处理的一个核心研究问题。已有研究主要基于单语文本,即输入单语句子,输出对应的依存树。由于大规模双语对齐文本的出现和依存句法驱动的统计机器翻译的应用需求,最近几年双语依存句法分析日益受到重视。本项目重点研究基于汉英双语对齐文本的依存句法分析,即汉英双语依存句法分析。主要研究内容包括:1)研究有指导的双语依存句法分析模型定义、解码算法和特征表示;2)研究基于大规模语料的特征表示和特征的领域自适应问题;3)探索双语依存句法分析和统计机器翻译的交互学习机制;4)集成上述研究成果,构造一个统一的基于图模型的汉英双语依存句法分析平台。当前汉英双语依存句法分析研究还处于起步阶段,本项目的开展将为汉语句法分析技术和机器翻译研究作出重要贡献,具有重要的研究价值和应用价值。

项目摘要

依存结构句法分析是对句子进行结构分析,以得到句子中词与词之间依赖关系的处理过程。作为自然语言处理和中文信息处理领域的核心研究课题之一,依存句法分析已经被广泛应用于其它自然语言处理任务中。已有研究主要基于单语文本,即输入单语句子,输出对应的依存树。由于大规模双语对齐文本的出现和依存句法驱动的统计机器翻译的应用需求,最近几年双语依存句法分析日益受到重视。本项目重点研究基于汉英双语对齐文本的依存句法分析,即汉英双语依存句法分析。项目开展三年来,课题组主要在如下方面进行探索研究:1)提出新的句法分析模型,并研究词性标注和句法分析的联合模型;2)利用大规模语料提出基于依存语言模型的特征表示和特征自动变换方法;3)探索中英文之间约束,研究自动语法推导和句法映射;4)研究如何与后续应用之间的交互。主要成果如下:1)出版英文专著一本;2)发表12篇论文,其中领域内顶级会议论文6篇、IEEE期刊论文4篇;3)两次国际重要会议讲习报告(Tutorial);4)申请专利3项;5)培养4名硕士生和1名博士生;6)实现一个汉英双语依存分析平台。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

陈文亮的其他基金

相似国自然基金

1

汉英双语者词汇产出和理解过程中双语控制中枢的有效连通性研究

批准号:31500924
批准年份:2015
负责人:杨静
学科分类:C0907
资助金额:20.00
项目类别:青年科学基金项目
2

知识驱动的汉语网络文本依存句法分析

批准号:61876116
批准年份:2018
负责人:李正华
学科分类:F0606
资助金额:64.00
项目类别:面上项目
3

汉语依存句法分析若干关键技术研究

批准号:60803093
批准年份:2008
负责人:车万翔
学科分类:F0211
资助金额:19.00
项目类别:青年科学基金项目
4

依存句法分析子结构可信度计算研究

批准号:61370164
批准年份:2013
负责人:车万翔
学科分类:F0211
资助金额:75.00
项目类别:面上项目