汉语篇章衔接性分析:指代、省略及其消歧研究

基本信息
批准号:61272257
项目类别:面上项目
资助金额:20.00
负责人:孔芳
学科分类:
依托单位:苏州大学
批准年份:2012
结题年份:2013
起止时间:2013-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:钱培德,朱苏阳,钱忠,张超,王志昊,张鹏
关键词:
篇章衔接性省略指代消解
结项摘要

Discourse cohesion analysis plays a critical role in discourse understanding. This project addresses two essential issues in discourse cohesion mechanism, anaphora and ellipsis, where there is only a little research due to the lack of annotated corpora. In particular, this project focuses on anaphora and ellipsis resolution in Chinese. First, a large scale corpus will be annotated with various kinds of anaphora and ellipsis information. Second, an event anaphora resolution framework is proposed to combine multi-level information in effectively identifying probable antecedent candidates of an event anaphor, constructing adaptable dynamic event anaphora tree spans for event anaphora resolution, and presenting context similarity algorithms based on entity coreference chains to compute the context similarity between the event anaphor and the antecedent candidate more effectively. Third, various solutions are explored to address ellipsis from the perspectives of syntax, semantics and pragmatics. Finally, a unified platform is proposed for both anaphora and ellipsis resolution via joint learning model. .In summary, this project will promote the research on Chinese discourse cohesion analysis, and are thus valuable for the development of computational linguistics and Chinese information processing.

篇章衔接性分析是篇章理解的基础,而指代和省略是衔接机制中的核心问题,同时也是难点所在。受限于语料资源,目前国内外对于汉语篇章衔接性中指代和省略的研究进展缓慢。本项目将结合汉语自身的特点和规律,针对汉语篇章衔接性中的指代和省略问题展开研究。首先建立较大规模的汉语篇章衔接性标注语料库;在此基础上,通过先行事件候选的触发词识别、动态事件指代关系树的获取以及适用于事件指代消解的基于实体指代链的上下文相似度计算方法的研究,提出并实现综合使用多层面信息的事件指代消解方法;对于汉语中的省略,将从句法、语义和语用三个视角识别省略及对其进行消解;最后再利用联合学习机制将指代和省略消歧融合,建立统一的篇章消歧平台。本项目开展的研究工作对于推进汉语篇章衔接性分析的研究,推动计算语言学研究和中文信息技术的发展具有重要的理论意义和应用价值。

项目摘要

篇章衔接性分析是篇章理解的基础,本课题以衔接机制中的指代和省略为研究对象,主要进行了三方面的工作:在OntoNotes语料库已有标注的基础上进行了实体、事件指代的标注,在空语类的基础上进行了中文零指代和省略项的标注,形成了一定规模的汉语篇章衔接性语料库;在前期实体指代研究的基础上,进一步探索了适用于事件指代消解的基于实体指代链的上下文相似度计算方法,大大提升了事件指代消歧的性能;从句法语义等多角度探索了汉语中的省略,并利用联合机制将省略融入汉语的实体指代消歧,进一步提升了汉语实体指代的性能。.一年来,课题总体进展顺利,所有研究计划已按要求完成,达到预期目标。项目共发表论文7篇,其中国际顶级会议IJCAI/EMNLP/COLING长文各1篇,EI索引的会议论文1篇,中文信息学报2篇。申请专利3件,获得专利1件。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
4

针灸治疗胃食管反流病的研究进展

针灸治疗胃食管反流病的研究进展

DOI:
发表时间:2022
5

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018

孔芳的其他基金

批准号:61876118
批准年份:2018
资助金额:62.00
项目类别:面上项目
批准号:91963105
批准年份:2019
资助金额:60.00
项目类别:重大研究计划
批准号:61472264
批准年份:2014
资助金额:81.00
项目类别:面上项目
批准号:91222108
批准年份:2012
资助金额:70.00
项目类别:重大研究计划
批准号:21773244
批准年份:2017
资助金额:65.00
项目类别:面上项目
批准号:21001107
批准年份:2010
资助金额:19.00
项目类别:青年科学基金项目
批准号:61003153
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

维语实体指代消歧关键技术研究

批准号:61563051
批准年份:2015
负责人:禹龙
学科分类:F03
资助金额:40.00
项目类别:地区科学基金项目
2

汉语篇章连贯性分析计算模型研究

批准号:61402208
批准年份:2014
负责人:徐凡
学科分类:F0211
资助金额:24.00
项目类别:青年科学基金项目
3

面向篇章信息性的汉语篇章结构多层次联合分析研究

批准号:61876118
批准年份:2018
负责人:孔芳
学科分类:F0606
资助金额:62.00
项目类别:面上项目
4

汉英篇章衔接对齐资源构建与分析研究

批准号:61502149
批准年份:2015
负责人:李艳翠
学科分类:F0211
资助金额:21.00
项目类别:青年科学基金项目