汉语篇章连贯性分析:话题结构、逻辑语义结构及其联合学习研究

基本信息
批准号:61472264
项目类别:面上项目
资助金额:81.00
负责人:孔芳
学科分类:
依托单位:苏州大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:钱培德,奚雪峰,钱忠,李生,丁彬,王剑,黄学华
关键词:
篇章分析联合学习话题结构篇章连贯性逻辑语义结构
结项摘要

The research on discourse analysis lags behind morphological and syntactic analysis. In particular, the research on Chinese discourse analysis just started. The lack of effective theoretical methodologies and corpora severely restricts the research on the computational model of Chinese discourse analysis. Logical semantic structure and topic structure describes discourse coherence from different perspective. This project mainly focuses on Chinese discourse coherence based on Chinese logical semantic structure and topic structure analysis. The project addresses Chinese discourse coherence from following aspects: 1) Propose an algorithm for implicit discourse relation identification combining multi-level knowledge, and implement an effective end-to-end Chinese logical semantic structure parser. Based on this platform, research on global optimization via ILP and structured perception framework. 2) Design and implement a high-performance algorithm for micro-topic structure analysis based on the theory of topic-comments relationship. Then research on macro-topic identification based on the micro-topic chains. 3) Analyze the relationship between logical semantic structure and topic structure from discourse coherence perspective. Propose and implement the joint learning of logical semantic structure and topic structure analysis based on syntactic and predict-argument structure.

与词法、句法分析相比,篇章分析研究相对滞后,特别是,汉语篇章分析的研究处于起步阶段,由于尚未形成成熟的理论体系,资源极为匮乏,因此相关计算模型的研究受到了严重的制约。篇章逻辑语义结构和话题结构从不同视角描述了篇章的连贯性,本项目将从汉语篇章逻辑语义结构和话题结构出发,基于已有的篇章分析和话题结构理论,重点研究汉语篇章的连贯性。主要的研究内容包括:1)提出并实现融合多种信息的隐式篇章逻辑关系识别方法,构建高性能的端到端的篇章逻辑语义分析平台,并基于该平台进行基于ILP和结构化感知器的全局优化研究;2)提出并实现基于话题-评述关系理论的微观话题结构分析方法,并在此基础上进行基于话题链的宏观话题识别研究;3)从连贯性视角分析汉语篇章逻辑语义结构和话题结构的关联性,并基于此提出并实现基于句法和谓词论元结构的汉语篇章逻辑语义结构和话题结果的联合学习方法。

项目摘要

词法、句法研究日趋成熟,篇章分析研究相对滞后,已经成为篇章理解核心要解决的关键问题之一。本项目从汉语篇章逻辑语义结构和话题结构的统一表示出发,基于已有的篇章分析和话题结构理论,重点研究汉语篇章的连贯性。主要完成了以下几个工作:.1)构建了端到端的汉语篇章逻辑语义结构解析器:从多模块级联构建完整的解析器,到基于转移系统实现多模块间的联合学习,最终形成了完整的高性能的逻辑语义结构解析器;.2)服务于逻辑语义结构和话题结构的联合学习,构建了基于主述位理论的话题结构资源库,并在此基础上进行了篇章视角的零指代的标注,为后续话题结构的可计算研究,以及篇章结构多层次联合学习奠定了语料基础;.3)构建了端到端的汉语篇章话题结构解析器:以各模块级联的方式构建了完整的解析器,包括主述位识别模块,话题推进识别和话题链识别模块等;.4)以汉语零指代为媒介进行汉语篇章逻辑语义结构和话题结构的联合学习:主述位识别的同时进行隐式主述位的确定,隐式主述位同时就是篇章中的零元素;这些零元素形成的指代链的构建,一方面有助于话题链的生成,另一方面对于篇章逻辑语义结构的确立意义重大;我们将篇章逻辑语义结构的构建过程看成是对分割点次序的排序过程,借助零指代的方式进行排序,进而完成逻辑语义结构的构建;逻辑语义结构的确定又决定了核心信息,即话题序列的形成,并最终构建形成话题链。.重要的成果主要包括:.1)构建了包含篇章视角零元素信息的汉语篇章逻辑语义结构和话题结构的统一语料库;.2)构建了高性能的汉语逻辑语义结构解析器;.3)构建了高性能的汉语话题结构解析器;.4)构建了基于主述位理论的汉语篇章联合解析器,能完成零元素识别、逻辑语义结构生成和话题链识别。.构建的资源库为后续汉语篇章多层次联合学习奠定了基础,形成的三个平台可为自然语言处理的各类应用提供多视角的汉语篇章信息,以帮助各类应用提升其性能。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

孔芳的其他基金

批准号:61876118
批准年份:2018
资助金额:62.00
项目类别:面上项目
批准号:91963105
批准年份:2019
资助金额:60.00
项目类别:重大研究计划
批准号:91222108
批准年份:2012
资助金额:70.00
项目类别:重大研究计划
批准号:21773244
批准年份:2017
资助金额:65.00
项目类别:面上项目
批准号:21001107
批准年份:2010
资助金额:19.00
项目类别:青年科学基金项目
批准号:61003153
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:61272257
批准年份:2012
资助金额:20.00
项目类别:面上项目

相似国自然基金

1

基于广义话题的汉语篇章结构研究

批准号:61171129
批准年份:2011
负责人:宋柔
学科分类:F0113
资助金额:62.00
项目类别:面上项目
2

汉语篇章连贯性分析计算模型研究

批准号:61402208
批准年份:2014
负责人:徐凡
学科分类:F0211
资助金额:24.00
项目类别:青年科学基金项目
3

面向篇章信息性的汉语篇章结构多层次联合分析研究

批准号:61876118
批准年份:2018
负责人:孔芳
学科分类:F0606
资助金额:62.00
项目类别:面上项目
4

基于配价结构和话题结构的汉语句法分析和语义计算模型研究

批准号:90920004
批准年份:2009
负责人:周国栋
学科分类:F0211
资助金额:50.00
项目类别:重大研究计划