Discourse structure analysis is one of the most important research areas in natural language processing. More and more researches indicated that the identification and analysis of discourse primary-secondary relationships play a critical role in discourse analysis. Most of researches on the discourse primary-secondary relationships in the past only toke it as auxiliary research task in discourse rhetorical structure analysis, and focused on the micro layer of discourse structure analysis. In this project , we first put forward the discourse primary-secondary relationships as an independent task of discourse structure analysis, through exploring the discourse-inherent micro and discourse-level macro primary-secondary relationships and the interaction between them, extend the rhetorical structure theory based on the macro structure theory to setup a representation schema driven by the macro-micro unified primary-secondary relationships. This project will build a corresponding annotated discourse structure analysis corpus based on the representation schema, then model the key tasks of discourse structure analysis respectively, including discourse relation discovery, primary-secondary relationship recognition, discourse structure tree building, discourse rhetorical structure recognition, and discourse theme structure recognition. Through studying the relevant optimization method, this project will finally construct an End-to-End discourse structure analysis platform based on the representation schema to provide support for the research of the corresponding application.
篇章结构分析是自然语言处理领域的一个重要研究方向。越来越多的研究表明,篇章主次关系对篇章结构分析举足轻重。目前大多数研究将篇章主次关系研究作为篇章修辞结构研究的一个辅助环节,且偏重于篇章结构分析的微观层面。本项目结合前人相关研究,提出了将篇章主次关系研究作为篇章结构分析的一个独立任务进行研究;通过深入研究微观主次关系和宏观篇章主次关系以及它们之间的交互作用,在宏观结构理论的基础上,扩展了修辞结构理论,提出了微观和宏观主次关系驱动的篇章结构表示体系;以该体系为基础,构建一定规模的篇章结构分析语料资源库;然后针对篇章结构分析中的篇章关系发现、篇章主次关系识别、篇章结构树生成、篇章修辞结构关系识别、篇章主题结构关系识别等关键任务分别提出基于该表示体系的计算模型,并研究相关的优化方法;最后,本项目将构建一个基于该表示体系的端到端的篇章结构分析平台,为相应的应用研究提供支撑。
本项目将篇章主次关系研究作为篇章结构分析的一个独立研究任务,从微观和宏观两方面进行系统和深入的研究,理清了篇章主次关系在篇章结构分析中的作用及与其他篇章语义间的关系。本项目在理论体系、语料资源、计算模型、系统平台、应用研究等方面开展了以下具体的研究工作:1)项目通过深入研究微观和宏观篇章主次关系以及它们之间的交互作用,在宏观结构理论的基础上,扩展了修辞结构理论,创新性地提出了微观和宏观主次关系驱动的篇章结构表示体系,完善了篇章结构理论及其在主次关系上的表示方法。2)以该体系为基础,项目构建了一定规模的新闻报道的宏观汉语篇章树库(MCDTB),并与课题组前期标注的微观汉语篇章树库统一起来,形成汉语篇章分析的多层信息联合语料库,进一步推动了篇章结构分析的应用。3)以该体系结构和语料资源为基础,项目提出了篇章结构解析、篇章主次关系识别、篇章修辞结构关系识别等计算模型,如基于反向阅读策略的篇章结构分析、融合全局和局部信息的指针网络模型识别篇章结构、基于篇章主题的宏观篇章主次关系识别方法、基于分类和生成联合建模的篇章关系识别模型等。4)项目构建了基于该表示体系的端到端的篇章结构分析平台和篇章结构标注平台,为篇章结构分析的实用化奠定了基础,为篇章分析的深入研究提供了支撑。此外,项目还拓展了基于篇章结构的相关应用研究,如事件抽取、事件关系识别、事件可信度分析、自动文摘、作文评分等,研究成果表明,篇章分析可以有效地推动这些应用的性能提升。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
面向篇章信息性的汉语篇章结构多层次联合分析研究
光学薄膜宏观应力与微观结构变化关系研究
非球体随机填充结构的宏观和微观特性研究
汉英篇章衔接对齐资源构建与分析研究