Discourse analysis is to analyze the text structure and the semantic relationship between the elementary discourse units from an overall perspective. Currently, no matter whether theoretical analysis, resource construction and computational modeling, the research on discourse analysis focuses on a particular characteristics, especially coherence and cohesion. This largely restricts discourse analysis and its wide application, especially for Chinese. Towards better text understanding, this project mainly focuses on multi-level jointly analysis of Chinese discourse structure from informativity perspective.The content of this project includes: 1)Propose a unified representation scheme for Chinese topic structure, which divides the topic structure of Chinese text into two layers, i.e., theme-rheme structure and coreference structure. And build a corresponding corpus of 10000 discourses. 2) Design and implement a Chinese coreference resolution system based on theme-rheme theory, mainly focus on Chinese zero pronoun resolution. And implement a computational model on Chinese discourse topic analysis, which can analyze the two layers of Chinese discourse topic structure jointly. 3) Propose and implement joint learning of Chinese topic structure and rhetorical structure for multi-level jointly analysis of Chinese discourse structure from informativity perspective.
篇章分析旨在从整体层次上分析出篇章蕴含的各种结构及其构成单元之间的语义关系,并利用上下文来理解篇章。目前,相关研究主要从连贯性或者衔接性视角出发,研究某种单一的篇章结构,缺乏相关篇章结构的联合分析研究。本项目服务于篇章理解,从篇章信息性的视角出发,进行篇章结构的多层次联合分析研究。主要研究内容包括:1)将汉语话题结构细分成主述位结构和指代结构两层,结合可计算性提出一套适合汉语篇章话题结构的统一表示体系,揭示汉语话题结构的内在规律,并以该表示体系为理论依据构建10000个篇章规模的标注语料库;2)基于主述位理论,对篇章指代结构(特别是零指代结构)展开研究,并建立融合主述位结构和指代结构的联合计算模型;3)研究篇章话题结构和修辞结构的协同机制,实现一个面向篇章信息性的汉语篇章结构多层次联合分析平台。
篇章分析旨在从整体层次上分析出篇章蕴含的各种结构及其构成单元之间的语义关系,并利用上下文来理解篇章。目前,相关研究主要从连贯性或者衔接性视角出发,研究某种单一的篇章结构,缺乏相关篇章结构的联合分析研究。本项目服务于篇章理解,从篇章信息性的视角 出发,进行篇章结构的多层次联合分析研究。主要研究内容包括:1)将汉语话题结构细分成主述位结构和指代结构两层,结合可计算性提出一套适合汉语篇章话题结构的统一表示体系, 揭示汉语话题结构的内在规律,并以该表示体系为理论依据构建10000个篇章规模的标注语料 库;2)基于主述位理论,对篇章指代结构(特别是零指代结构)展开研究,并建立融合主述 位结构和指代结构的联合计算模型;3)研究篇章话题结构和修辞结构的协同机制,实现一个面向篇章信息性的汉语篇章结构多层次联合分析平台。四年来项目按计划推进,顺利完成了各项工作,主要成果有:(1)结合篇章衔接和连贯性,融合篇章的微观和宏观给出了服务篇章多层信息联合分析的统一表示体系,实现从篇章基本单元到完整篇章结构的多层统一;(2)基于此完成了资源库建设;(3)通过关键技术的深入研究完成了完整的篇章结构多层次联合分析平台。上述这些成果的取得,特别是统一表示体系的确立,为高性能多层次篇章分析奠定了结实基础,而高性能多层次篇章分析必将进一步提升机器阅读理解的能力,为基于此的上层应用提供丰富的信息。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
汉语篇章理解的研究
基于广义话题的汉语篇章结构研究
汉语篇章连贯性分析:话题结构、逻辑语义结构及其联合学习研究
面向汉语篇章语义分析的框架推理技术研究