With the fast development of mobile Internet, hot topics emerge one after another. As the bridge to linking relevant events in a topic, event relation identification and event relation network construction become critical. Inspired by the topic structure theory and the semantic consistency theory, this project will focus on topic-oriented event relation extraction and network construction to solve the inherent diversity and ellipsis. The contributions of this project includes: 1) according to the diversity of event relations, it first proposes a three dimensional event relation representation on temporal, spatial and semantic dimensions, and then provides a corpus construction method based on active learning and label propagation; 2)it proposes a semantic consistency-based global optimization model on mono-dimension of event relations and a joint learning model on multi-dimension; 3) according to the ellipsis of cue information, it proposes the cross-document event relation extraction methods on Tree-LSTM and parallel inference, respectively; 4) it provides a construction method of event relation network based on optimal network, and then puts forward a computational model of network reliability based on multi-source fusion. This project is critical to promote the information extraction technology and to explore the cognitive mechanism of human language understanding.
随着移动互联网的发展,热点话题层出不穷。作为联系话题内相关事件的纽带,自动识别事件关系并围绕某个话题构建事件关系网络,对理解并获取话题核心内容至关重要。本项目将在话题结构和语义一致性等理论的指导下,研究面向话题的事件关系抽取与网络构建方法,重点解决事件关系多样性和信息缺失问题。主要研究内容如下:⑴针对事件关系多样性问题,提出了面向话题的事件关系时空义三维表示体系,并基于此开展基于主动学习和标签传播的事件关系语料库构建方法研究;⑵提出了基于语义一致性理论的文档级单维事件关系全局优化方法和多维事件关系联合学习方法;⑶针对信息缺失问题,提出了基于Tree-LSTM和平行推理的跨文档事件关系抽取方法;⑷提出了基于最优网络的事件关系网络构建方法,并基于此提出了基于多源融合的事件关系网络可信度计算模型。本项目的研究对于推动信息抽取技术的发展和探索人类语言理解的认知机理,具有重要科学意义。
随着移动互联网的发展,热点话题层出不穷。作为联系话题内相关事件的纽带,自动识别事件关系并围绕某个话题构建事件关系网络,对理解并获取话题核心内容至关重要。本项目在话题结构和语义一致性等理论的指导下,研究面向话题的事件关系抽取、网络构建和可信度计算方法,重点解决事件关系多样性和信息缺失问题。主要研究内容如下:⑴针对事件关系多样性问题,提出了面向话题的事件关系时空义三维表示体系,标注了一个包含1万多条事件的事件关系语料库;(2)在一致性理论的指导下,重点解决事件及其篇章级表示、关系交互性等问题,提出了一个模拟人类双向阅读和重复阅读过程的三层注意力网络模型,解决不同事件间的一致性问题;针对不同事件关系的内在联系,提出基于一致性的时序和因果关系联合识别模型。(3)在跨文档事件关系抽取中,事件同指消解是进行跨文档识别事件关系的核心。针对篇章知识的作用、事件稀疏和事件实例冗余信息过多等问题,提出了基于全局和局部信息的全局推理机制、基于强化学习的事件同指消解模型和基于事件句压缩机制的事件同指消解框架。(4)针对事件及其关系可信度计算问题,提出了一个二级框架的事件可信度计算方法,通过具有辅助分类的生成性对抗网络对事件真实性进行识别。针对事件表达形式多样化的问题,提出了一个增强型多粒度层次注意网络RMHAN,可从标记和句子中分层学习不同粒度的语义信息。本项目的研究对于推动信息抽取技术的发展和探索人类语言理解的认知机理,具有重要科学意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
城市轨道交通车站火灾情况下客流疏散能力评价
基于细粒度词表示的命名实体识别研究
基于FTA-BN模型的页岩气井口装置失效概率分析
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
面向社交网络的中文事件抽取与预测研究
面向开放网络数据的多元关系抽取、表示与推理研究
面向开放域知识网络的实体语义关系抽取方法研究
基于维语网络文本的事件抽取方法研究