网络舆情信息中事件篇章关系检测方法的研究

基本信息
批准号:61272259
项目类别:面上项目
资助金额:80.00
负责人:姚建民
学科分类:
依托单位:苏州大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:刘岚,葛川,张剑峰,周小佩,马彬,王星,唐伟,车婷婷,杨雪蓉
关键词:
事件关系篇章关系关系检测
结项摘要

As an important research task in the cross-field of information extraction and public opinion analysis, Event Discourse Relation Detection (abbr., EDRD) has high practical value in extracting logical relations for nature languages that specially represent events, and mining occurrence cues and development veins of public opinions by using relevant events. However, there are still few researches focusing on the event relation detection, and especially it is still a blank field to use discourse analysis to thoroughly explain and describe the event relation at the semantic level. For this, the project focuses on researching the linguistic regularities of event relation, and based on the discourse analysis, exploring the methods of machine learning and automatically detecting event discourse relation. The research content can be divided into the following four parts: the first is cross-entity inference based event extraction, the second is dynamic topic modeling for cross-discourse relevant event identification, the third is parallel theory based event discourse relation detection, and the last is hierarchical scope establishing for event discourse relation. Especially the project will research the method of identifying shallow event relation under the restriction of global topics, and the mathematical modeling method of detecting event logistical relation based on parallelization identification of event semantics, when given the general characteristics of languages in the process of parallel events forming discourse relations. On the basis, the project finally aims to automatically identify and detect kinds of event logical relations in public opinions, by which to support the prediction of event occurrence and evolution.

事件篇章关系检测是信息抽取和舆情分析交叉领域的重要研究课题,对于以事件为主体元素的自然语言逻辑关系抽取,以及借助关联事件挖掘舆情信息的衍生线索和发展脉络,都具有很高的实用价值。目前,事件关系检测的相关研究较少,尤其借助篇章分析从语义层面深入解释和描述事件关系的研究尚属空白。本课题将重点研究刻画事件关系的语言学规律,并基于篇章分析,探索事件语义关系的机器学习和自动检测方法。主要研究内容包含如下四个方面:基于跨实体推理的事件抽取、基于动态话题模型的跨篇章关联事件识别、基于平行理论的事件篇章关系检测、事件关系层次作用域的自动构建。特别是研究借助宏观话题对事件关系的约束,识别浅层事件关系的方法;以及借助事件语义平行性识别,利用平行事件参与篇章关系形成过程的语言学共性,检测事件逻辑关系的数学建模方法。目标是实现针对舆情信息中各类事件逻辑关系的自动识别与检测,借以辅助事件衍生与发展的预测与预报。

项目摘要

本课题旨在实现一种面向网络舆情信息的事件篇章关系检测方法。针对这一目标,计划研究任务包括:基于跨实体推理的事件抽取方法,基于推理线索的跨篇章关联事件识别,基于平行理论的事件篇章关系检测方法,以及事件关系层次作用域构建。根据研究计划,课题组在为期四年的研究周期中,提出并评测多种研究方法,学术成果得到国际顶级学术会议的认可,构建一套双语数据集和原型系统多套,基本实现了预期研究目标,总体进展顺利。下面对本课题取得的研究成果进行概述。.一)建立了以分类技术为基础的自由文本事件抽取方法,形成了一种跨实体推理的事件分类抽取方法,性能优于国际同期相关技术8.6个百分点。此外,课题组基于主题相似度的事件标签传播算法实现的事件抽取系统在2015年Event Nugget国际评测中获得第一的性能。同时,课题组开展了基于深度学习和主动学习的联合事件抽取方法研究,对事件块Nugget检测研究提供了新的思路。目前,课题组着力提升基于重述识别的事件抽取与传播算法;.二)提出基于推理线索的事件关系识别方法,验证了事件核心词,实体以及事件依存线索对事件关系识别的作用。利用篇章结构关系进行事件关系理解,以及利用新型堆学习方法实现关系判定的verification,都是这一工作的亮点。基于ACE语料库标记事件关系,形成关系书库一套;.三)开发了双语平行网页识别系统,借助该系统,本课题从Web资源挖掘了3千万中英双语平行句对,为多语言事件关系检测提供大规模的外部资源;.四)建立了以显式关系推理隐式关系的平行推理技术为基础的事件篇章关系检测方法,在此基础上,针对论元关系的歧义性问题,提出基于焦点识别的歧义关系检测方法。由此形成的平行推理方法在国际权威数据PDTB上的隐式篇章关系分类任务上,获得14%的性能提升;.五)构建了一套基于训练数据扩展的事件篇章关系分类体系,验证了框架语义知识、语义向量在平行论元对挖掘上的作用,扩充了事件篇章关系分类样本集;.六)形成一套面向新闻事件的事件专题跟踪与关联分析系统,目前已达到初级应用水平。四年来,共计发表文章50余篇,其中核心和EI论文近40篇;国际顶级会议ACL/EMNLP/COLING等论文5篇;国内一级学报“计算机学报”、“软件学报”等3篇;受理专利6件,已授权1件,近期投出专利2件。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021
2

基于图卷积网络的归纳式微博谣言检测新方法

基于图卷积网络的归纳式微博谣言检测新方法

DOI:10.3785/j.issn.1008-973x.2022.05.013
发表时间:2022
3

人工智能技术在矿工不安全行为识别中的融合应用

人工智能技术在矿工不安全行为识别中的融合应用

DOI:10.16265/j.cnki.issn1003-3033.2019.01.002
发表时间:2019
4

面向工件表面缺陷的无监督域适应方法

面向工件表面缺陷的无监督域适应方法

DOI:
发表时间:2021
5

基于关系对齐的汉语虚词抽象语义表示与分析

基于关系对齐的汉语虚词抽象语义表示与分析

DOI:
发表时间:2020

姚建民的其他基金

相似国自然基金

1

突发事件网络信息传播规律及舆情分析方法研究

批准号:71171067
批准年份:2011
负责人:闫相斌
学科分类:G0112
资助金额:42.00
项目类别:面上项目
2

舆情事件信息链接共享因果路径及其非对称关系研究

批准号:71904106
批准年份:2019
负责人:盛东方
学科分类:G0414
资助金额:19.50
项目类别:青年科学基金项目
3

社交网络中敏感舆情事件演化趋势的引导与成效评估方法研究

批准号:61772411
批准年份:2017
负责人:秦涛
学科分类:F0205
资助金额:63.00
项目类别:面上项目
4

基于信息集成技术的网络舆情预警方法研究

批准号:61702543
批准年份:2017
负责人:王磊
学科分类:F0607
资助金额:27.00
项目类别:青年科学基金项目