面向社会舆情的中文事件抽取及其可信度计算的研究

基本信息
批准号:61472265
项目类别:面上项目
资助金额:82.00
负责人:李培峰
学科分类:
依托单位:苏州大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:朱巧明,刁红军,邹博伟,郑新,朱少华,滕佳月,包艳
关键词:
社会舆情中文事件抽取联合模型事件推理可信度计算
结项摘要

Currently, the Web provides an unprecedented way to express social opinions and how to extract valuable contents from such mass information about the social opinions remains a challenge. As event is the basic semantic element of the social opinion, extracting events from large scale texts and then computing their confidences is found mental to analyze the social opinion timely and effectively. Following the topic structure theory, the semantic consistency theory and the nature of Chinese language, this project will focus on Chinese event extraction and its confidence computing for social opinion analysis to solve three problems: ellipsis, global optimization and confidence computing. The contributions of this project are as follows: 1) based on the topic structure theory, it proposes a novel cross-event, cross-entity and cross-role event inference mechanism to solve the ellipsis problem; 2) based on the semantic consistency theory,it provide a joint learning model, employing the intrinic relationship among events in a topic, to slove the global optimization problem; 3) based on the discourse structure theory and the event relevance, it puts forward an Bayesian Network-based event confidence computing model. The project is helpful and meaningful to explore the cognitive mechanism of human language understanding and to promote development of the semantic knowledge acquisition for the social opinion analysis.

互联网为社会公众提供了前所未有的舆情表达新手段,如何从海量舆情信息中获取有价值内容成为目前急待解决的一大挑战。事件作为表述社会舆情语义的基本要素,从海量文本中抽取事件并计算其可信度是快速、及时、高效地分析社会舆情的基础。本项目将在话题结构理论和语义一致性理论的指导下,根据中文所特有的语言特点,研究面向社会舆情的中文事件抽取及其可信度计算方法,重点解决其信息缺失问题、全局优化问题和可信度计算问题。主要特色如下:1)基于话题结构理论,提出了新颖的跨事件、跨实体和跨角色的事件推理方法,解决中文事件缺省问题;2)基于语义一致性理论,提出了根据事件间内在关系进行事件抽取的联合学习模型,解决全局优化问题;3)基于篇章结构理论和事件间的关联性,提出了一个利用贝叶斯网络进行推理的事件可信度计算模型。本项目对于探索人类语言理解的认知机理,推动面向社会舆情分析的语义知识获取方法的发展,具有重要的科学意义。

项目摘要

互联网为社会公众提供了前所未有的舆情表达新手段,如何从海量舆情信息中获取有价值内容成为目前急待解决的一大挑战。事件作为表述社会舆情语义的基本要素,从海量文本中抽取事件并计算其可信度是快速、及时、高效地分析社会舆情的基础。本项目将在话题结构理论和语义一致性理论的指导下,根据中文所特有的语言特点,研究面向社会舆情的中文事件抽取及其可信度计算方法,重点解决其信息缺失问题、全局优化问题和可信度计算问题。具体研究内容和解决问题如下:1)针对语言表述的多样性和信息缺失问题,本项目提出了一种基于论元一致性和事件相关性的联合论元推理模型,利用各种基于论元一致性的方法来揭示多维度的事件论元语义,从而抽取信息缺失的事件论元;2)针对部分贫信息事件实例难以抽取的问题,项目组提出了基于语义的中文事件触发词抽取联合学习模型,解决了事件抽取的全局优化问题。首先,根据中文句子结构灵活和句法成分多省略的特点,提出了基于模式匹配的核心论元和辅助论元抽取方法;其次,根据同一文档中关联事件实例间存在的高度一致性,构造了一个关联事件语义驱动的中文事件触发词识别和类型分配二维联合模型,用于抽取贫信息事件实例;3)针对事件可信度计算问题,项目组提出了一个二级框架的事件可信度计算方法。先从原始文本中提取与事件真实性有关的要素作为输入,然后通过具有辅助分类的生成性对抗网络(AC-GAN)对事件真实性进行识别。AC-GAN允许模型学习更多的句法信息,能解决事实值之间的不平衡。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

李培峰的其他基金

批准号:61070123
批准年份:2010
资助金额:33.00
项目类别:面上项目
批准号:30730045
批准年份:2007
资助金额:150.00
项目类别:重点项目
批准号:61772354
批准年份:2017
资助金额:62.00
项目类别:面上项目
批准号:91849209
批准年份:2018
资助金额:200.00
项目类别:重大研究计划
批准号:30871243
批准年份:2008
资助金额:40.00
项目类别:面上项目
批准号:39770007
批准年份:1997
资助金额:11.00
项目类别:面上项目
批准号:81230005
批准年份:2012
资助金额:280.00
项目类别:重点项目
批准号:30260084
批准年份:2002
资助金额:19.00
项目类别:地区科学基金项目
批准号:31430041
批准年份:2014
资助金额:328.00
项目类别:重点项目
批准号:51902207
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:30671058
批准年份:2006
资助金额:32.00
项目类别:面上项目
批准号:39300031
批准年份:1993
资助金额:7.50
项目类别:青年科学基金项目

相似国自然基金

1

因特网中文金融新闻中抽取事件及其相关时间信息的研究

批准号:69975008
批准年份:1999
负责人:苑春法
学科分类:F03
资助金额:12.00
项目类别:面上项目
2

面向社交网络的中文事件抽取与预测研究

批准号:61806137
批准年份:2018
负责人:王中卿
学科分类:F0606
资助金额:26.00
项目类别:青年科学基金项目
3

面向图文混合的网络舆情新事件发现及其关联挖掘

批准号:61572399
批准年份:2015
负责人:邓万宇
学科分类:F0607
资助金额:64.00
项目类别:面上项目
4

面向社会媒体的公共事件建模和预测

批准号:71702181
批准年份:2017
负责人:孔庆超
学科分类:G0209
资助金额:18.00
项目类别:青年科学基金项目