基于数据重构的社会突发事件文摘研究

基本信息
批准号:61472277
项目类别:面上项目
资助金额:82.00
负责人:贺瑞芳
学科分类:
依托单位:天津大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:叶杰平,石红,汤继良,胡侠,高晖吉,孙宏,王绪霄,周玉灿,于谦
关键词:
社会媒体文本挖掘信息抽取微博文摘
结项摘要

High frequent crisis makes it urgent to study how to acquire useful information from social media efficiently, which is considered to be a dominant communication way. Under the background of crisis response and decision support, we choose crisis oriented topic-specific microblog collection from social media as the input, and explore how to acquire high important, credibile, less redundant and high coverage summarization for social crisis in a fast speed way. The new challenges in social media are grasped, including (1) short, informal and unstructured; (2) social and credible; (3) temporal redundant. We study automatic summarization from the perspective of compressive sensing and data reconstruction, and build the new challenges into the optimization model by using sparse learning and the harvest from sociology, since traditional methods could not handle those challenges. We mainly propose (1) wavelet analysis based important time point detection with the adaptive time window; (2) group sparse leaning based joint content selection; (3) strengthed content selection with the credibility modeling; and (4) temporal dynamics guided content selection based on sparse fused group lasso. Therefore, developing new machine learning methods about content selection for social crisis summarization has the significant research and application value.

社会媒体作为主导的通讯手段,非常规突发事件频发使得研究社会媒体下的高效信息获取刻不容缓。本课题正是以危机事件应急响应与应急决策为应用前景,以社会媒体产生的特定危机事件话题相关的微博集作为研究对象。探索基于数据重构的社会突发事件文摘加速算法新思路,以满足文摘内容选择的重要性、可信度、新颖性以及覆盖性。抓住社会媒体的新挑战:1.简短、口语化、无结构性;2.社交、信任性;3.时序冗余性。由于传统文摘方法无法适应这些新挑战,为此探索从压缩感知、数据重构角度,借助稀疏学习及社会学相关研究成果,将新挑战建模到稀疏优化模型中,提出:1.基于小波分析时间窗自适应的重要时间点选择;2.基于组结构化稀疏学习联合的内容选择;3.融合可信度建模的优化内容选择;4.时序演化性导向的Sparse Fused Group Lasso内容选择。由此发展社会突发事件文摘内容选择的加速机器学习框架,有着重要的研究和应用价值。

项目摘要

社会突发事件文摘研究面向特定话题相关的微博集进行自动摘要。抓住社会媒体的新挑战:1.简短、口语化、无结构性;2.社交、信任性;3.时序冗余性。由于传统文摘方法无法适应这些新挑战,为此探索从压缩感知、数据重构角度,借助稀疏学习及社会学相关研究成果,经过四年的探索,本课题围绕如何将新挑战建模到稀疏优化摘要模型中,以满足文摘内容选择的重要性、可信度、新颖性以及覆盖性,主要进展包括:1.建设了一定规模的社会媒体摘要评测语料;2.提出融合时序社交语境分析的时序推特摘要方法;3.基于组结构化稀疏学习联合的内容选择;4.融合可信度建模的优化内容选择;5.融合社会媒体用户动态行为的短文本话题检测方法。本项目通过对社会媒体静、动态特性的挖掘和建模分析,探索内容和社会网络结构的结合是否对社会媒体摘要有正向的影响以及社会学理论如何影响摘要模型的建立。本研究在舆情监控与信息安全,金融、军事情报分析及应急响应与决策支持等方面有着潜在的应用前景,为此发展社会突发事件文摘内容选择的加速机器学习框架,有着重要的学术和应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
2

敏感性水利工程社会稳定风险演化SD模型

敏感性水利工程社会稳定风险演化SD模型

DOI:10.16265/j.cnki.issn1003-3033.2021.04.003
发表时间:2021
3

基于图卷积网络的归纳式微博谣言检测新方法

基于图卷积网络的归纳式微博谣言检测新方法

DOI:10.3785/j.issn.1008-973x.2022.05.013
发表时间:2022
4

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

DOI:10.13249/j.cnki.sgs.2020.08.003
发表时间:2020
5

极地微藻对极端环境的适应机制研究进展

极地微藻对极端环境的适应机制研究进展

DOI:10.7685/jnau.201807013
发表时间:2019

贺瑞芳的其他基金

批准号:61100123
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

基于移动通信与在线社会媒体数据的大规模突发事件下人类行为动力学研究

批准号:71301165
批准年份:2013
负责人:吕欣
学科分类:G0107
资助金额:23.00
项目类别:青年科学基金项目
2

基于Agent的突发事件跨媒体数据挖掘研究

批准号:91024001
批准年份:2010
负责人:杜军平
学科分类:F06
资助金额:35.00
项目类别:重大研究计划
3

基于社会化媒体的突发事件应急管理众包模式研究

批准号:71403134
批准年份:2014
负责人:沈洪洲
学科分类:G0409
资助金额:20.00
项目类别:青年科学基金项目
4

基于大数据的群体性突发事件预测研究

批准号:71673159
批准年份:2016
负责人:吕鹏
学科分类:G0409
资助金额:48.00
项目类别:面上项目