基于数据重构的社会突发事件文摘研究

基本信息

批准号：61472277

项目类别：面上项目

资助金额：82.00

负责人：贺瑞芳

学科分类：

依托单位：天津大学

批准年份：2014

结题年份：2018

起止时间：2015-01-01 - 2018-12-31

项目状态：已结题

项目参与者：叶杰平,石红,汤继良,胡侠,高晖吉,孙宏,王绪霄,周玉灿,于谦

关键词：

社会媒体文本挖掘信息抽取微博文摘

结项摘要

High frequent crisis makes it urgent to study how to acquire useful information from social media efficiently, which is considered to be a dominant communication way. Under the background of crisis response and decision support, we choose crisis oriented topic-specific microblog collection from social media as the input, and explore how to acquire high important, credibile, less redundant and high coverage summarization for social crisis in a fast speed way. The new challenges in social media are grasped, including (1) short, informal and unstructured; (2) social and credible; (3) temporal redundant. We study automatic summarization from the perspective of compressive sensing and data reconstruction, and build the new challenges into the optimization model by using sparse learning and the harvest from sociology, since traditional methods could not handle those challenges. We mainly propose (1) wavelet analysis based important time point detection with the adaptive time window; (2) group sparse leaning based joint content selection; (3) strengthed content selection with the credibility modeling; and (4) temporal dynamics guided content selection based on sparse fused group lasso. Therefore, developing new machine learning methods about content selection for social crisis summarization has the significant research and application value.

社会媒体作为主导的通讯手段，非常规突发事件频发使得研究社会媒体下的高效信息获取刻不容缓。本课题正是以危机事件应急响应与应急决策为应用前景，以社会媒体产生的特定危机事件话题相关的微博集作为研究对象。探索基于数据重构的社会突发事件文摘加速算法新思路，以满足文摘内容选择的重要性、可信度、新颖性以及覆盖性。抓住社会媒体的新挑战：1.简短、口语化、无结构性；2.社交、信任性；3.时序冗余性。由于传统文摘方法无法适应这些新挑战，为此探索从压缩感知、数据重构角度，借助稀疏学习及社会学相关研究成果，将新挑战建模到稀疏优化模型中，提出：1.基于小波分析时间窗自适应的重要时间点选择；2.基于组结构化稀疏学习联合的内容选择；3.融合可信度建模的优化内容选择；4.时序演化性导向的Sparse Fused Group Lasso内容选择。由此发展社会突发事件文摘内容选择的加速机器学习框架，有着重要的研究和应用价值。

项目摘要

社会突发事件文摘研究面向特定话题相关的微博集进行自动摘要。抓住社会媒体的新挑战：1.简短、口语化、无结构性；2.社交、信任性；3.时序冗余性。由于传统文摘方法无法适应这些新挑战，为此探索从压缩感知、数据重构角度，借助稀疏学习及社会学相关研究成果，经过四年的探索，本课题围绕如何将新挑战建模到稀疏优化摘要模型中,以满足文摘内容选择的重要性、可信度、新颖性以及覆盖性，主要进展包括：1.建设了一定规模的社会媒体摘要评测语料；2.提出融合时序社交语境分析的时序推特摘要方法；3.基于组结构化稀疏学习联合的内容选择；4.融合可信度建模的优化内容选择；5.融合社会媒体用户动态行为的短文本话题检测方法。本项目通过对社会媒体静、动态特性的挖掘和建模分析，探索内容和社会网络结构的结合是否对社会媒体摘要有正向的影响以及社会学理论如何影响摘要模型的建立。本研究在舆情监控与信息安全，金融、军事情报分析及应急响应与决策支持等方面有着潜在的应用前景，为此发展社会突发事件文摘内容选择的加速机器学习框架，有着重要的学术和应用价值。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

DOI：10.7498/aps.68.20181682

发表时间：2019

DOI：10.11936/bjutxb2021010011

发表时间：2021

贺瑞芳的其他基金

批准号：61100123

批准年份：2011

资助金额：23.00

项目类别：青年科学基金项目

相似国自然基金

基于移动通信与在线社会媒体数据的大规模突发事件下人类行为动力学研究

批准号：71301165

批准年份：2013

负责人：吕欣

学科分类：G0107

资助金额：23.00

项目类别：青年科学基金项目

基于Agent的突发事件跨媒体数据挖掘研究

批准号：91024001

批准年份：2010

负责人：杜军平

学科分类：F06

资助金额：35.00

项目类别：重大研究计划

基于社会化媒体的突发事件应急管理众包模式研究

批准号：71403134

批准年份：2014

负责人：沈洪洲

学科分类：G0409

资助金额：20.00

项目类别：青年科学基金项目

基于大数据的群体性突发事件预测研究

批准号：71673159

批准年份：2016

负责人：吕鹏

学科分类：G0409

资助金额：48.00

项目类别：面上项目

基于数据重构的社会突发事件文摘研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

信息熵-保真度联合度量函数的单幅图像去雾方法

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

城市生活垃圾热值的特征变量选择方法及预测建模

贺瑞芳的其他基金

面向话题演化的时序多文档文摘内容选择技术研究

相似国自然基金