High frequent crisis makes it urgent to study how to acquire useful information from social media efficiently, which is considered to be a dominant communication way. Under the background of crisis response and decision support, we choose crisis oriented topic-specific microblog collection from social media as the input, and explore how to acquire high important, credibile, less redundant and high coverage summarization for social crisis in a fast speed way. The new challenges in social media are grasped, including (1) short, informal and unstructured; (2) social and credible; (3) temporal redundant. We study automatic summarization from the perspective of compressive sensing and data reconstruction, and build the new challenges into the optimization model by using sparse learning and the harvest from sociology, since traditional methods could not handle those challenges. We mainly propose (1) wavelet analysis based important time point detection with the adaptive time window; (2) group sparse leaning based joint content selection; (3) strengthed content selection with the credibility modeling; and (4) temporal dynamics guided content selection based on sparse fused group lasso. Therefore, developing new machine learning methods about content selection for social crisis summarization has the significant research and application value.
社会媒体作为主导的通讯手段,非常规突发事件频发使得研究社会媒体下的高效信息获取刻不容缓。本课题正是以危机事件应急响应与应急决策为应用前景,以社会媒体产生的特定危机事件话题相关的微博集作为研究对象。探索基于数据重构的社会突发事件文摘加速算法新思路,以满足文摘内容选择的重要性、可信度、新颖性以及覆盖性。抓住社会媒体的新挑战:1.简短、口语化、无结构性;2.社交、信任性;3.时序冗余性。由于传统文摘方法无法适应这些新挑战,为此探索从压缩感知、数据重构角度,借助稀疏学习及社会学相关研究成果,将新挑战建模到稀疏优化模型中,提出:1.基于小波分析时间窗自适应的重要时间点选择;2.基于组结构化稀疏学习联合的内容选择;3.融合可信度建模的优化内容选择;4.时序演化性导向的Sparse Fused Group Lasso内容选择。由此发展社会突发事件文摘内容选择的加速机器学习框架,有着重要的研究和应用价值。
社会突发事件文摘研究面向特定话题相关的微博集进行自动摘要。抓住社会媒体的新挑战:1.简短、口语化、无结构性;2.社交、信任性;3.时序冗余性。由于传统文摘方法无法适应这些新挑战,为此探索从压缩感知、数据重构角度,借助稀疏学习及社会学相关研究成果,经过四年的探索,本课题围绕如何将新挑战建模到稀疏优化摘要模型中,以满足文摘内容选择的重要性、可信度、新颖性以及覆盖性,主要进展包括:1.建设了一定规模的社会媒体摘要评测语料;2.提出融合时序社交语境分析的时序推特摘要方法;3.基于组结构化稀疏学习联合的内容选择;4.融合可信度建模的优化内容选择;5.融合社会媒体用户动态行为的短文本话题检测方法。本项目通过对社会媒体静、动态特性的挖掘和建模分析,探索内容和社会网络结构的结合是否对社会媒体摘要有正向的影响以及社会学理论如何影响摘要模型的建立。本研究在舆情监控与信息安全,金融、军事情报分析及应急响应与决策支持等方面有着潜在的应用前景,为此发展社会突发事件文摘内容选择的加速机器学习框架,有着重要的学术和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
黄河流域水资源利用时空演变特征及驱动要素
敏感性水利工程社会稳定风险演化SD模型
基于图卷积网络的归纳式微博谣言检测新方法
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
极地微藻对极端环境的适应机制研究进展
基于移动通信与在线社会媒体数据的大规模突发事件下人类行为动力学研究
基于Agent的突发事件跨媒体数据挖掘研究
基于社会化媒体的突发事件应急管理众包模式研究
基于大数据的群体性突发事件预测研究