Social networks have become widespread and sensitive crowd-sourcing sensor networks, which accumulate plentiful text with rich semantics. Event detection and analysis from such text has become an important channel for tracking in real time the dynamic status of social development and making correspondingly appropriate decisions. However, most text in social network is short text, hence causes low accuracy of event detection and analysis. In this project, the main objectives and tasks are to: 1) improve the accuracy of event detection by proposing a new term-weighting method for short text, and exploiting the users' relationships in social network; 2) mine the semantics of the events' content comprehensively and accurately by jointly modeling the users, text and labels in the latent topic model; 3) analyze an event's evolution trend by constructing the life cycle model of event based on time and social sentiments; 4) validate the effectiveness of the proposed theories and techniques using the real social network data by developing an experimental prototype system. The research in this project is the first attempt of mining the semantics of event content from short text, in addition to constructing event life cycle model from both the temporal aspect and social sentiments, and will shed a light on new research directions of information diffusion model, event retrieval, etc.
社交网络已成为应用普及反应迅速的"群智传感网"。其中的文本数据来源广、生成快,在短时间内快速地聚集大量语义丰富的信息,从中检测及分析事件将成为实时了解社会发展动态,进而及时形成适当决策的重要渠道之一。但其中大多属于短文本,包含的特征词少、语境信息不全,因此给精准地检测及分析事件带来了极大的挑战。本项目的主要任务及目标包括:1)研究短文本的特征词选择及赋权方法,并利用社交网络用户之间的关系来提高事件检测的精准度;2)基于用户、文本及标签等维度联合构建潜在语义主题模型,全面精准地挖掘事件内容的语义;3)结合时间信息与公众情感构建事件的生命周期模型,以辅助分析事件演化及发生的原因;4)开发一个实验原型系统,利用真实社交网络数据验证本项目提出的理论及技术的有效性。研究成果将填补从短文本中挖掘事件内容语义及分析事件生命周期的空白,并为信息扩散模型的构建、事件检索等相关研究提供新的思路。
随着互联网时代的到来和社交网络的流行,随之产生了海量的公共数据,其中蕴含了大量的与人们生产生活息息相关的信息,从互联网数据及社交媒体数据中检测社会事件成为了解社会动态,进而形成适当政策决策的重要渠道。互联网平台汇集了多种类型的数据,包括社交媒体短文本数据、社交媒体图片数据、网络媒体新闻数据等。.丰富类型的数据提供为事件的描述多角度和多观点的描述,同时为事件检测的任务带来了挑战。一方面,数据的收集涉及隐私保护的问题。另一方面,互联网的数据来自用户分享,数据本身具有多样性,给数据的情感自动标注带来的困难和挑战。.针对上述研究问题,本项目以社交网络数据为主要出发点,综合利用社交网络中的短文本、图片数据以及新闻媒体数据,以发现其中的事件并挖掘事件的语义,包括When,Where, Who, What等多个事件元素上的分析。对于数据收集过程中的隐私保护问题,本项目利用结合帕耶公钥加密体制和加密布尔电路来构建数据交换协议并结合众包机制。对于数据情感分类问题,本项目利用迁移学习模型对数据进行自动的情感标签标注。.通过本项目的研究,我们提出了社交网络数据中的事件检测模型、多源多模态社交网络数据和新闻媒体数据中的事件检测模型、互联网数据的情感标注模型、数据收集中的隐私保护机制等方法。通过本项目的研究发表高质量 7篇,其中SCI检索期刊5篇,CCF推荐EI检索会议2篇,包括CCF A类会议INFOCOM和CCF B类ACM Transaction系列等高水平会议和期刊。通过本项目的研究,培养博士4名。项目参与者组织国际会议1次,参加学术交流活动9次。本项目的研究成果和研究相关活动一定程度上推动了社交媒体中事件检测的相关研究,引起了学术界和业界的关注,为促进和进一步探索相关研究奠定了基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
社交网络中基于图挖掘的用户行为分析与异常检测技术研究
基于多语言微博文本的新疆热点事件检测关键技术研究
基于社交网络文本交互内容的信息传播建模及网络关键结构发现
动态社交网络中群体情感演化计算与分析关键技术研究