As one of the fundamental problems, the diffusion and evolution of topics plays an important role in the analysis of public opinions in online social networks. Topics are spreading among user-generated documents through online social networks, together with the content evolution by introducing novel contents into documents. Both the diffusion paths and the evolutionary process of a topic are implicit with ambiguousness and uncertainty, making them much challenging to be discovered. Since the diffusion and evolution of topics are tightly interweaved, this project aims to simultaneously track the evolution of any arbitrary topic and reveal the latent diffusion paths of that topic in online social networks based on probabilistic graphical models (PGM). To this end, we intend to conduct research in the following subjects: (1) In the research of topic evolution, inspired by probabilistic generative model due to the ambiguousness and uncertainty of topics, we propose a topic evolution model, consisting of incremental sub-topic detection and correlation analysis; (2) In the research of topic diffusion, we propose methods based on Bayesian networks for revealing the latent diffusion paths of topics, and then model prior knowledge of topic diffusion through network projection taking into consideration of social influences of authors in online social networks; (3) In the research of application, this work verifies the effects of our methods in comparison with cases in real world using large-volume textual documents and real online social networks from the Web.
在网络舆论分析中,追踪话题的动态演化和传播过程具有重要的理论意义和应用价值。由于话题具有隐含性、语义模糊性和不确定性,且舆情信息规模巨大、网络成员间的社会影响复杂多变,如何分析话题传播和演化一直是网络舆论演化分析面临的主要挑战之一。本课题研究基于概率图的话题传播和演化分析方法,旨在建立话题传播和演化分析的统一框架,获取准确、有效的话题演化关系和传播路径。拟开展以下研究:(1)在话题演化方面,针对话题的语义模糊性和不确定性,采用概率生成模型提出在线子话题发现和关联分析方法;(2)在话题演化分析基础上,提出基于贝叶斯网络的话题传播分析方法;因为先验知识对模型求解的准确性具有重要影响,进而提出基于社会网络分析的话题传播先验知识建模方法;(3)在应用方面,针对理论验证困难和实证研究匮乏问题,实时有效采集大规模舆情信息和在线社会网络数据,采用真实的话题传播和演化实例验证上述理论方法的准确性与实用性。
在网络舆论分析中,追踪话题的动态演化和传播过程具有重要的理论意义和应用价值。针对网络舆情信息的海量实时特点和网络舆论处置的应急响应需求,本项目重点开展在线社会网络中话题传播与演化分析模型与方法,以及基于话题的用户影响力评估、信息扩散能力预测分析和观点演化等方面的应用研究。.提出了基于概率生成模型的在线话题传播与演化分析方法,开展子话题发现和关联分析研究:提出了基于LDA模型的子话题发现方法,在线抽取网络信息中隐含的话题片断,定义了子话题产生、消亡、继承、分裂和合并五种演化类型,提出了基于相对熵的子话题时序-内容二维关联分析方法,根据子话题语义相似度和时序关系建立子话题间的关联,通过子话题内容和强度的变化描述话题演化。.提出了基于贝叶斯网络的话题传播分析方法,分析了网络新闻传播过程,采用贝叶斯网络结构学习算法进行话题传播路径分析,并与新闻传播学界的研究结果与互联网新闻媒体网络排名进行对比,验证了话题传播分析方法的有效性。.开展了在线社会网络结构和演化分析实证研究,针对在线论坛网络及微博网络采集并构建真实的在线社会网络,分析了在线社会网络的拓扑结构、社会结构及其动态演化特性,以及网络成员行为的统计特性,分析用户间的社会联系和影响力,为在线社会网络中的信息传播提供实证依据。.在此基础上,开展话题传播与演化分析方法的应用研究。提出了基于用户属性与多关系网络的用户影响力分析模型,开展基于话题的用户影响力分析,考虑用户相关属性以及用户之间的关注、转发、回复关系,以及发布博文内容相似度和时间相似度关系进行建模,计算用户之间的影响力。.提出了基于数据挖掘的信息扩散能力预测分析方法,定义了信息扩散能力,采用数据挖掘的方法,采集Twitter数据集,进行数据预处理、特征提取,从用户和博文这两个方面提取出反映用户信息扩散能力的相关特征,以xgboost算法作为基础模型,应用于多个特征群、多组参数、数据集分时条件下,借鉴Stacking的思想,提出多视角多参分时堆融合算法,以融合后的模型综合预测用户的信息扩散能力。.提出了基于社会影响的观点演化模型,借鉴统计物理学中的粒子交互作用描述舆论演化过程中网络成员间的相互作用,采用平均场理论进行解析,分析网络成员坚持度以及社会影响对观点演化的影响,分析了网络舆论演化的临界点和涌现机制,揭示舆论演化的内在规律。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
黄河流域水资源利用时空演变特征及驱动要素
微博炒作话题识别与传播人群分析
社交网络中热点话题检测与传播分析研究
社交网络用户行为分析及话题演化趋势预测方法研究
基于概率语义分析的多关系图多类标分类方法研究