微博热点话题传播模型与可视化研究

基本信息
批准号:61272367
项目类别:面上项目
资助金额:80.00
负责人:叶施仁
学科分类:
依托单位:常州大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:侯振杰,杨长春,薛磊,方骥,朱家群,俞克非,严水哥,刘平
关键词:
社会媒体情感分析社会网络复杂网络分析微博
结项摘要

Microblogs have been leading a publishing revolution as novel instant messaging and information-sharing services. Nowadays there are over 300 millions microblog users in China. If we can detect and retrieve the relevant blogs that tend to propagate heavily soon, we will understand the whole hot topic as early as possible. The predictable search results will be beneficial to industrial applications and social researches. The project will explore the fundamental characteristics, investigate propagation mechanism and microblog-customised retrieval model of Chinese microblogs. We use Sina Weibo, a typical and popular Chinese microblog site, to reveal the network structure features of Chinese microblog, and provide test corpora, processing tools and baselines for research and industry community. We build propagation model based on sentiment analysis to evaluate the topicality, as well as propagation speed and scope. The propagation model considers bloggers with various granularity in order to handle huge bloggers existing in Sina Weibo. We also develop the microblog search model indicating propagation tendency, where the search ranking is learned from the features tied to authors and their blogs, as well as interactions between authors. The returned blogs will be ranked according to their topicality, authority and novelty. Finally, we establish visualization model to track the shift procedure of relevant topics and render the search results, which is helpful for users to rapidly grasp the salient contents.

微博作为一种新型的即时通信与信息共享服务,造成的"发布革命"让中文微博用户数已经达超过3亿。怎样预见性地发现和检索那些具有广泛传播能力的热点话题,以便尽可能早地掌握情况,具有重大的社会意义和经济效益。本项目旨在全面探索中文微博的基本特征的基础上,研究微博信息快速传播的机制和适合微博特征搜索模型。我们对新浪微博为代表的中文微博的网络结构进行全面分析,为学术界和产业界提供微博数据、微博处理工具和基本结论等系列资源。我们通过情感分析研究微博中的话题性,探索主题传播速度和传播范围的机制并建立能处理海量数据的变粒度传播模型。我们研究反映传播趋势的微博搜索模型,搜索的排名通过机器学习的方法确定确定博主、内容和博主之间交互的不同贡献。搜索返回的相关发帖列表综合考虑了它们的话题性、权威性与新颖性。我们研究可视化的模型来跟踪相关话题的发展过程和搜索的结果,为用户提供快速理解微博数据传播的途径。

项目摘要

本课题围绕微博传播模型中一些基本问题进行研究。主要工作包括:①微博水军集团发现方法:我们的方法以一个或几个典型的水军账号作为种子,采用水军账号优先搜索的方法对该账号的粉丝列表进行逐层扩展。由于水军用户和正常用户一样,在他们所属的圈子中都会形成属于他们的网络关系。按照水军用户之间关系的高度聚集性以及水军用户与真实用户之间关系稀疏性的特点,我们的方法采用Fast Unfolding算法对所获得的水军账号集合进行社区发现,并对所划分的社区进行随机抽样检测。;②微博社区发现R-C模型:分析参数加权约简曲线性质,借鉴凸优化问题解决方案,提出一种适用于多数参数值的最优分区求解算法。通过分区断点顺序搜索将参数范围限定在一组有限区间内,其中每个参数对应唯一的最优加权约简值,并且实现分区参数的同步优化,从而解决单一分区不利于更多信息均衡的问题。;③基于卷积神经网络的网络短文情感多分类标注。社会媒体情感分析。.其中①微博水军集团发现算法:比现有的单个水军判别方法具有更高的效率和应用价值,能够有效地发现水军集团制造舆情和影响舆情的行为模式和规律,并且已经应用到工业界。②R-C模型:与基于主题与链接关系或基于标签传播的微博社区检测算法相比,该算法可更准确地检测用户微博社区。③基于卷积神经网络的网络短文情感多分类标注:模型在训练集包含短语和未包含短语的两种设定条件下,分别达到了54.6%和48.3%的准确率,这以结果显著高于Stanford报告的结果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

叶施仁的其他基金

相似国自然基金

1

微博信息可信度影响因素、网络传播与可视化支持

批准号:71401087
批准年份:2014
负责人:皋琴
学科分类:G0108
资助金额:23.00
项目类别:青年科学基金项目
2

基于主题建模的微博语义理解与热点话题识别研究

批准号:61363058
批准年份:2013
负责人:马慧芳
学科分类:F0607
资助金额:45.00
项目类别:地区科学基金项目
3

微博炒作话题识别与传播人群分析

批准号:61309007
批准年份:2013
负责人:刘琰
学科分类:F0214
资助金额:23.00
项目类别:青年科学基金项目
4

微博舆情安全评估与传播控制关键技术研究

批准号:61672180
批准年份:2016
负责人:王巍
学科分类:F0607
资助金额:59.00
项目类别:面上项目