Aiming at the novel research area, microblog user overlapping community detection, this project starts from graph aggregation, and analyzes microblog content, user tag correlation and user interactions to construct user interest model for effectively oganizing network information. The main content includes the follows. Firstly, a dynamic information extension model is proposed to improve the representation of microblog. To be specific, by combining text, hashtag and link of microblog, a novel representation model can be proposed. Secondly, a tag weighing strategy is developed by taking advantage of the co-occurrence of tags and tag correlation can be exploited, which investigates both inter and intra correlation of tags, and the tags for users can therefore be expanded. Thirdly, community cohesion, coupling degree and opinion leaders are considered to be the criteria for the community detection and new graph aggregation quality function is presented to show the explicit and implicit interest of users, together with the user's attention and practical application. New community detection method based on aggregation graph function is designed by finding core tags. The achievement of this project can provide new theories, methods and models for microblog user community detection. Therefore, it has very wide application prospect.
本项目瞄准微博用户重叠社区发现这一新兴课题,以图聚集技术为基础,分析微博内容、用户标签关系和用户交互关系的特点与表示方法,构建用户兴趣表示模型,最终实现对微博丰富网络信息的分析与有效整理。主要特点和创新点包括:研究微博内容的特征选择,以文本、标签和链接等多模态信息关联为基础,设计基于动态信息扩充技术的微博特征表示方法;研究用户标签的共现关系以及对标签进行加权策略,设计标签之间的内联及外联关系计算办法实现用户标签扩充;通过微博网络有向性建立关注关系,设计社区内聚度、耦合度及意见领袖等划分标准;以图聚集理论为基础,研究新的聚集图质量函数,全面刻画微博用户已声明的及隐含的兴趣、用户之间的关注规律和结果的实用性;以核心标签为出发点设计基于聚集图质量函数最优的社区发现方法。本项目的成果能够为微博用户社区发现提供新的理论、方法与模型,具有重要的理论意义和实用前景。
本项目瞄准微博用户重叠社区发现这一新兴课题,以图聚集技术为基础,分析微博内容、用户标签关系和用户交互关系的特点与表示方法,构建用户兴趣表示模型,最终实现对微博丰富网络信息的分析与有效整理。主要特点和创新点包括:研究微博内容的特征选择,以文本、标签和链接等多模态信息关联为基础,设计基于动态信息扩充技术的微博特征表示方法;研究用户标签的共现关系以及对标签进行加权策略,设计标签之间的内联及外联关系计算办法实现用户标签扩充;通过微博网络有向性建立关注关系,设计社区内聚度、耦合度及意见领袖等划分标准;以图聚集理论为基础,研究新的聚集图质量函数,全面刻画微博用户已声明的及隐含的兴趣、用户之间的关注规律和结果的实用性;以核心标签为出发点设计基于聚集图质量函数最优的社区发现方法。本项目的成果能够为微博用户社区发现提供新的理论、方法与模型,具有重要的理论意义和实用前景。.具体来说,一是研究了微博数据特征获取及其融合。通过对不同类别语义的特征获取更好的语义理解效果。研究多种微博语义特征的提取算法、融合模型和学习策略,提出多种新的特征学习、选择和表示的方法;.二是为微博信息建立表示模型从而获取语义表示。研究不同层次和类型信息的数据模型表示方式,基于语义和结构相互影响与同时变化的思路,构建多向量表示模型,描述不同数据类型之间的映射关系,提供通用数据模型;.三是探索用户标签加权策略与相似度计算方法。深入研究标签与标签之间客观存在的潜在共现关系。这种潜在的共现关系会使标签对用户显示出不同的重要性,因此需要设计合理的用户标签加权策略来彰显标签对用户兴趣表征的这种差异;.四是研究聚集图质量函数与微博可重叠社区发现算法。由于聚集图的质量评价算法在微博用户社区发现过程中起着至关重要的作用,因而研究设计有效的聚集图质量评价函数对社区发现结果进行更合理的修正。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
基于SSVEP 直接脑控机器人方向和速度研究
拥堵路网交通流均衡分配模型
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于主动异构监督的重叠社区发现及其模型选择方法研究
基于拓扑势场峰谷结构分析的重叠社区发现
层次粒化的不确定多态网络重叠社区发现方法研究
融合网络拓扑与结点、链接属性的重叠社区发现方法研究