The quick development of online applications bring the internet into the social networking era, users participate and create massive online behavior fragments, which contain important information for online behavior measurement and monitoring, such as users’ habits, friends’ relationship, migration regularity etc.. Deep analysis on these characteristics can help us understand the users’ intent and formulate effective management strategy. In this project, we focus on developing information fusion methods for user’s online behavior fragments across multi-application, and aim to map the high dimension WEB fragments to the user behavior characteristics. Firstly, user’s behavior fragments dispersedly distributed in different WEB pages, we will develop methods for those information collection. Furthermore, we will focus on the unified modeling of those fragments, and then their uncertainty will be eliminated. Secondly, we focus on mining the fragment fusion evidences from user’s ID, IP address, friend relationship and user’s interests. Based on those evidences, we develop user’s behavior fragments fusion methods based on Fuzzy conditional D-S (FCDS) and evidence network theory. Finally, we focus on developing characteristic measurement methods for user’s individual and group behavior dynamics, and quantify the dependence between different users and the influence of specific user. Research results can be used for users’ online behavior supervision, and then promote the benignant development of their offline behavior.
多类型线上应用促使网络进入社交化时代,用户参与并创造了海量的线上行为碎片信息,这些碎片蕴含着用户生活习惯、好友关系、迁移规律等重要信息。对这些碎片信息的深度融合分析可为理解用户意图、制定高效的网管策略提供支撑。据此,本项目着重研究用户跨线上应用行为碎片信息的融合机理,其内涵为研究高维WEB碎片数据到用户行为规律的映射理论。低价值密度的行为碎片信息散乱分布在不同的WEB页面中,首先研究各种碎片信息的收集方法,并进一步实现碎片信息的统一化建模,消除其中的不确定性。随后由用户名、好友结构、兴趣特征等角度挖掘支持碎片信息相互融合的证据,研究基于证据网络和模糊条件证据理论的碎片信息融合方法,完善用户在线上社会中的行为属性。最后结合实际网络监管需要,研究用户在个体和群体两方面行为特征的度量方法,量化用户间依赖关系及其影响力。项目研究成果对督导用户线上行为,并促进其线下行为向着良性发展具有重要参考价值
网络用户产生了大量的行为数据,这些行为数据是典型的碎片化数据,通过融合分析这些数据不但可以发现网络安全事件,也可以掌握用户行为特征,为网络舆情监管奠定基础。本项目主要分析研究了碎片化数据融合分析在网络安全中的应用。首先针对网络攻击行为越来越隐蔽化以及“大流量小异常”造成的检测困难,提出基于行为对称度的实时网络异常检测方法,所提方法具有较高的检测性能,并能有效的降低计算量和内存开销。随后针对不同社交平台目标受众和数据组织形式等差异导致其整体风格迥异,通过学习不同社交平台风格表达方法,并通过风格迁移研究基于网络表达学习的无监督跨社交平台用户身份匹配方法,提出基于图互信息最大化的自监督表达学习方法预测跨社交平台不同用户潜在关联。再者以常用的情感词典资源为基础,扩展出适用于网络舆情数据的情感词典,并针对热点分面进行情感倾向和讨论热点分析;最后,使用word2vec从网络舆情语料中提取语义特征,并将语义特征分别与TextRank算法和LSTM模型进行融合,针对热点分面生成满足引导需求的文本内容。最后针对舆情管控却面临标注数据少、管控资源有限的难题,提出一种基于排序学习的舆情事件演化趋势重要性评估算法,在模型训练过程中,充分利用标注数据中的专家知识以及有标签数据和无标签数据的关联关系,筛选重要舆情事件进行管控,提升管控资源利用效能。.基于上述研究,项目组在IEEE Transactions on Information Forensics Security、Mobile Networks and Applications、计算机研究与发展等高水平期刊论文20余篇。在项目研究过程中,为分析不同异常网络流量的动态特性,项目组先后收集并标定了超过5TB的网络流量数据,包含DDOS、僵尸网络等攻击流量。同时项目组通过设计开发不同类型的网络爬虫,收集了包括新浪微博、腾讯微博、人人网、兵马俑BBS等近10种线上应用中,包含学生、教师、公司员工等不同类型用户的线上活动行为信息数亿条,为开展本研究奠定了良好的基础。综上所述,结合课题计划和研究目标,课题组已超额完成预期研究任务。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
基于多模态信息特征融合的犯罪预测算法研究
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
空气电晕放电发展过程的特征发射光谱分析与放电识别
动物响应亚磁场的生化和分子机制
网络热点事件跨社交媒体传播动态特性的度量与建模研究
融合社交信息和用户评分行为的可信推荐算法研究
非稳态社交网络用户行为的因果机制与方法研究
面向社交网络的用户转发行为建模与预测方法研究