Influence maximization is a classic propagation optimization problem, with wide applications on public opinion monitoring, viral marketing, et al. Solving the influence maximization problem depends on the network structure and the diffusion model with parameters. Most traditional approaches only use the network structure while the diffusion parameters are manually set. The drawbacks of these approaches are that their diffusion models may not reveal the real diffusion mechanisms, and make them ineffective in real-world applications. To overcome the disadvantages, in this project we focus on real propagation data, and study the data-driven influence maximization problem. In detail, our project consists of three parts. First, we will study the influence learning problem by learning the parameters of any given diffusion model using machine learning methods. Second, based on the learned diffusion parameters, we will research on efficient influence maximization algorithms on large-scale networks. Last, we will further explore on influence maximization algorithms which are directly based on the diffusion data without need of any diffusion models. Our research will bridge the gap between traditional influence maximization methods and their real-world applications, and has important academic and practical value.
影响力最大化是一个传播优化问题,在舆情监控、病毒营销等领域具有重要的应用背景。该问题的求解依赖于网络的拓扑结构和传播模型及模型参数。传统的研究往往只利用了网络的拓扑结构信息,而传播模型及相应参数则由人为指定。其显著缺点是传播模型及参数不能正确反应网络真实传播规律,限制了传统方法在实际中的应用。为克服上述缺陷,本项目拟从社交网络中的海量传播数据入手,研究大数据驱动的影响力最大化问题。具体来说,本项目的研究将从三方面着手:首先研究传播模型的参数学习问题,采用机器学习手段从传播历史数据中学习传播模型参数;其次基于学习到的传播模型参数,并针对真实网络的大规模特点,研究高效的影响力最大化问题求解方法;最后探索不依赖于传播模型参数,而是直接基于传播数据的影响力最大化方法。本项目的研究成果将有助于打通传统影响力最大化方法与实际应用之间的壁垒,具有重要的理论和应用价值。
社交网络影响力最大化问题是一个传播优化问题,在舆情监控、病毒营销等领域具有重要的应用背景。该问题的求解依赖于网络的拓扑结构和传播模型及模型参数。传统的研究往往只利用了网络的拓扑结构信息,而传播模型及相应参数则由人为指定。其显著缺点是传播模型及参数不能正确反应网络真实传播规律,限制了传统方法在实际中的应用。为克服上述缺陷,本项目从社交网络中的海量传播数据入手,研究大数据驱动的影响力最大化问题。具体来说,本项目的研究从三方面着手:首先研究传播模型的参数学习问题,采用机器学习手段从传播历史数据中学习传播模型参数;其次基于学习到的传播模型参数,并针对真实网络的大规模特点,研究高效的影响力最大化问题求解方法;最后探索不依赖于传播模型参数,而是直接基于传播数据的影响力最大化方法。经过整个项目周期的研究,形成了如下研究成果:首先,提出了具有线性时间复杂度的影响力最大化模型LAIM,其核心思想是设计高效的递归迭代计算公式,利用节点对其局部邻域的影响力来近似其全局影响力,从理论上证明了算法具有线性时间和空间复杂度,显著提高了算法效率;其次,提出了基于多层潜力和社区结构影响力最大化模型IMPC,模型假设信息在具有社区结构的网络中的传播可以分为种子节点扩散和社区内部传播两个阶段,并在第一阶段考虑多步传播,与主流算法相比,问题求解的质量和效率都显著提升,能高效处理上亿规模网络。最后,针对大数据下的传播建模问题,结合最新的图神经网络方法,提出了基于用户转发网络表示学习的信息传播建模方法,与传统的基于手工特征的方法相比,所提出的方法能更准确地刻画信息传播规律。本项目的研究成果将有助于打通传统影响力最大化方法与实际应用之间的壁垒,具有重要的理论和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
城市轨道交通车站火灾情况下客流疏散能力评价
基于FTA-BN模型的页岩气井口装置失效概率分析
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
大数据量度下移动社交网络中影响力最大化问题研究
动态有竞争社交网络影响力最大化问题研究
面向时间约束的动态社交网络影响力最大化问题研究
不同类型在线社交网络下病毒式营销影响力最大化研究