Community discovery is a long-standing and fundamental issue in the realm of complex network analysis, and it has been widely applied to a large number of fields including business intelligence, biomedicine, information security, behavior analysis, and so on. As the increasingly explosion of the scale of complex networks, the shortcomings of traditional community detection on both effectiveness and efficiency are gradually emerging. To remedy this, community extraction targets at dropping nodes with weak-ties to the network, and identify closely-knit genuine community structures from massive networks. Up to now, research work on community extraction is still at the beginning stage with few exciting fruits, and little research has been devoted to the efficiency problem when handling super-large scale networks. This declared project aims to conduct thorough research on community extraction, evolution and its applications. First of all, to clearly redefine the community extraction problem, the statistical measures will be studies including its definitions and the generalized model. Thus, a set of algorithms for community extraction will be proposed. Second, the distributed framework for community extraction from super-large scale complex networks will be designed to enhance the scalability of algorithms. Third, the evolution modeling and analyzing techniques for extracted sub-network and its community structures will be investigated. Last but not least, a prototype system will be designed and applied to a typical business intelligence case, i.e., targeted advertising to the crowd in the travel e-commerce. This declared project would be expected to complement and promote both theoretical research and practical applications of the community discovery.
社区发现是复杂网络分析中的一个重要基础性议题,并已应用于商务智能、生物医学、信息安全、行为分析等诸多领域。复杂网络规模的爆炸式增长使得传统社区检测方法在效果和效率上的不足逐渐显现,为此,社区抽取试图摒弃大规模网络中的弱连接节点,从核心网络上发现有意义的社区结构。社区抽取领域的研究处于起步阶段,成果尚不丰硕,面对超大规模网络的计算效率问题更是未得到深入的研究。本课题将对超大规模社会网络社区抽取、演化及其应用展开研究,首先,研究局部结构统计量的定义和泛化,以期清晰界定社区抽取问题,并提出社区抽取算法;其次,设计超大规模复杂网络社区抽取分布式框架,以提升算法的可扩展性;再次,研究动态网络中核心网络及其社区结构的演化模型和分析方法;最后设计原型系统,并应用于旅游广告信息群体投放这一热点商务智能领域。本课题的研究有望对社区发现的理论和应用实践提供重要的补充和推动作用。
社区发现是复杂网络分析中的一个重要基础性议题,在商务智能、生物医学、行为分析等领域具有广阔的应用价值。复杂网络规模的爆炸式增长使得传统社区检测方法在效果和效率上的不足逐渐显现,为此,社区抽取试图摒弃大规模网络中的弱连接节点,从核心网络上发 现有意义的社区结构。本项目围绕超大规模社会网络社区抽取演化及其在商务智能领域的应用展开研究,主要成果内容包括:(1)超大规模复杂网络的社区检测、及抽取框架,设计出“分解-组合”并行社区检测框架、及并行社区抽取系统PACE,大幅度提升了复杂网络中社区发现的质量和效率;(2)大数据分析的基础支撑技术,提出模糊组合学习FCC框架、设计出代价敏感的SQL查询自动翻译器、针对关联规则推荐设计一种高效的分布式计算框架,对文本和图大数据的分析提供了底层支撑;(3)复杂网络社区在电子商务中的应用研究,在虚假评论者识别方面,在特征向量的基础上加入复杂网络,提出了可以同时利用用户特征和用户—商品关系的混合半监督学习模型hPSD,能有效利用网络关系识别隐藏的虚假评论者;在旅游电商用户偏好建模方面,分别提出半监督多视图学习的购买预测方法,及融入多侧面特征的矩阵分解推荐模型。本项目的研究在复杂网络社区结构发现,及复杂网络与行为特征的融合学习上获得了一定的理论突破,从而形成了以下几个方面的成果:(1)发表(含录用)期刊论文21篇,SCI收录19篇,包含4篇IEEE/ACM汇刊论文;(2)发表国际会议论文10余篇,包含ICDM、SDM、IJCAI等顶级会议;(3)获得授权3项国家发明专利;(4)培养研究生8名。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
城市轨道交通车站火灾情况下客流疏散能力评价
基于FTA-BN模型的页岩气井口装置失效概率分析
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
基于动态演化博弈的复杂网络社区检测
基于复杂网络的虚拟社区关系挖掘与网络舆情演化分析
复杂社交网络环境下基于社区演化和传递效应的推荐策略研究
复杂网络社群演化的理论及应用研究