基于系统层次结构的大图并行处理框架研究

基本信息
批准号:61300014
项目类别:青年科学基金项目
资助金额:25.00
负责人:张熙
学科分类:
依托单位:北京邮电大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:李方涛,马冀,苏援,吴巍,蒋官宏,许晋,范月
关键词:
图划分图结构社交网络分析大图处理
结项摘要

As the development of social networks, processing, analyzing and mining huge real-world graph is active. Graphs are used to express the relationships among objects, and thus have great value. As the scale and dependencies of graph data are increasing, designing efficient systems and algorithms for large-scale graph processing is challenging. This study proposed a new parallel framework for large-scale graph processing, which optimizes graph partitioning algorithms towards hierarchical structures of distributed systems. This proposal analyzes the partitioning cost on each system structure level, and builds a cost model. Efficient partitioning methods are proposed which exploits the architecture features of each level. A unified large-scale graph partitioning mechanism is proposed together with performance optimization techniques, including data placement, data replication, node communication, I/O and task scheduling techniques. A self-adaptive and self-optimization mechanism is also proposed towards natural graphs and streaming graphs. Open source framework and prototypes are proposed, and evaluations are made on several application domains.

随着社交网络的兴起,基于大规模图结构上的计算、分析与挖掘,成为具有重要价值的研究热点。数据的持续增加和关联关系的日益复杂,对并行系统结构设计和图划分算法的设计都提出了挑战。本项目拟针对大规模图并行处理中高性能、高效率和易编程的需求,通过将大图划分算法与系统层次化结构有机结合,提出一种新颖的大图处理框架。该框架利用分布式系统中各层级的结构特性,建立划分代价分析模型,设计适应各自层级需求的高效划分方法。在此基础上,建立统一的层次化大图划分框架。为了进一步提升效率,通过分析大图数据存储与访问的模式,优化数据分布、数据复制、节点通信、I/O访问和任务调度等机制。针对自然图及动态图等多种类型图结构,提出自适应、自优化的处理机制。最后,构建开源框架和原型系统,并在社交网络及电信网络等应用领域中进行评估验证。

项目摘要

随着社交网络的兴起,基于大规模图结构上的计算、分析与挖掘,成为具有重要理论意义和应用价值的研究热点。本项目面向大规模图结构数据,研究如何高效处理,检索、分析与应用。研究主要分为四个方面:(1)基于并行体系结构的大图划分与子图检索研究,包括在并行节点上的大图划分方法,子图增强技术、查询图分解算法、子图通信算法、顶点索引构建方法以及任务划分和同步机制等。基于该研究,第一次实现了在以顶点为中心的图结算模式下的子图检索和子图同构算法,八节点集群上可以将子图同构处理规模扩展到几十万甚至百万级;(2)基于社交网络拓扑结构的信息传播算法,考虑消息间的相互作用和网络拓扑结构,基于进化博弈论和贝叶斯模型,分别提出信息传播预测算法,为促进或抑制信息传播提供了依据;(3)基于顶点影响力的社团发现算法,我们分析了高度数节点在大规模网络社团结构中的特别作用,基于此提出了基于顶点可变影响力的社团划分算法。该算法可以根据实际应用场景和需求,调整划分的方案;(4)并行体系结构的存储性能优化。本项目还对并行系统地城架构开展研究,力图提升存储系统的性能和效率。针对多任务并行存储空间分配的问题,提出了一种面向伪LRU算法的cache容量划分机制。针对新型相变内存和固态硬盘写延迟高的问题,提出了非对称的读写替换算法。所提算法都具有良好的性能和较低的存储和实现代价。本项目执行过程中已发表8篇论文,其中4篇SCI期刊论文,4篇EI会议论文,包括CCF A类会议论文。申请专利一项,出版专著一部,基本达到了立项之初的要求和目的。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
4

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
5

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022

相似国自然基金

1

层次式面向对象并行应用框架技术的研究

批准号:69873021
批准年份:1998
负责人:吕建
学科分类:F0203
资助金额:12.00
项目类别:面上项目
2

基于分布式层次图的最大流混合并行算法研究

批准号:61702162
批准年份:2017
负责人:魏蔚
学科分类:F0202
资助金额:24.00
项目类别:青年科学基金项目
3

大邻域图像并行处理机的研究

批准号:60672109
批准年份:2006
负责人:苏光大
学科分类:F0116
资助金额:28.00
项目类别:面上项目
4

多处理机系统(MTS)上的并行处理结构分析方法

批准号:19172057
批准年份:1991
负责人:叶天麒
学科分类:A0813
资助金额:4.50
项目类别:面上项目