基于分层图的海量图数据并行编程方法研究

基本信息
批准号:61402445
项目类别:青年科学基金项目
资助金额:26.00
负责人:王蕾
学科分类:
依托单位:中国科学院计算技术研究所
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:乔如良,吕方,刘颖,王晨曦,王敏,李星,杨帆,冯子畅
关键词:
并行编程大规模分布式系统图计算程序优化
结项摘要

With the rapid growth of the Internet and social networks, graph data scale is increasing dramatically and graph algorithms are getting more and more important. Due to the lack of a distributed graph computing framework, the information of social network data is far from well used. How to efficiently handle massive graph data with complex relationships and improve graph computing efficiency is a challenging research problem. This proposal takes typical graph applications as the example, 1) to control global communication overhead, proposes hierarchy graph based parallelism and the mapping mechanism to support hierarchical parallelism. This mapping mechanism uses three types of parallel mode and hierarchical management of computing resource and dynamically maps hierarchical parallelism to hardware parallel unit. Due to the increased parallelism and reduced global communication, the running efficiency is improved. 2) To improve efficiency of computing resource usage, proposes master-tail parallel method based on graph minor and the way of using MPMD parallel mode to reduce graph data scale using extra computing resource. 3) An abstraction of parallel programming interface that simplifies distributed parallel programming and improve programming efficiency.

随着互联网和社会网络的迅猛发展,图数据规模越来越大,图算法越来越重要。由于缺乏分布式图计算框架,导致社会信息网络数据的价值远远没有发挥出来。如何高效处理具有复杂关系的海量图数据以及提高图计算的编程效率是一个具有挑战性的研究问题。本项目以典型图应用为驱动,1.针对全局通信开销难以控制的问题,提出基于分层图的层次并行方法,研究支持层次并行的映射机制。该映射机制通过三种并行模式和分层的计算资源管理,将层次并行度动态映射到硬件并行单元上高效执行。由于能挖掘更多并行度,把全局通信转化为局部通信,从而提高计算效率。2.针对计算资源利用率低的问题,提出基于缩图的主裁并行方法,研究支持MPMD并行模式,用额外的计算资源来进行图规模缩减,由于数据规模大幅度减少,从而降低通信量,提高计算效率。3.在上两个工作之上,抽象出一套简洁的高层并行编程接口,简化分布式并行编程,适用更多图应用,提高编程效率。

项目摘要

随着互联网和社会网络的迅猛发展,图数据规模越来越大,图算法越来越重要。由于缺乏分布式图计算框架,导致社会信息网络数据的价值远远没有发挥出来。如何高效处理具有复杂关系的海量图数据以及提高图计算的编程效率是一个具有挑战性的研究问题。本项目以典型图应用为驱动,1.针对全局通信开销难以控制的问题,提出基于分层图的层次并行方法,研究支持层次并行的映射机制。该映射机制通过三种并行模式和分层的计算资源管理,将层次并行度动态映射到硬件并行单元上高效执行。由于能挖掘更多并行度,把全局通信转化为局部通信,从而提高计算效率。2.针对计算资源利用率低的问题,提出基于缩图的主裁并行方法,研究支持MPMD并行模式,用额外的计算资源来进行图规模缩减,由于数据规模大幅度减少,从而降低通信量,提高计算效率。3.在上两个工作之上,抽象出一套简洁的高层并行编程接口,简化分布式并行编程,适用更多图应用,提高编程效率。项目执行顺利,完成了预期的研究目标,取得的研究成果包括:1. 提出一种面向分布式图计算的数据一致性延迟机制,能有效降低全局同步和通信开销;2. 提出一种基于并行边的消息传输机制,能够解决消息传输中的瓶颈;3. 提出一种图敏感的动态优化技术,能自适应动态调节全局同步频率,使得计算快速收敛;4. 提出一种分布式锁无关的异步并行方法和一种基于分层图的层次并行方法,通过负载均衡来提高计算资源利用率;5. 提出一种冗余计算消除的图计算优化技术,消除公共DAG子图带来的冗余计算,从而大幅度提高计算效率。 项目资助下在国内外著名会议和期刊上发表论文16篇,包括领域国际著名会议PPoPP2016、PPoPP2018、ICS2015、NPC2016等,国际著名期刊TC、TPDS、TSE、TACO、JSC等,国内核心期刊软件学报、计算机研究与发展等。申请专利3项,并基于PowerGraph构建分层图的海量图数据并行编程框架原型系统。通过本项目的研究,从一定程度上解决了分布式图计算编程框架的执行效率和编程效率。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
3

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
4

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
5

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018

王蕾的其他基金

批准号:51502010
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:81400039
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:61561003
批准年份:2015
资助金额:34.00
项目类别:地区科学基金项目
批准号:31401056
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:11804266
批准年份:2018
资助金额:24.00
项目类别:青年科学基金项目
批准号:21905190
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:21401048
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:81600322
批准年份:2016
资助金额:17.50
项目类别:青年科学基金项目
批准号:21507047
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:31770301
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:51707109
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:41875047
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:81473613
批准年份:2014
资助金额:72.00
项目类别:面上项目
批准号:81673021
批准年份:2016
资助金额:58.00
项目类别:面上项目
批准号:81902597
批准年份:2019
资助金额:20.00
项目类别:青年科学基金项目
批准号:61402501
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:41571457
批准年份:2015
资助金额:65.00
项目类别:面上项目
批准号:51772170
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:51802320
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:51907162
批准年份:2019
资助金额:27.00
项目类别:青年科学基金项目
批准号:39700075
批准年份:1997
资助金额:10.00
项目类别:青年科学基金项目
批准号:81273742
批准年份:2012
资助金额:72.00
项目类别:面上项目
批准号:31800656
批准年份:2018
资助金额:20.00
项目类别:青年科学基金项目
批准号:30873230
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:31201527
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:81500111
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:51408261
批准年份:2014
资助金额:28.00
项目类别:青年科学基金项目
批准号:51805385
批准年份:2018
资助金额:24.00
项目类别:青年科学基金项目
批准号:30901907
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:61802152
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:81202801
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:81873252
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:21204060
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:50909099
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:81570023
批准年份:2015
资助金额:60.00
项目类别:面上项目
批准号:41201488
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:81502636
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:81302717
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:41501126
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:21006107
批准年份:2010
资助金额:19.00
项目类别:青年科学基金项目
批准号:21771059
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:41101177
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:51008262
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:31470382
批准年份:2014
资助金额:72.00
项目类别:面上项目
批准号:51305219
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:81573898
批准年份:2015
资助金额:57.00
项目类别:面上项目
批准号:21407160
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目
批准号:81500303
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:31600414
批准年份:2016
资助金额:23.00
项目类别:青年科学基金项目
批准号:11401512
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:71302019
批准年份:2013
资助金额:21.00
项目类别:青年科学基金项目
批准号:30900515
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:31101042
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:51003054
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

基于图数据库理论的海量RDF数据存储和查询方法研究

批准号:61003009
批准年份:2010
负责人:邹磊
学科分类:F0202
资助金额:19.00
项目类别:青年科学基金项目
2

面向新型隐私保护的海量图数据挖掘

批准号:61702132
批准年份:2017
负责人:尹丹
学科分类:F0202
资助金额:25.00
项目类别:青年科学基金项目
3

基于图的并行OWL本体推理方法研究

批准号:61672153
批准年份:2016
负责人:漆桂林
学科分类:F0607
资助金额:16.00
项目类别:面上项目
4

巨量标记图数据查询的大规模并行处理方法研究

批准号:61672255
批准年份:2016
负责人:袁平鹏
学科分类:F0202
资助金额:63.00
项目类别:面上项目