Graph processing has been widely adopted in massive domains of applications such as big data analytics and it has become one of the key computing engines in data centers. Irregular graph processing on general purposed processors such as CPUs suffers rather low energy efficiency. FPGA reconfigurable computing that enables customized computing on various applications is critical to improve computing energy efficiency in data center. While general graph accelerator remains not energy-efficient and customizing graph accelerator requires tremendous design efforts, this is now one of the most challenging problems in FPGA based graph processing acceleration. In this project, we target at automatic graph processing accelerator synthesis and aim to develop an automatic graph processing accelerator customization and generation tool for specific graph and processing algorithm. 1) On the architectural level, we will design a scalable and reusable graph processing accelerator overlay which ensures agile graph processing accelerator design on FPGAs. 2) On the graph data level, we will explore the graph partition, graph data reordering and graph layout optimization centering the underlying accelerator structure. 3)Finally, we take both the graph data optimization and accelerator architectural parameters into consideration and propose a unified design space exploration framework to determine optimized graph processing acceleration strategy on FPGAs. Eventually, we can customize the graph accelerator automatically and enhance the energy efficiency of graph processing in data center.
图计算在大数据分析等众多领域中广泛使用,已经成为数据中心的一个关键计算引擎。在通用计算系统如CPU上进行不规则的图计算能效很低,基于FPGA的专用图计算加速成为提高数据中心能效的核心技术。通用图计算加速器能效低,而针对具体算法定制图计算加速器的设计效率低,两者之间的矛盾是FPGA图计算的一个巨大挑战。本项目主要研究FPGA上专用图计算加速器的自动综合方法,设计一套能够对特定算法和图数据自动化定制加速器的工具。1)在体系结构层面,采用FPGA Overlay的设计方法,构建一套可扩展可重用的图计算加速器模板,能够方便的支持多种图算法的快速定制;2)在图数据层面,针对加速器进行图数据分割、重排以及布局的优化,进一步提高加速器的性能;3)针对特定图算法和图数据进行设计空间探索,自动定制图计算加速方案。最终实现自动化的FPGA图计算加速器定制,提升计算中心的图计算能效。
本课题已经按照既定的研究计划,稳步推进,完成了项目的研究目标,其中主要包括以下几个方面:.1)设计了基于HLS的深度定制化的图计算加速器,相对于通用的图计算加速器,具有更高的计算能效。.2)同时针对定制图计算加速器导致的设计效率低且易错的问题,我们创新的提出了基于领域专用语言的图计算加速器生成方法,使得用户可以仅仅使用高层次描述语言,关注图计算算法的实现,而无需深入底层图计算加速器的硬件细节。借助DSL的编译优化,即可以根据具体算法的特点和参数,对生成的图计算加速器进行参数优化,达到较高的性能。相关的代码已经开源,初步展示了基于DSL的图计算加速器生成效果,并且仍然在持续推进,以适应更加复杂的硬件系统,如多FPGA加速卡等。.3)我们在图计算加速器的研究过程中,发现图学习算法和图计算的特征存在很大的相似性,基于我们在图计算加速器设计方面的研究,进一步设计了图学习加速器以及基于图学习加速器的图学习系统,实现高效的大规模非结构化数据的检索。.4) 总体上,我们不仅完成了项目既定的研究计划,创新的提出了基于领域专用语言的高效率图计算加速定制方法,并超额完成了相关的研究工作,将图计算加速的工作迁移到图学习计算和系统问题,并提供高性能的非结构化数据检索,拓展了图计算系统的应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
特斯拉涡轮机运行性能研究综述
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
瞬态波位移场计算方法在相控阵声场模拟中的实验验证
近水平层状坝基岩体渗透结构及其工程意义
基于可拓学倾斜软岩巷道支护效果评价方法
面向深度学习的高能效FPGA计算架构及映射方法研究
面向基于图的数据挖掘的FPGA加速方法研究
面向大规模图计算的FPGA加速器关键技术研究
高能效FPGA高层次综合研究