面向不规则GPU应用的分析与优化技术研究

基本信息
批准号:61672048
项目类别:面上项目
资助金额:63.00
负责人:梁云
学科分类:
依托单位:北京大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:陈德铭,魏学超,谢小龙,李秀红,王硕,肖倾城,薛渊博,王晓阳,温爽
关键词:
体系结构优化高性能计算性能模型不规则GPU应用程序改造和编译优化
结项摘要

Recently, GPUs have been widely adopted for high performance computing. This rapid adoption has led to the fact that more and more irregular and general-purpose applications are ported onto GPUs. However, these irregular applications can not effectively utilize the hardware computing resources and incur extra performance overhead due to the control and memory divergence, input variation, unbalanced workload, etc. This proposal will investigate the performance acceleration of irregular applications on GPUs. The goals of this project are: 1) develop characterization and program profiling techniques; 2) build accurate performance model to predict the performance and identify bottlenecks; 3) develop program transformation and compiler optimization techniques to improve performance; 4) propose architectural optimization techniques to improve performance; 5) develop efficient libraries, for irregular applications onto GPUs. Collectively, the proposed analysis and optimization techniques can obtain by one or two orders of magnitude speedup for irregular applications on GPUs.

近年来,GPU 架构已经被广泛的使用在高性能计算领域。GPU计算的兴起,则为GPU带来了数量繁多的通用应用,而且这些应用很多都是不规则的应用。由于控制和访存方面的多样性,输入依赖和不均衡负载等特点,不规则应用不能有效地利用硬件资源而且需要付出更多的额外开销,这就抵消了GPU架构的优势。在这样的背景下,本项目面向不规则GPU应用,开展分析和优化技术的研究。研究目标如下:针对不规则GPU应用,1) 提出统一的表征分析和提取技术,刻画其不规则性;2) 建立准确的性能预测模型并发现性能瓶颈;3) 提出程序改造和编译优化技术以提升性能; 4) 提出体系结构优化技术以提升性能;5) 建立适应高性能计算和GPU体系结构的通用函数库。本项目提出的技术可以剖析不规则应用的特点,并根据不同特点,利用程序改造、编译、体系结构的优化技术提升性能。本项目的解决方案预期可达到性能1~2个数量级的提升。

项目摘要

随着GPU计算的普及,如何使用GPU加速不规则的复杂应用变得越来越重要。GPU架构的特点是核心数目多、访存带宽高。然而,不规则应用在计算和访存方面的不规则性导致其在GPU芯片上的效率低下。为了解决这些问题,本项目提出了一套跨层次的软硬件适配的技术路线。1) 在算法和函数库层面,针对SpMV, LDA, GEMM等算子,我们提出支持稠密和稀疏的并行方案,同时提出性能模型指导优化参数的选择; 2) 在体系结构层面,我们提出协同式的缓存管理技术, 多任务并发执行技术, 寄存器分配和线程并行度的协同管理技术; 3) 在编译层面,我们提出针对张量算子的自动优化和生成工作, 动态和静态结合的缓存旁路技术, 基于OpenCL的系统优化框架;4) 在软件编程模型方面,我们提出基于OpenCL的性能评估模型和软件优化技术。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

特斯拉涡轮机运行性能研究综述

特斯拉涡轮机运行性能研究综述

DOI:10.16507/j.issn.1006-6055.2021.09.006
发表时间:2021
4

MSGD: A Novel Matrix Factorization Approach for Large-Scale Collaborative Filtering Recommender Systems on GPUs

MSGD: A Novel Matrix Factorization Approach for Large-Scale Collaborative Filtering Recommender Systems on GPUs

DOI:
发表时间:2018
5

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019

梁云的其他基金

批准号:21072054
批准年份:2010
资助金额:34.00
项目类别:面上项目
批准号:61202293
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:61772209
批准年份:2017
资助金额:61.00
项目类别:面上项目
批准号:21572051
批准年份:2015
资助金额:65.00
项目类别:面上项目
批准号:61300005
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

面向GPU的实时系统时间分析与优化技术研究

批准号:61772123
批准年份:2017
负责人:吕鸣松
学科分类:F0202
资助金额:61.00
项目类别:面上项目
2

面向GPU的非规则应用并行效率优化关键技术研究

批准号:61702018
批准年份:2017
负责人:曹倩
学科分类:F0204
资助金额:26.00
项目类别:青年科学基金项目
3

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

批准号:61502509
批准年份:2015
负责人:苏华友
学科分类:F0204
资助金额:21.00
项目类别:青年科学基金项目
4

面向GPU的体系结构敏感型数值算法优化技术研究

批准号:61202094
批准年份:2012
负责人:张纪林
学科分类:F0204
资助金额:24.00
项目类别:青年科学基金项目