面向GPU的非规则应用并行效率优化关键技术研究

基本信息

批准号：61702018

项目类别：青年科学基金项目

资助金额：26.00

负责人：曹倩

学科分类：

依托单位：北京工商大学

批准年份：2017

结题年份：2020

起止时间：2018-01-01 - 2020-12-31

项目状态：已结题

项目参与者：周亦鹏,李勇,张青川,余成,于欣言,周朝晖,冀明亮

关键词：

负载均衡多核非规则应用并行优化

结项摘要

The study makes researches on optimizations of irregular applications on GPU platform, in terms of load imbalance and poor data locality. The study aims to solve the problem of low efficiency of parallel irregular applications which are widely seen in large-scale scientific computing. The model of irregularity degree is constructed, which reveals the relationship between load imbalance and irregularity degree, providing the theoretical basis for optimizations of parallel applications; Considering the characteristics of dynamic task generation and multi-level load imbalance, a load-sensitive multi-granularity load balance algorithm is proposed. A load-sensitive task partition algorithm is first presented by constructing a model of dynamic task partition, and then a multi-granularity work-stealing strategy is proposed to further optimize the applications with multi-level load imbalance. A resource-driven cache bypassing is presented to solve the problem of cache thrashing caused by poor data locality. First, a priority based warp bypassing strategy by adaptive warp throttling is proposed to alleviate effectively cache thrashing while guarantee efficient resource utilization. And then we present a reuse-distance based instruction bypassing approach, which decreases cache pollution through a locality sensitive cache replacement strategy. This study aims to provide the technical supports and the core algorithms for parallel optimizations of irregular applications, which are expected to improve the parallel efficiency of irregular applications in large-scale scientific computing.

针对大规模科学计算中非规则应用并行效率低的问题，从负载均衡及数据局部性角度研究面向GPU的非规则应用并行优化技术。通过构建非规则度模型，建立非规则度与负载均衡的内在联系，为并行优化提供理论依据；结合非规则应用动态任务生成及多层次负载不均衡的特性，提出一种负荷敏感的多粒度负载均衡方法，通过构建动态任务划分模型实现负荷敏感的任务划分算法，研究多粒度任务窃取技术以解决多级负载不均衡问题；针对数据局部性引起的cache抖动问题，提出一种资源驱动的cache bypassing方法，通过自适应warp节流实现基于优先级的warp bypassing策略，保证资源充分利用的前提下缓解cache抖动。研究局部性敏感的cache替换策略，提出基于重用距离的指令bypassing方法以减少cache污染。本项研究旨在为非规则应用并行优化提供技术支撑及核心算法，有望提高大规模科学计算中非规则应用的并行效率。

项目摘要

本课题针对大规模科学计算中普遍存在的非规则应用并行效率低的问题，从负载均衡及数据局部性角度研究了非规则应用并行优化技术。通过构建非规则度模型，建立非规则度与负载均衡的内在联系，为并行优化提供理论依据。鉴于非规则应用并行执行时多级负载不均衡并存的情况，结合非规则应用动态任务生成的属性，构建一种负荷敏感的多粒度负载均衡方法，提出负荷敏感的任务划分算法以动态实现任务均分，实现多粒度任务窃取技术，有效缓解了非规则应用并行执行时多级负载不均衡并存的问题。针对数据局部性引起的高速缓存抖动问题，本课题提出了一种资源驱动的高速缓存旁路方法，通过自适应warp节流实现基于优先级的warp旁路策略，由此既保证了资源的充分利用，同时还有效缓解了一级高速缓存的抖动现象。针对局部性敏感的高速缓存替换策略进行了研究，提出了一种基于重用距离的指令旁路方法从而减少高速缓存的污染。针对典型的非规则测试用例以及传感器数据分析、图像处理等实际应用评价本项目所提理论及算法，实验证明所提的算法有效地改善了负载均衡及数据局部性，明显提高了非规则并行应用效率。本项研究为非规则应用并行优化提供技术支撑及核心算法，为提高大规模科学计算中非规则应用的并行效率提供参考。依托该项目发表SCI、EI、CSCD及核心期刊论文9篇，授权发明专利1项、处于实审阶段专利3项，培养研究生4人、青年教师晋升职称2人。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2020

DOI：

发表时间：2021

DOI：

发表时间：2021

DOI：10.7498/aps.70.20202116

发表时间：2021

曹倩的其他基金

批准号：30500244

批准年份：2005

资助金额：25.00

项目类别：青年科学基金项目

批准号：81370506

批准年份：2013

资助金额：16.00

项目类别：面上项目

批准号：81070309

批准年份：2010

资助金额：32.00

项目类别：面上项目

相似国自然基金

面向不规则GPU应用的分析与优化技术研究

批准号：61672048

批准年份：2016

负责人：梁云

学科分类：F0204

资助金额：63.00

项目类别：面上项目

面向高速网络监控的并行频繁项挖掘及GPU优化关键技术研究

批准号：61103214

批准年份：2011

负责人：张玉

学科分类：F0205

资助金额：24.00

项目类别：青年科学基金项目

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

批准号：61502509

批准年份：2015

负责人：苏华友

学科分类：F0204

资助金额：21.00

项目类别：青年科学基金项目

面向异构众核系统的非规则问题优化技术研究

批准号：61303050

批准年份：2013

负责人：王珏

学科分类：F0202

资助金额：27.00

项目类别：青年科学基金项目

面向GPU的非规则应用并行效率优化关键技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

药食兼用真菌蛹虫草的液体发酵培养条件优化

非牛顿流体剪切稀化特性的分子动力学模拟

曹倩的其他基金

两种新型中国汉族NOD2突变体的功能研究

磷酸酶SHP-2调节巨噬细胞活化介导炎症性肠病的生理学意义及分子机制研究

转录因子FoxO4在炎症性肠病中的免疫调控与分子机制研究

相似国自然基金