异构并行系统上负载感知的新型稀疏算法性能优化研究

基本信息
批准号:61902407
项目类别:青年科学基金项目
资助金额:25.00
负责人:沈洁
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
新型稀疏算法负载感知性能优化异构并行系统并行计算模型
结项摘要

Emerging sparse algorithms (ESP algorithms) are the core components in big data and machine learning. Recently, implementing ESP algorithms based on core sparse matrix primitives (like SpMV and SpGEMM) is proposed. This method has high flexibility as a large number of ESP algorithms can be built by using a few core primitives. However, we point out that the method has limitations on performance (there is a ninja performance gap compared to the hand-optimized implementation) and hardware support (there are no implementations that support many-core processors and heterogeneous systems at present). Thus, it is hard to efficiently support future scenarios where a large spectrum of ESP algorithms running on various heterogeneous systems. Therefore, this work aims to devise efficient performance optimization methods for ESP algorithms on heterogeneous systems. Based on a workload-aware approach, we divide the research work into application, algorithm, and hardware layers to explore key research questions, which are workload characterization, optimization model design, and workload balancing on heterogeneous systems. By following such a top-down approach, we are able to distill key performance optimization techniques for ESP algorithms. Our work will overcome the limitation of primitive-based ESP algorithms, and provide a solid computing building block for big data and machine learning.

新型稀疏算法(ESP算法)是大数据与机器学习应用的核心组成部分。近年来研究人员提出基于核心稀疏矩阵算子(SpMV、SpGEMM等)实现ESP算法的方法。这种方法具有很高的灵活性,通过调用少量核心算子就可以构建大量ESP算法,然而我们指出这种方法目前在性能上(与手工优化存在差距)和硬件支持上(尚没有支持异构并行系统的实现)存在局限性,不能有效支持未来大量不同类型ESP算法在不同层次异构并行系统上运行的应用场景。因此本课题以面向异构并行系统的ESP算法高效性能优化为目标,将研究内容划分为应用层、算法层、硬件层三个层次,基于负载感知抽象出关键性的研究问题,即ESP算法负载特征分析、算法优化模型和面向异构并行系统的负载均衡模型,通过这样自顶向下层次式的研究,提炼出针对ESP算法的性能优化关键技术。本课题的研究成果将有效解决当前基于算子实现ESP算法的局限性,为大数据和机器学习提供有力的计算支持。

项目摘要

随着大数据与机器学习的兴起,面向图处理与智能计算的新型稀疏算法优化成为集算法、并行计算和体系结构交叉融合的新兴研究领域。本项目面向异构并行系统研究新型稀疏算法性能优化关键技术,主要包括:(1)构建了一套面向异构并行系统的新型稀疏算法测试程序集,提出了一套运行时算法负载描述和剖析技术,根据运行时获取的算法负载特征,综合运用一系列先进优化方法提高了算法性能;(2)针对新型稀疏应用对超越函数性能需求的提高,分段量化评估了当前超越函数的性能和精度,利用国产异构处理器向量部件,提出了基于操作数特征的向量化优化技术;(3)研究了新型稀疏算法中典型超越函数的软硬件协同优化技术,从软件层面抽象出影响性能的核心计算和访存片段,指导硬件定制专用加速指令并进行指令级优化,为新型稀疏算法充分发挥处理器计算性能提供了有力支持。本项目的研究成果将对下一代国产异构处理器的性能优化研究起到技术探索和预先研究的作用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

特斯拉涡轮机运行性能研究综述

特斯拉涡轮机运行性能研究综述

DOI:10.16507/j.issn.1006-6055.2021.09.006
发表时间:2021
5

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016

沈洁的其他基金

批准号:81804179
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:21603090
批准年份:2016
资助金额:21.00
项目类别:青年科学基金项目
批准号:51603184
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:61877032
批准年份:2018
资助金额:50.00
项目类别:面上项目
批准号:31500970
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:41401140
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:81401969
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:51708415
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:51877208
批准年份:2018
资助金额:61.00
项目类别:面上项目
批准号:81770878
批准年份:2017
资助金额:56.00
项目类别:面上项目
批准号:41771149
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:11301246
批准年份:2013
资助金额:22.00
项目类别:青年科学基金项目
批准号:61903124
批准年份:2019
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

异构并行系统全程序算法级低功耗优化方法研究

批准号:61672168
批准年份:2016
负责人:王卓薇
学科分类:F0204
资助金额:63.00
项目类别:面上项目
2

异构机群系统上近似串匹配并行算法研究与实现

批准号:60563003
批准年份:2005
负责人:钟诚
学科分类:F0204
资助金额:22.00
项目类别:地区科学基金项目
3

压缩感知中图像重建的稀疏优化模型与高性能算法研究

批准号:61772003
批准年份:2017
负责人:黄廷祝
学科分类:F0210
资助金额:53.00
项目类别:面上项目
4

基于异构体系结构的稀疏矩阵分解算法并行化研究

批准号:61502516
批准年份:2015
负责人:邹丹
学科分类:F0204
资助金额:21.00
项目类别:青年科学基金项目