面向国产处理器的数值计算核心算法性能建模与优化方法研究

基本信息
批准号:61902411
项目类别:青年科学基金项目
资助金额:20.00
负责人:杨博
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
数值算法性能建模性能分析自动性能优化国产处理器
结项摘要

Key numerical algorithms such as dense linear algebraic solving algorithm, sparse linear algebraic solving algorithm and iterative computing algorithm on structural grid are the foundation of high-performance numerical simulation. An important cause of this problem is the mismatch between hardware architecture and algorithmic computing and data access patterns. At the same time, the complexity of the hardware architecture presents great challenges for performance bottleneck analysis and algorithm performance optimization. As the core device of the new-generation Chinese-made Exascale supercomputer systems, the Chinese-made processors will completely replace the current mainstream commercial processors and accelerators. At present, the work related to the performance analysis and performance optimization of key numerical algorithms for Chinese-made processors is not systematic and the practice remains a gap..This project is aimed at performance modeling and optimization methods for key numerical algorithms on chinese-made Fhytium series processor. The main contents include: to introduce a computational memory access execution model for key numerical algorithms on FT processor, to propose a analytical performance model for the given execution model of calculation and memory access, quantitatively evaluating the floating point performance and the actual use of the memory bandwidth of algorithms on the Fhytium processor, to design an performance model based optimization parameter selection method achieving efficient and accurate automatic selection of performance optimization parameters, and to propose an model-guided automatic performance optimization technology to realize the efficient and automatic performance optimization of key algorithms on the Fhytium processor.

稠密线性代数求解算法、稀疏线性代数求解算法和结构网格上迭代计算算法等数值计算核心算法作为高性能数值模拟的基石,在超算系统上普遍存在浮点计算效率低问题。导致这一问题的重要原因是国产处理器体系结构与算法计算和数据访问模式的不匹配。同时硬件体系结构的复杂度提⾼导致性能瓶颈原因分析和算法性能优化带来了很大挑战。国产自主处理器将全面取代目前主流商用处理器和加速器,成为国产E级超算系统的核心器件。目前面向国产处理的数值计算核心算法性能分析和性能优化的相关工作尚不成熟。.本项目面向国产飞腾系列处理器开展数值计算核心算法计算访存性能建模与优化方法研究,主要包括:建立针对FT处理器上数值计算核心算法的计算访存执行模型,建立针对给定计算访存模型的分析型计算访存性能模型,实现定量评估给定算法在飞腾处理器上的浮点计算性能和实际访存带宽,提出模型指导的自动性能优化技术,实现飞腾处理器上核心算法的高效自动性能优化。

项目摘要

Stencil计算和蒙特卡罗(MC)粒子输运是两类重要的数值计算核心算法,广泛应用于高性能科学与工程计算应用领域。两类算法由于具备计算访存比低、随机访存、分支多等特点,在通用CPU上计算效率较低,随着硬件体系结构的复杂度提高,针对两类计算的性能优化遇到很多挑战,需要算法性能模型指导。同时,目前普遍认为有效提升两类算法性能的最有效方法是软硬件协同设计,其关键是性能模型。本项目面向飞腾FT处理器,开展结构网格Stencil计算和蒙特卡罗粒子输运两类数值计算核心算法的解析性能建模和优化方法研究。.建立网格结构上Stencil计算计算访存性能模型。首先,利用排队论方法描述Stencil计算在FT处理器上延迟、并发度与实际使用访存带宽的相互关系,建立访存并发度预测模型。然后,建立预取性能模型,量化预测硬件预取对访存缺失率和访存并发度的影响模型。最后,基于前面的访存并发度模型、访存缺失率模型和预取性能模型建立了面向网格结构Stencil计算的访存性能模型。实验结果显示本文提出模型的预测性能与实际性能的误差小于10%。当内存带宽使用率不高时,本文模型的预测精度远高于已有的ECM模型。.建立一种基于子过程特征分析的MC粒子输运性能模型。该模型将子过程执行时间分为基础时间、访存时间和分支预测失败时间,通过分析子过程行为获得子过程的特征,包括指令、访存和分支特征,基于这些特征建立解析模型,预测每个子过程的执行时间。实验结果表明本文提出的模型的预测平均误差为22%。基于此模型,分析了每个子过程的 CPI 组成以及分支预测器和 L3 缓存的大小的影响。.该工作一方面可以用于快速定位FT处理器上Stencil计算和MC粒子输运模拟访存瓶颈,指导高效的性能优化;同时还可作为软硬件协同设计的桥梁,指导下一步面向两类计算的专用加速器和算法设计优化。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于国产化替代环境下高校计算机教学的研究

基于国产化替代环境下高校计算机教学的研究

DOI:
发表时间:
2

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
3

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
4

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
5

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

DOI:10.11842/wst.20190724002
发表时间:2020

杨博的其他基金

批准号:61573245
批准年份:2015
资助金额:64.00
项目类别:面上项目
批准号:81601147
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:41601492
批准年份:2016
资助金额:19.00
项目类别:青年科学基金项目
批准号:61174127
批准年份:2011
资助金额:59.00
项目类别:面上项目
批准号:21376098
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:61876069
批准年份:2018
资助金额:64.00
项目类别:面上项目
批准号:11202188
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:60503016
批准年份:2005
资助金额:24.00
项目类别:青年科学基金项目
批准号:31800076
批准年份:2018
资助金额:28.00
项目类别:青年科学基金项目
批准号:11872336
批准年份:2018
资助金额:63.00
项目类别:面上项目
批准号:51708071
批准年份:2017
资助金额:21.00
项目类别:青年科学基金项目
批准号:31301648
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:20506007
批准年份:2005
资助金额:23.00
项目类别:青年科学基金项目
批准号:50905070
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:61572226
批准年份:2015
资助金额:65.00
项目类别:面上项目
批准号:61373053
批准年份:2013
资助金额:76.00
项目类别:面上项目
批准号:61731012
批准年份:2017
资助金额:290.00
项目类别:重点项目
批准号:51706171
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:61806159
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:60873149
批准年份:2008
资助金额:32.00
项目类别:面上项目
批准号:60804030
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

国产处理器基础数学函数精度分析与优化

批准号:61802434
批准年份:2018
负责人:许瑾晨
学科分类:F0202
资助金额:25.00
项目类别:青年科学基金项目
2

面向机器学习任务的优化建模与算法研究

批准号:11871447
批准年份:2018
负责人:杨周旺
学科分类:A0405
资助金额:55.00
项目类别:面上项目
3

面向国产100PF计算机的高效基础算法库研究

批准号:91530324
批准年份:2015
负责人:迟学斌
学科分类:F0202
资助金额:250.00
项目类别:重大研究计划
4

面向高性能数值计算的浮点舍入误差分析及精度优化研究

批准号:61802426
批准年份:2018
负责人:任小广
学科分类:F0204
资助金额:27.00
项目类别:青年科学基金项目