Micro-architectural simulation is the key technology to evaluate GPGPU’s hardware design and software development. However, the simulation speed is extremely slow due to its hardware and software complexities, which reduce the efficiency of design and development tremendously. To address this issue, this project conducts the research to accelerate GPGPU’s micro-architectural simulation and improve its evaluation efficiency through sampling theory. Firstly, by observing the inherent runtime characteristics of GPGPU benchmarks, we propose a model with reliable metrics to measure the runtime behavior. Secondly, we give a hybrid sampling methodology to speedup GPGPU’s micro-architectural simulation based on the detailed analysis of GPGPU benchmarks runtime behavior. Then, we discuss the important factors that influence simulation speed and accuracy. Moreover, we perform detailed evaluation for the proposed sampling methodology, and make further improvements guided by the analysis of experimental results. At last, this project will provide a sampling theory and strategy for GPGPU micro-architectural simulation, reduce the simulation time by a factor of 10x on average, and significantly improve GPGPU’s design and development efficiency.
GPGPU微体系结构模拟是其硬件架构设计与软件应用开发的重要评估测试技术。然而,由于GPGPU软硬件的庞大与复杂性,其微体系结构模拟速度缓慢,评估测试周期漫长,严重制约设计开发效率。本项目针对这一问题,主要研究面向GPGPU微体系结构模拟的采样加速理论与策略。主要研究内容分为循序渐进的三部分:首先,研究刻画GPGPU程序运行行为特征表示方法,提出分析行为特征理论模型,为采样模型建立与策略设计提供理论指导;其次,基于GPGPU行为特征的分析归纳,开展契合GPGPU环境的分层采样模拟加速理论研究与策略设计;再次,构建采样模拟效率评估模型,研究影响模拟精度与速度的重要因素,并根据评估结果与影响因素反馈优化采样模拟加速理论模型与策略。最终,本项目提供一种面向GPGPU微体系结构模拟的采样加速理论与方法,在保持模拟精度前提下,大幅缩短模拟评估周期(模拟时长平均减少10倍以上),显著提高模拟评估效率。
随着数字化、智能化的日益普及,尤其是机器学习以及图像处理等技术广泛应用,GPGPU发挥着越来越大的作用。然后GPGPU的硬件架构设计与软件应用开发的评估测试技术发展相对滞后,受限于GPGPU软硬件的庞大与复杂性,评估测试技术中的微体系结构模拟速度缓慢,评估测试周期漫长,严重制约设计开发效率。本项目基于这一问题,开展了面向GPGPU微体系结构采样模拟的加速策略研究,研究内容分为三部分:首先,充分调研研究了日前开源GPGPU模拟器,并提出了刻画GPGPU程序运行行为特征表示方法,建立了分析行为特征的理论模型,通过特征向量的提取和聚类分析,以及分形行为的发现与应用,为采样模型建立与策略设计提供了理论指导;其次,基于GPGPU行为特征的分析归纳,设计了基于分层的采样策略模型,分三层采样选取具有代表性特征的样本片断;再次,研究了影响模拟精度与速度的重要因素,并构建了功能预热模型,设计了内存访问回放算法,为采样模拟的准确性和模拟速度提供了较好的保障。最终,本项目较完整地研究了面向GPGPU微体系结构模拟的采样加速中的各个关键问题,提出了解决方案和方法,并在开源模拟器上实现了部分功能,为后续GPGPU硬件架构设计和软件开发提供了宝贵的经验。
{{i.achievement_title}}
数据更新时间:2023-05-31
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
特斯拉涡轮机运行性能研究综述
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究
氯盐环境下钢筋混凝土梁的黏结试验研究
面向高精度计算领域动态可配置加速器体系结构研究
面向噪声优化的进化算法动态重采样策略研究
面向异构多核微体系结构的物理规划研究
面向GPGPU系统中存储访问优化关键技术的研究