预算功率指导的高能效GPU集群任务调度模型与算法

基本信息

批准号：61272087

项目类别：面上项目

资助金额：84.00

负责人：都志辉

学科分类：

依托单位：清华大学

批准年份：2012

结题年份：2016

起止时间：2013-01-01 - 2016-12-31

项目状态：已结题

项目参与者：谢涛,万宇鑫,刘文杰,刘渊,何禹,杨全

关键词：

GPU集群任务调度能量效率绿色计算

结项摘要

High energy consumption has become a challenging problem for supercompter systems. Target at GPU cluster, one typical supercomputer architecture, we propose the energy efficient task scheduling model and algorithm which can significantly cut the energy consumption in the long term. Based on the system model, task model and energy model, we propose the task scheduling model for GPU clusters. We provide a metric, OEAD (Optimal Energy Approciate Degree), which can be used to evaluate the results of different scheduling algorithms on different supercomputers easily. The waterfall model is provided to help us to develop different kinds of efficient energy saving policies which can be employed in our scheduling algorithm. Based on the current workload, history workload and the predicted workload of given time window, we develop the method on calculating the power budget which can be taken as the approximate optimal power to execute a long period of workload. So our scheduling object is to make the dynamic system power curve as flat as possible and as close to the budget power as possible. We propose hierarchical task mapping and scheduling method which can map the tasks onto physical computing units level by level and step by step. At the same time, we employ different energy saving policies to adjust the dynamic power as close to the power budget as possible. We also provide the method on evaluating our algorithm on simulation environments, prototype systems and some typical existing GPU clusters. This complete evaluation results will help us to further improve our algorithm to make it adapt to more systems and achieve better result. Our algorithm will significantly reduce the energy consumption without loosing the quality of service in long run.

高能耗已经成为超级计算机研制与应用中必须解决的挑战性问题。本研究针对GPU集群这种典型的超级计算机体系结构，旨在解决在GPU集群上实现高能效任务调度所面临的基础性核心问题，设计可以长期、大幅度降低超级计算机能耗的调度模型与算法。本研究分析并抽象典型GPU集群的系统模型、任务模型、能耗模型以及调度模型；提出一种可以度量与比较超级计算机能量效率水平的指标；设计出瀑布模型用于指导多层次、多粒度的节能策略开发，在充分考虑全局节能效果的基础上给出预算功率的设置原则与方法，据此提出了基于预算功率指导的层次化、高能效任务调度算法的设计方法；基于仿真环境、原型系统以及真实系统，分别设计了对本研究提出的调度算法与相关策略的有效性进行全面验证与进一步优化提高的方法。这项基础性的研究成果，一方面可以用于指导未来节能型超级计算机的研制，另一方面可以应用到已经存在的超级计算系统中，大幅度降低其能耗开销。

项目摘要

高能耗已经成为超级计算机研制与应用中必须解决的挑战性问题，而且也成为云中心首先考虑的核心问题。本研究针对GPU集群这种典型的超级计算机体系结构，解决在GPU集群上实现高能效任务调度所面临的基础性问题，设计可以长期、大幅度降低超级计算机能耗、优化执行性能的调度模型与算法。本研究分析并抽象典型GPU集群的系统模型、任务模型、能耗模型，据此提出相应的调度模型；结合GPU超级计算系统与云中心，设计多层次、多粒度的节能策略，在充分考虑全局节能效果与应用执行性能的基础上，提出基于预算功率指导的层次化、高能效任务调度算法的设计方法；基于仿真环境、原型系统以及大规模真实GPU集群系统，并结合引力波数据处理、双黑洞仿真、空间天气实时预报、网络仿真等科学与工程应用问题，对本研究提出的算法与相关策略的有效性进行了实现、验证与提高，取得了显著的应用成果。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2018

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：

发表时间：2017

DOI：10.14006/j.jzjgxb.2018.0676

发表时间：2021

都志辉的其他基金

批准号：60503039

批准年份：2005

资助金额：24.00

项目类别：青年科学基金项目

批准号：60773148

批准年份：2007

资助金额：8.00

项目类别：面上项目

批准号：61073008

批准年份：2010

资助金额：36.00

项目类别：面上项目

相似国自然基金

异构GPU集群混合粒度任务协同调度与动态均衡机制研究

批准号：61202005

批准年份：2012

负责人：李涛

学科分类：F0204

资助金额：22.00

项目类别：青年科学基金项目

超级计算系统预算约束的可靠性与能耗动态融合任务调度策略

批准号：61672219

批准年份：2016

负责人：唐小勇

学科分类：F0204

资助金额：16.00

项目类别：面上项目

数据部署与任务调度融合的节能优化模型及算法研究

批准号：61402350

批准年份：2014

负责人：王晓丽

学科分类：F0201

资助金额：26.00

项目类别：青年科学基金项目

基于GPU异构集群的FFT算法数学库研究

批准号：61240045

批准年份：2012

负责人：崔翔

学科分类：F0204

资助金额：15.00

项目类别：专项基金项目

预算功率指导的高能效GPU集群任务调度模型与算法

{{i.achievement_title}}

暂无此项成果

其他相关文献

神经退行性疾病发病机制的研究进展

"多对多"模式下GEO卫星在轨加注任务规划

智能煤矿建设路线与工程实践

基于两阶段TOPSIS-DEA模型的我国商业银行经营绩效评价

带球冠形脱空缺陷的钢管混凝土构件拉弯试验和承载力计算方法研究

都志辉的其他基金

基于合同的网格服务QoS保障机制与模型

基于结点聚类的层次化消息调度模型与算法

基于GPU的并行排序算法设计与优化

相似国自然基金