超级计算系统预算约束的可靠性与能耗动态融合任务调度策略

基本信息
批准号:61672219
项目类别:面上项目
资助金额:16.00
负责人:唐小勇
学科分类:
依托单位:湖南大学
批准年份:2016
结题年份:2017
起止时间:2017-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:刘璇,谢健,吴帆,刘楚波,肖国庆,李闯,彭继武
关键词:
容错调度能耗超级计算机作业调度优化
结项摘要

The amount of energy needed to operate Supercomputer systems increases regularly since some years at a high pace, and the energy consumption has attracted a great deal of attention. Moreover, high energy consumption inevitably contains failures and reduces system reliability. However, there has been considerably less work of simultaneous management of system performance, reliability, and energy consumption on Supercomputer systems. In this project, we first aim at the Supercomputer large-scale and heterogeneity, and propose an architecture based on energy consumption angle of view. Then, we take the petroleum domain seismic imaging prestack reverse time migration processing as an example of large-scale complex high performance parallel application, and use structured and unstructured grids.to partition their data set dynamically, and propose a multi-constrained dynamic task partitioning method based on Supercomputer architecture. Third, aiming at the mutual dependence and restriction relation of system energy consumption, room temperature, reliability and task execution behavior relation, we propos a application execution reliability and energy consumption dynamical combination theory. Fourth, we use economics non-cooperative game equilibrium theory to compute application execution cost. Finally, we propose a budget restraint reliability and energy consumpiton dynamical combination multi-objective Pareto optimal task scheduling theory. The project research results will enrich the basic theory about Supercomputer systems energy consumption management, reliability assurance, task scheduling, and so on, and also provide a feasible method to improve the efficiency of Supercomputer application.

近年来,超级计算系统在社会经济、科学技术和国防安全中的应用日益广泛。然而,超级计算机固有的可靠性墙、能耗墙、并行墙等问题一直制约着高性能计算的应用效率。项目首先针对超级计算机的大规模性与异构性,提出能耗视角的体系结构,采用DVFS、任务整合与资源休眠机制建立能耗计算模型;然后,以石油领域地震成像叠前逆时偏移处理为复杂高性能计算应用实例,采用结构化网格和非结构化网格复合技术对数据集进行动态剖分,提出适合超级计算机体系结构的多约束动态任务划分方法;其次,研究能耗、温度、可靠性与任务执行行为关系,提出应用程序执行可靠性和能耗动态融合理论;最后,采用经济学非合作博弈均衡理论计算应用程序执行成本,提出成本预算约束下的可靠性与能耗动态融合多目标帕累托优化调度理论。项目研究成果将丰富超级计算系统能耗管理、可靠性保障和任务调度等方面的基础理论,为提高超级计算机应用效率提供一种可行方法。

项目摘要

近年来,大规模计算系统在社会经济、科学技术和国防安全中的应用日益广泛。然而,计算机系统固有的可靠性墙、能耗墙、并行墙等问题一直制约着高性能计算的应用效率。项目基于DVFS功耗技术提出元器件电压/频率与可靠性关系,并采用最小二乘曲线拟合法获得其关系模型。其次,项目组系统研究元器件能耗与系统能耗、能耗与温度、温度与可靠性关系,建立系统能耗、温度与可靠性相互关联依赖模型。最后,我们利用经济学非合作博弈均衡理论计算应用程序执行成本,采用遗传算法实现预算约束下的能耗、性能与可靠性动态融合多目标帕累托最优任务调度算法。项目研究成果将丰富计算系统能耗与可靠性约束关系、任务调度等方面基础理论,为提高其应用效率提供一种可行方法。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018
2

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019
3

基于混合优化方法的大口径主镜设计

基于混合优化方法的大口径主镜设计

DOI:10.3788/AOS202040.2212001
发表时间:2020
4

变可信度近似模型及其在复杂装备优化设计中的应用研究进展

变可信度近似模型及其在复杂装备优化设计中的应用研究进展

DOI:10.3901/jme.2020.24.219
发表时间:2020
5

涡轮叶片厚壁带肋通道流动与传热性能的预测和优化

涡轮叶片厚壁带肋通道流动与传热性能的预测和优化

DOI:10.7652/xjtuxb202112004
发表时间:2021

唐小勇的其他基金

批准号:61370098
批准年份:2013
资助金额:76.00
项目类别:面上项目

相似国自然基金

1

多处理器计算系统能耗和服务质量约束的任务调度策略研究

批准号:61003077
批准年份:2010
负责人:蒋从锋
学科分类:F0204
资助金额:20.00
项目类别:青年科学基金项目
2

预算功率指导的高能效GPU集群任务调度模型与算法

批准号:61272087
批准年份:2012
负责人:都志辉
学科分类:F0204
资助金额:84.00
项目类别:面上项目
3

边缘计算面向时空动态业务的资源部署与任务调度方法

批准号:61902036
批准年份:2019
负责人:马骁
学科分类:F0207
资助金额:26.00
项目类别:青年科学基金项目
4

基于可靠性的应急车辆动态调度策略解析

批准号:50908146
批准年份:2009
负责人:彭春露
学科分类:E0809
资助金额:20.00
项目类别:青年科学基金项目