数据驱动的高性能计算机上并行程序性能预测研究

基本信息
批准号:61772485
项目类别:面上项目
资助金额:61.00
负责人:孙广中
学科分类:
依托单位:中国科学技术大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:李京,李会民,周英华,孙经纬,何卓骋,潘轶功,张茜,孙昊,张子航
关键词:
数据驱动高性能计算机性能预测并行程序性能建模
结项摘要

Performance modeling and execution time predicting of parallel programs on high performance computers is important for many practical applications, involving wide focus of researches. However, accurate prediction is a fairly challenging problem due to that the performance is affected by a plenty of factors. In recent years, the data processing and mining technologies are under consistent development, which afford a possible approach to reveal implicit patterns of data and solve the problem. When the parallel programs executing, they can generate a large quantity of data from hardware performance counter and the instrumented program code, which reflect the features of behaviors of these programs. In this project, we will research automatically collecting and analyzing the run-time data of a parallel program using data mining technology. The analysis will generate a performance model of the program and a prediction of the execution time. This project aims for establishing a systematic modeling method for the parallel programs driven by data processing technologies. A practical and general purpose tool will be implemented to instrumenting and modeling parallel programs. The performance model then will be used for practical problems including program parameters tuning and jobs scheduler optimizing.

对高性能计算机上并行程序的性能进行分析建模,并在建模基础上进行执行时间预测具有重要的研究意义和应用价值,长期受到研究者的关注。并行应用程序的性能受到相当多的因素影响,通常难以达到较为准确的预测。近年来,数据挖掘技术得到快速发展,为发掘数据中潜在的规律提供了有效的方法和工具。并行应用程序在运行过程中可以产生大量可以反映程序的行为特征的数据,包括硬件资源使用情况的数据,以及通过插入特征检测代码所获得的程序运行逻辑数据等。本项目开展利用数据挖掘技术进行程序性能建模和执行时间预测的研究工作,对并行程序运行时的行为特征数据进行自动化收集、分析与筛选,对程序性能进行建模。本项目的目标是建立起系统的数据驱动的并行程序行为特征建模的方法,利用并行程序插桩分析与建模工具,对高性能计算机上并行应用程序的执行时间做出较为准确的预测,并将预测应用于任务调度、程序参数优化选择等实际问题。

项目摘要

对高性能计算机上的并行程序性能进行分析建模,并在建模基础上进行执行时间预测具有重要的研究意义和应用价值,长期受到研究者的关注,具有广泛的应用价值。本项目开展通过数据驱动方法进行并行程序性能建模和执行时间预测的研究工作,对并行程序运行时的行为特征数据进行自动化收集、分析与筛选,对程序性能进行建模。本项目的目标是建立起系统的数据驱动的并行程序行为特征建模的方法,利用并行程序插桩分析与建模工具,对高性能计算机上并行应用程序的执行时间做出较为准确的预测,并将预测应用于任务调度、程序参数优化选择等实际问题。.围绕研究目标,按照研究方案,主要开展了三个方面的研究工作:高效数据收集、数据建模分析、性能模型应用。高效数据收集包括硬件性能计数收集、基于代码插入的特征数据收集、对数据采集方法的评估等。数据建模分析包括数据相关性分析、特征计算开销评估、程序性能模型建立等。性能模型应用包括任务调度系统优化、程序参数配置优化、程序优化指导等。在五个方面取得了主要研究进展:基于骨架程序的并行程序运行时间预测;基于主动学习的高性能计算程序经验性能建模;基于性能模型的高性能计算程序参数优化;基于小规模数据的高性能计算程序性能建模方法;神经网络推理性能模型及其在神经网络剪枝中的应用。.通过四年的研究工作,完成了项目既定的研究目标,在方法理论和关键技术上取得系列成果。公开发布并行程序性能建模与预测研究所使用的实验数据。开源发布研究中所开发使用的程序代码。相关研究结果,已发表学术论文 10篇,包括CCF A类期刊IEEE Transactions on Parallel and Distributed Systems (TPDS)、IEEE Transactions on Computers (TC)和CCF A类会议USENIX Annual Technical Conference (ATC) 2019等。申请国家发明专利6项,其中已授权3项。培养参加项目的博士毕业生2名、硕士毕业生3 名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

特斯拉涡轮机运行性能研究综述

特斯拉涡轮机运行性能研究综述

DOI:10.16507/j.issn.1006-6055.2021.09.006
发表时间:2021

孙广中的其他基金

批准号:60873210
批准年份:2008
资助金额:30.00
项目类别:联合基金项目

相似国自然基金

1

云中并行程序性能分析方法研究

批准号:61372171
批准年份:2013
负责人:徐俊刚
学科分类:F0113
资助金额:80.00
项目类别:面上项目
2

众核处理器结构上的并行程序执行模型

批准号:60970023
批准年份:2009
负责人:安虹
学科分类:F0204
资助金额:32.00
项目类别:面上项目
3

程序并行化及并行程序设计环境研究

批准号:69073345
批准年份:1990
负责人:陈镐缨
学科分类:F0203
资助金额:4.00
项目类别:面上项目
4

数据驱动的预测控制器设计与性能监控

批准号:61074061
批准年份:2010
负责人:李柠
学科分类:F0301
资助金额:35.00
项目类别:面上项目