粒子物理离线数据处理资源分配与作业管理双层调度算法研究

基本信息
批准号:11475210
项目类别:面上项目
资助金额:92.00
负责人:石京燕
学科分类:
依托单位:中国科学院高能物理研究所
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:陈刚,崔涛,张红梅,郑伟,姚秋玲,阚博文,孙震宇,王聪,李强
关键词:
重建计算计算资源利用率资源分配作业调度算法数据分析离线数据处理模拟计算
结项摘要

Offline data processing software and its computing platform are the important foundation for particle physics experiments to obtain the high quality physical results. The project integrates several computing resources of particle physics experiments, and studies the algorithm of flexible resource allocation and dynamic job scheduling algorithm based on cpu/core. The aim of the algorithm is to improve the resource utilization of particle physics experiment computing platform. The job running time could be reduced and the speed of offline data processing could be accelerated with the help of the algorithm. All of these could help physicist to obtain high quality physics result. Considering the characters of particle physics jobs, the traditional scheduling algorithm would be replaced by a new one. The new one is a double level scheduling algorithm to integrate computing resources of both physical cluster and virtual cluster. "Push" and "Pull" modes were adopted to realize the fine-grain resources allocation and dynamic job scheduling. It could eliminate the computing resources waste and fit jobs request by the most suitable cpu/cores.

离线数据处理软件及其计算平台是粒子物理实验获得高质量物理成果的重要基础。本项目整合多个粒子物理实验的计算资源,研究基于cpu/核的资源弹性分配和作业动态调度的分层调度算法,用以提高粒子物理实验计算平台的资源利用率,减少作业运行时间,加快离线数据处理速度,帮助物理学家获得高质量的物理成果。针对粒子物理计算作业的特点,本项目改变传统的物理机集群调度算法,研究集成物理机集群与虚拟机集群计算资源,统一管理的双层调度算法。调度算法采用"推"、"拉"结合的方式,实现细粒度的资源分配,避免计算资源浪费;并进行动态作业调度,为粒子物理计算作业分配最适合的cpu/核,提高离线数据处理效率。

项目摘要

离线数据处理软件及其计算平台是粒子物理实验获得高质量物理成果的重要基础。本课题分析多个粒子物理实验不同计算类型的运行模式,研究基于cpu/核的资源弹性分配和作业动态调度的分层调度算法,用以提高粒子物理实验计算平台的资源利用率,减少作业运行时间,加快离线数据处理速度,帮助物理学家获得高质量的物理成果。.针对粒子物理计算作业的特点,本课题研究并实现了基于HTCondor的共享资源池调度模式,在保证用户之间,实验之间资源使用公平性的同时,打破实验之间的资源壁垒,使得资源可以被共享使用,以提高HTCondor集群的整体利用率。本课题还针对高通量、高性能集群,物理机、虚拟机的特性,研究双层管理统一调度算法。分析作业的实际需求,通过双层调度为作业分配最适合的计算资源运行,实现细粒度的资源分配,减小作业排队等待时间,还避免计算资源浪费;并进行动态作业调度,为粒子物理计算作业分配最适合的cpu/核,提高离线数据处理效率。根据研究以及高能所计算平台的实际需求,本课题还开发了统一用户作业管理工具,为用户提供便捷的作业管理功能。课题开发的作业调度性能测试工具可以对多种作业系统,多种作业调度算法进行性能测评。.当前本课题的研究成果已经部分应用于高能所计算平台,减少了大量用户排队时间,提高了计算平台的整体资源利用率。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

农超对接模式中利益分配问题研究

农超对接模式中利益分配问题研究

DOI:10.16517/j.cnki.cn12-1034/f.2015.03.030
发表时间:2015
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020

石京燕的其他基金

批准号:11775250
批准年份:2017
资助金额:66.00
项目类别:面上项目

相似国自然基金

1

高能物理离线数据处理虚拟计算资源管理技术研究

批准号:11605223
批准年份:2016
负责人:李海波
学科分类:A2804
资助金额:24.00
项目类别:青年科学基金项目
2

跨域并行作业的资源协同分配和元调度算法研究

批准号:60703024
批准年份:2007
负责人:魏晓辉
学科分类:F0207
资助金额:19.00
项目类别:青年科学基金项目
3

基于资源分配的调度管理研究

批准号:71201085
批准年份:2012
负责人:朱战国
学科分类:G0102
资助金额:22.00
项目类别:青年科学基金项目
4

HTC集群与HPC集群负载融合的二阶作业调度算法和资源管理研究

批准号:11805225
批准年份:2018
负责人:杜然
学科分类:A2806
资助金额:26.00
项目类别:青年科学基金项目