It is important for the safe and stable running of facilities to perform exhaustive power monitoring in the datacenter, which is also the prerequisite in developing and implementing power management strategies and energy-efficiency techniques. In this project, we target at the fine-grained and intelligent power monitoring problem in datacenters. Based on data-driven approaches, we work on power modeling and estimation at server-level, component-level and application-level, respectively. Specifically, under the condition of lack of advanced power measuring devices, we develop the techniques of non-intrusive power modelling and address the following three challenging issues: i) power modeling and estimation for single servers using aggregated power data, ii) PMC-based component power modeling and estimation, and iii) power modeling and approximation for multiple applications under resource competition scenarios. Furthermore, we establish an integrated experimental platform particularly aiming at fine-grained power monitoring, and apply our solutions for the development of power management and energy-efficiency strategies on the “Tianhe-2” supercomputer. The achievements from this project would take a role as the theoretical foundation for the intelligent power management in large-scale datacenters and high performance computing clusters, as well as the technical support for high-precision, low-cost and easy-to-use power monitoring applications and services.
对数据中心的全方位能耗监测不仅关系到设施设备的安全稳定运行,而且是数据中心能量管理策略和高能效技术评测与实施的前提条件。本课题围绕数据中心能耗监测中面临的精细化和智能化两大需求与挑战,基于数据驱动的方法分别开展针对服务器、服务器部件和应用服务三个级别的能耗建模与预测方法研究。在没有(或无需)细粒度能耗测量设备支持的条件下,提出利用非侵入式的能耗建模手段,解决聚合能耗信息条件下的单服务器节点能耗建模与预测、基于性能监控计数器事件特征的部件能耗建模与预测以及资源竞争条件下的多应用能耗建模与估测等科学问题。在理论研究成果基础上,搭建细粒度能耗监测一体化实验平台,并在“天河二号” 超级计算机高能效管理技术的开发过程中开展应用研究。本项目将为大规模数据中心和高性能计算集群的能量智能化管理提供理论基础,为高精度、低成本、易操作的细粒度能耗监测应用服务提供方法支撑,具有重大的理论意义和应用价值。
对数据中心的全方位能耗监测不仅关系到设施设备的安全稳定运行,而且是数据中心能量管理策略和高能效技术评测与实施的前提条件。本课题围绕数据中心能耗监测中面临的精细化和智能化两大需求与挑战,基于数据驱动的方法分别开展针对服务器、服务器部件和应用服务三个级别的能耗建模与预测方法研究,主要研究成果包括:(1)基于大规模服务器聚合能耗的智能化分解问题,对单个服务器的能耗进行建模分析和预测,主要解决了如何根据聚合能耗信息与服务器自身状态信息构建服务器能耗模型构建的问题,并提出了相关的理论方法;同时针对特定形式的服务器能耗模型,还设计了能耗模型参数的非侵入式训练与获取方法。(2)针对服务器能耗的智能化分解问题,对服务器部件级别的能耗进行建模分析和预测,主要工作包括:根据服务器能耗信息以及在OS层面获取的硬件PMC(性能监控计数器)信息,提出了一种基于PMC的部件能耗模型构建方法;针对特定形式的部件能耗模型,提出了模型参数的非侵入式训练与获取方法。(3)基于服务器能耗的应用能耗估测问题,对物理服务器上所运行应用服务的能耗进行建模分析和预测,主要工作包括:根据多VM在同一物理机上的资源消耗特点,提出了一种合理、公平的应用能耗分配准则;针对提出的能耗分配准则,进一步构建了面向应用服务的物理机能耗分配模型。(4)基于理论研究,在微型数据中心搭建细粒度能耗与状态信息监测平台并进行实验验证,实验结果对理论研究的正确性和有效性进行了印证。本项目将为大规模数据中心和高性能计算集群的能量智能化管理提供理论基础,为高精度、低成本、易操作的细粒度能耗监测应用服务提供方法支撑,具有重要的理论意义和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
低轨卫星通信信道分配策略
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
Wnt 信号通路在非小细胞肺癌中的研究进展
平行图像:图像生成的一个新型理论框架
基于非IT设备虚拟化的主机托管式数据中心能耗管理
绿色数据中心的能耗管理关键问题研究
异构数据中心能耗管理方法研究
非侵入式胎儿心电图多域联合分离提取研究