To fulfil the increasing demand for high performance with low energy consumption (Flops per Watt), processors architecture is evolving towards many-cores. In the future, processors will include tens if not hundreds of cores on a single chip, connected through a network implemented on the chip. Programming models will have to be rethought to cope with such a high level of parallelism. Therefore, programming and producing large scale software become more difficult. Futhermore, the resource management and run-time support for the programming models on many-core chips meet the challenges, because the energy consumption and reliability are same important with performance for multi/many-core systems. This Project will research on the novel programming models and their run-time support techniques for multi/many-core platforms. Mainly, we hope to focus on models for hierarchical parallelism, heterogeneous self-adaptive, and automatical data distribution. At the run-time, some techniques such as dynamic detection and monitor, task stealing scheduling, power consumption management, and code transformation will be investigated and studied.
摩尔定律在众核领域的延伸导致处理器核心的数目越来越多,晶体管的尺寸越来越小,从而不仅使众核架构下的软件生产遭受严重危机,而且也使众核系统的管理面临巨大挑战。软件危机来自于众核编程的困难,而管理挑战源于当前众核系统的能耗和可靠性已经上升到和性能同等重要,甚至更为重要的问题。传统的和最近的并行编程模型要么并非为众核处理器设计而难以解决编程的困难,要么未对能耗和可靠性进行充分考虑。而这些问题许多可以在运行时得到解决。为此,本项目将围绕高可用、高性能和低能耗三个关键问题,开展以下几个方面的研究:研究面向众核典型应用中的并行性与数据分布的内在机理,设计并实现面向众核的编程模型;研究相应的运行时支持,综合考虑性能、能耗和可靠性因素;研究众核平台中体系结构扩展对众核编程模型的支持。项目成果有望对面向众核处理器结构的并行编程模型及其运行时支持技术提供一个较为高效的解决方案。
摩尔定律在众核领域的延伸导致处理器核心的数目越来越多,从而不仅使众核架构下的软件生产遭受严重危机,而且也使众核系统的管理面临巨大挑战。传统的并行编程模型要么并非为众核平台设计而难以解决编程的困难,要么未对能耗和可靠性进行充分考虑。而这些问题许多可以在运行时得到解决。为此,本项目围绕高性能、低能耗、高可用三个关键问题,已开展了如下的研究工作:(1)研究了适配各类众核平台,包括基于CPU的众核平台、GPU平台、CPU+GPU的混合平台等主流平台上的编程模型和高性能任务调度策略。(2)研究了适配GPU平台的程序性能优化指导原则。(3)研究了适配GPU平台的硬件高可用性。(4)研究了适配众核平台的优化资源分配策略、数据访问优化策略、低功耗管理策略等。相关的研究已经取得了重大进展和丰富的成果。在基于CPU的众核平台方面,提出了缓存感知的任务窃取调度策略、负载感知的任务调度策略、能耗感知的任务调度策略、非对称感知的可选择任务调度策略、位置感知的任务调度策略等。基于以上策略,实现了面向众核平台的高性能低功耗任务调度系统。在GPU平台方面,设计探索了并行程序性能优化的指导原则,以及硬件可用性优化机理。使用我们的方法能够提高并行程序高达4.2倍的性能提升,同时我们提出的“同步多任务”技术可提高GPU高达34%的任务吞吐率。在CPU+GPU混合平台方面,我们提出了渐进分析法能够动态地将负载均衡到CPU和GPU上,从而显著减少并行程序42.7%的运行时间。在优化资源分配方面,我们提出并实现自适应的公平资源管理工具,能够周期性地按需进行资源充分配,可显著提高并发运行程序的性能,并降低性能差异。在能耗管理方面,我们通过对内存系统进行数学建模,动态且自适应地选择最佳的低能耗状态和内存电压频率配置,发挥低能耗状态转换技术和动态电压频率调整技术的各自优势,从而实现更好的内存节能效果。项目成果有已对面向众核处理器结构的并行编程模型及其运行时支持技术提供一个较为高效的解决方案。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
内点最大化与冗余点控制的小型无人机遥感图像配准
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
改善众核处理器并行编程的系统性方法
面向动态规划计算的并行编程模型和运行时系统研究
面向众核平台的高能效大规模图并行算法研究
拓展众核有效并行源的微线程式软硬件支持机制