The development in super computers has led to a recent trend in which computing systems become increasingly heterogeneous. In order to improve the application performance on heterogeneous systems, the performance and stability of communication must be enhanced. Compared to the traditional cluster, the data communication of heterogeneous system includes not only the network communication among nodes, but also the data transmission between different types of memory inside a single node. For large heterogeneous systems, the health status of each node and the usage of the network change in time, so the communication must be optimized according to the dynamic model of the system performance. For application programmers without a professional background of computer science, it is quite difficult to complete such optimization job; and, even after the optimization is completed on one system, the whole thing needs to be reconsidered when dealing with another system cherishing a different architecture. This project researches on the complex communication mode of mass processes/threads on large-scale heterogeneous systems (including GPU accelerated systems, MIC accelerated systems and domestic many-core systems), designs an automatic communication optimization scheme based on new programming language mechanism, solves the problem of data communication/transposition representation and its automatic optimization, enhances the usability of large-scale heterogeneous systems for application programmers, and improves the performance of turbulence simulation and protein simulation as two typical examples.
超级计算机的架构呈现出异构化发展的方向。提升异构系统应用性能的一个重要方面,在于提升应用中通信部分的性能。相对于传统集群,异构系统的数据通信不仅包括节点之间的网络通信,还包括节点内不同类型存储器之间的数据传输;同时,异构系统各个节点的健康状况、网络的使用情况都在时刻发生变化,对通信性能必须针对系统的动态性能模型进行优化。对于非计算机专业背景的应用程序员而言,完成此类优化工作可谓相当困难;而且,即使在一个系统上完成此类优化工作,到另一个体系结构不同的其他系统,往往需要重新考虑此类优化问题。本项目针对大型异构系统(包括GPU加速系统、MIC加速系统和国产众核系统)多进程/线程参与的复杂通信模式,设计基于新型程序语言机制的通信自动优化方案,解决应用程序员在其上进行编程时数据通信和转置的简化表示和自动优化问题,提升大型异构系统对于应用程序员的易用性,应用于直接法湍流模拟和蛋白质模拟示范应用。
本项目分析了现有的针对网络拓扑结构、非平衡到达模式的通信优化技术,对不同类型异构系统进行了充分的性能测试,研究了各种通信并发时相互之间的性能影响模型;基于异构系统数据通信动态拓扑结构的一般性检测方法,研究了复杂通信模式性能的动态优化方法,以及异构系统动态节点筛选和映射优化机制。本项目实现以下研究目标:得到了针对不同类型异构系统的数据通信拓扑结构的动态监测和构建方法;设计实现了包括分布多维转置在内的复杂通信模式的一般性表示方法和对影响系统通信性能因素进行控制的语言描述机制;基于以上技术,针对模拟示范应用进行性能优化并得到较高的性能提升和稳定性提升。目前,已经有中科院过程所、北京大学工学院等单位使用本技术对包括分子动力学模拟、湍流模拟在内的若干应用进行了优化,并在太湖之光系统和江南所E级原型系统进行了测试,平均性能提升10%以上。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
农超对接模式中利益分配问题研究
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
特斯拉涡轮机运行性能研究综述
拥堵路网交通流均衡分配模型
智能认知无线异构网络中协同通信系统的优化
通信竞争异构系统中基于逆向分层的能耗与可靠性联合优化策略及方法
面向异构系统的可扩展的迭代方法并行优化模型及其应用研究
异构动态移动通信网络的延时优化