The gradually mature implementation technology and the price reduction of large parallel computer systems, make them become easy accessible computing resources. But the architecture of large parallel computers have become more and more complex, especially for Exascale parallel computers, which are the next milestone and can calculate problems of bigger scale. In fact, high-performance parallel algorithm suitable to Exascale parallel computer is far behind the need of parallel numerical simulation software, and leads to efficient parallel computing software is far behind the development of hardware. The project studies the bottleneck problems of parallel computation of radiation hydrodynamics numerical simulation for the Exascale calculation of large scale parallel computer. It will abide mainly by three ways: (1) introduce the information of architecture of Exascale parallel computers to the design of parallel algorithm of large sparse algebraic system of equations, analysis the convergence of algorithms, and finally result in new scalable parallel algorithms for high efficient radiation hydrodynamics numerical simulation which are suitable to Exascale parallel computers; (2) research on new parallel preconditioning techniques which adapt to Exascale calculation, in order to improve the speed of parallel computing for large sparse algebraic system of equations; (3) combine organically the new algorithms and preconditioning technologies, to solve the Exascale computing problems in radiation hydrodynamics numerical simulation.
大型并行计算机系统实现技术的逐步成熟和价格的降低,使其成为较易获得的计算资源。但目前大型并行计算机的结构越来越复杂,特别是下一个历程碑的E级并行计算机,结构会更复杂,能计算的规模会更大。然而适应E级并行计算机的高效并行算法远远落后于并行数值模拟计算软件的需要,并导致高效并行数值模拟计算软件远远落后于硬件的发展。本项目针对E级计算大型并行计算机,研究影响辐射流体力学数值模拟并行计算的瓶颈问题。主要从三个途径进行研究:(1) 将E级计算的大型并行机体系结构引入到大型稀疏代数方程组并行算法设计中,并对算法进行收敛性分析,最终研究出适合E级大型并行计算机的高效辐射流体力学数值模拟新型可扩展并行算法;(2) 为了提高大型稀疏代数方程组的并行计算速度,研究适应E级计算的新型并行预条件技术;(3)将新型算法和预条件技术进行有机的结合,解决辐射流体力学数值模拟的E级计算问题。
本项目以大规模多介质大变形、物理量突变数值模拟的实际需要为牵引,以E级大型并行计算机的主要特征为根据,开展并行计算方法及其应用研究。由于问题的数值模拟在实际模型计算时间步非常多,为了达到设计要求所能容忍的计算墙上时间,分布在每个计算核上的网格规模非常小,因此算法的通信和访存问题将是E级并行计算机上数值模拟的主要瓶颈问题之一;同时复杂问题的计算时间中90%以上花费在解大型稀疏线性代数方程组,而目前世界上求解此类方程组的主要算法是预处理Krylov子空间迭代法,因此,本课题的重点是解决适应于E级计算机的预处理Krylov子空间算法的稀疏矩阵存储和计算、降低全局通信技术、并行预处理技术等关键瓶颈问题,取得的进展及成果如下:..根据E级计算机的多层次架构特征,在总结和梳理出适合E级计算的并行迭代方法和预处理技术以及存在的问题,出版了两部学术专著。根据存在的问题,项目组开展了CPU-GPU架构上科学工程问题中的大型稀疏矩阵向量乘的性能评估模型研究,给出了相应算法和系数矩阵最优存储方式;通过建立和研究多核CPU的共享内存墙的预估模型,得出稀疏矩阵向量乘的主要瓶颈是访存问题,据此提出了计算与访存重叠算法;通过混合精度预处理迭代算法研究,使得在满足科学工程数值模拟精度要求的情况下,可进一步提高E级大型计算机的计算效率。..E级计算机CPU之间的通信仍然是一个瓶颈问题,以降低全局通信为目的,我们将网络带宽和延迟引入到新的并行算法设计中,提出了具有最优全局归约次数的并行Krylov子空间算法IGCRS2,从理论上分析了该算法的可扩展性,并给出了一些符合理论分析的并行数值实验结果。通过建立CPU-GPU上Krylov子空间方法的性能评估模型,理清了算法设计的关键点;同时,为了避免全局归约计算,我们还提出了多参数多分裂迭代算法,在矩阵性质比较好时,可以代替预处理Krylov子空间算法。..在总结前人工作的基础上,重叠型限制区域分解算法是一种较理想的E级大型计算机上Krylov子空间算法的预处理技术,尤其是重叠型SchurRAS预处理技术。我们基于细致的构造和推导,给出了SchurRAS预处理子的代数形式,并基于代数形式构建了SchurRAS预处理迭代方法的收敛性理论。同时,给出带阻尼因子的RAS预处理技术,为在E级计算机上进行辐射流体力学数值模拟提供了理论保障。
{{i.achievement_title}}
数据更新时间:2023-05-31
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
钢筋混凝土带翼缘剪力墙破坏机理研究
双吸离心泵压力脉动特性数值模拟及试验研究
掘进工作面局部通风风筒悬挂位置的数值模拟
瞬态波位移场计算方法在相控阵声场模拟中的实验验证
流体力学大梯度群的计算方法及应用
流体力学方程组及其计算方法
二维辐射流体力学大变形问题计算方法研究
微分方程物理解的计算方法及其在流体力学中的应用