针对多介质辐射流体力学问题,结合异构多核千万亿次并行机体系结构多核处理器缓存命中率、指令级并行效率和系统通讯带宽、通讯延迟、问题规模和问题结构等因素,研究异构多核下的并行性能评估数学模型;结合辐射流体力学问题的计算与通讯特征,及异构多核并行机多核之间共享缓存、单核内对同步多线程的支持及单节点内处理核数量多的特点,研究并行性能优化技术;充分发挥多核对数据密集型处理快的特点,研究新的区域分解并行预处理技术;基于降低全局通讯次数,研制适合于异构多核并行机的并行Krylov迭代方法,解决迭代方法并行计算的瓶颈问题;基于GPU-CPU混合编程模式,研制适合于异构多核千万亿次并行机的并行线性代数解法器,使得所研制的方法可扩展到上万个核,并行效率达到30%以上;研究适合于异构多核并行机的混合精度Newton-Krylov子空间迭代方法;将所得成果应用于辐射流体力学实际问题的数值模拟,提高模拟的整体效率。
针对多介质辐射流体力学问题,结合异构多核千万亿次并行机体系结构多核处理器缓存命中率、指令级并行效率和系统通讯带宽、通讯延迟、问题规模和问题结构等因素,研究了异构多核下的并行性能评估数学模型;结合辐射流体力学问题的计算与通讯特征,及异构多核并行机多核之间共享缓存、单核内对同步多线程的支持及单节点内处理核数量多的特点,研究了一系列并行性能优化技术;充分发挥多核对数据密集型处理快的特点,研究了多级区域分解并行预处理技术;基于降低全局通讯次数,研制适合于异构多核并行机的一系列并行Krylov迭代方法,解决迭代方法并行计算的瓶颈问题;基于GPU-CPU混合编程模式,研制适合于异构多核千万亿次并行机的并行线性代数解法器软件包,实现了混合精度Newton-Krylov子空间迭代方法;研制的方法和技术可扩展到12万个核,并行效率达到80%以上,提高了辐射流体力学数值模拟的整体效率。
{{i.achievement_title}}
数据更新时间:2023-05-31
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
特斯拉涡轮机运行性能研究综述
硬件木马:关键问题研究进展及新动向
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
气相色谱-质谱法分析柚木光辐射前后的抽提物成分
面向异构多核并行机的辐射流体力学并行预条件技术
辐射流体力学异构多核大型并行机的可扩展新型算法研究
异构多核并行机上线性代数方程组的快速算法研究
面向千万亿次超级计算机的HLA扩展技术研究