High performance scientific computing will meet the era of 100 peta-flops. The high efficiency implementation for the widely-used numerical algorithms is essential. This project focuses on such points for a wide range of key applications including weapon physics, fission and fusion energy, electromagnetism environment, nuclear material and energy material, equipment engineering mechanics, climate forecasting, and so on. The researches mainly cover the scientific problems based on the peta-flops results to lighten the well-known parallelism wall, memory wall, power wall, reliability wall, and programmability wall. These problems mainly cover the high efficiency data structure, algorithm computing models and high efficiency programming models, the mapping implementation of algorithm computing models to the computer architecture, run-time performance optimization, and so on. Based on these researches, this project will further develop a software package for the widely-used numerical algorithms. Finally, the research production will be integrated into the well-known JASMIN framework to support the development and verification of ten application software for 100 peta-flops simulation. This project will bulid the research framework and the basic theory for the high efficiency implementation of widely-used numerical algorithm of 100 peta-flops and are essential for the innovation development of scientific computing.
高性能科学计算即将达到每秒十亿亿次,共性算法的高效能实现是其中的重要环节之一。本项目面向武器物理、裂变与聚变能源、电磁环境、核材料与含能材料、重大装备工程力学、全球气候预测等重大应用,针对十亿亿次计算中并行墙、访存墙、功耗墙、可靠墙、编程墙等瓶颈,紧密围绕数学物理方程计算方法和数值算法的共性算法,以千万亿次计算相关研究成果为基础,从高效能数据结构、算法计算模型与高效能编程模型、算法计算模型向高性能计算机体系结构的映射实现、运行时性能优化等四个层次和基于高效能编程模型的共性算法软件包研制等方面,开展十亿亿次高效能实现研究。研究成果集成到JASMIN等框架中,成功支撑十个左右应用软件开展十亿亿次数值模拟验证。项目研究将为科学计算从千万亿次提升到十亿亿次建立高效能实现的研究架构与基础理论,对推动高性能科学计算的创新发展具有重要意义。
本项目面向高性能科学计算中的共性算法,从领域并行编程模型、数据结构与并行算法、重大应用验证与示范等方面,开展了面向十亿亿次计算的高效能实现研究。项目取得主要成果如下:.(1)提出屏蔽并行实现的领域并行编程模型。面向科学与工程计算中普遍存在的结构网格和非结构网格应用,通过对网格数据、并行算法和并行程序的抽象,分别提出网格数据模型、数据并行模型和并行计算构件模型,建立了屏蔽并行实现的领域并行编程模型。基于该模型,建立了并行应用软件研制新流程,支撑批量应用软件以串行编程的方式实现自动并行。.(2)提出一系列十亿亿次高效能实现并行算法与性能优化方法。包括:匹配计算机体系结构的六层嵌套网格数据结构、适应百万CPU核的“联邦—克隆—网格层—网格片”六层嵌套并行算法及相应的“MPI-MPI- MPI-OpenMP-OpenMP-向量”六层嵌套并行实现方法、模式驱动的并行算法、适应异构协同计算的并行算法(含:面向天河二A的通信拓扑映射算法、异构协同数据通信算法和负载平衡算法、粒子输运异构协同算法、间断有限元和SpGEMM众核性能优化方法等),这些算法可支撑共性计算模式到十亿亿次计算机上的高效映射。.(3)重大应用验证与示范。将上述成果集成到JASMIN、JAUMIN和JCOGIN编程框架,支撑武器物理、激光聚变、工程力学、核能开发与利用、电磁环境、材料科学、水利水电等重大应用领域共40多个应用软件从千万亿次提升到亿亿次,多个软件在天河二号上扩展到百万量级异构核,取得一批具有显示度的实际应用大规模模拟结果,包括:支撑我国激光聚变基准靶设计首次实现三维整体模拟、实现真实模型飞机电磁脉冲防护设计80亿网格高精细模拟、支撑航母舰船整体电磁安全性分析在13万自主CPU核上的高精细模拟、支撑国内首次完成三峡大坝51亿自由度整体静力分析、突破商业软件无法胜任的光机装置上亿自由度稳定性分析等。.项目成果获国家技术发明二等奖1项,发明专利6项,发表学术论文54篇,培养研究生15名, 为我国重大应用提供了坚实的高效能实现支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
物联网中区块链技术的应用与挑战
一种改进的多目标正余弦优化算法
瞬态波位移场计算方法在相控阵声场模拟中的实验验证
一种加权距离连续K中心选址问题求解方法
面向100PF级计算机的三类共性算法研究及高效实现
大型科学计算中的并行算法
基于不可压缩流体计算的高效能复预处理算法研究
量子计算算法设计与实现方法研究