高性能计算已深入我国若干重大应用领域,发挥重要作用,实际应用日趋复杂。在此需求牵引下,计算机快速发展,处理器核数逼近十万,峰值性能达到千万亿次,体系结构日趋复杂。受限于此双重复杂性,计算机实用效能和峰值性能的差距日趋明显,制约高性能计算的发展。本项目面向武器物理、激光聚变和全球气候变化,依托数百万亿次计算机,立足数值模拟应用软件,研究提升计算机实用效能的优化理论和技术,并进行典型示范。主要研究内容包括:适应于复杂应用和计算机复杂体系结构的面向对象数据结构和与之相适应的并行计算模型;提升数据结构和模型可用性的使能技术:非规则数据通信算法和动态负载平衡方法;适应数千至数万核的高效数值并行算法;浮点性能优化方法;屏蔽并行计算细节的新型并行编程模型;七个以上应用软件的典型示范。项目成果将为大幅提升应用软件计算效率并缩短其研制周期奠定坚实的理论基础,对促进我国重大应用领域的高效能计算具有重要意义。
项目面向核武器物理、惯性约束聚变、全球气候变化地球系统模式等领域的数值模拟应用,通过六层嵌套网格剖分数据结构和访存优化,数据通信—动态负载平衡—快速数值并行算法、分离并行计算的构件化编程模型及接口等方面的创新研究,突破了千万亿次 “性能墙”和“编程墙”的两大瓶颈,实现了100倍能力提升,成效显著。. 1、提出了适应于计算机六层体系结构“系统—结点—CPU—核—部件—向量化”的六层嵌套数据结构“网格层—网格区—网格域—网格片—网格点—数据片”,提出了适应于多物理耦合、相空间多群耦合、空间二层嵌套区域分解的“联邦—克隆—网格层—网格片”四层嵌套的数据通信并行算法、动态负载平衡方法和并行编程实现技术,支撑若干应用软件具备可扩展到数千至数万个处理器核的并行计算性能。. 2、提出了适应于数千上万处理器核的系列快速数值并行算法,包括并行结构网格自适应加密算法(SAMR)、并行代数多重网格算法(PAMG)等,将若干典型应用软件的计算能力提升了数百上千倍。. 3、凝练了18类并行计算模式,提出了构件化并行编程模型,可支持物理、力学、数学等应用领域专家无需了解高性能特征和并行实现细节,便可快速研发并行应用软件,显著缩短研发周期。. 4、针对稠密矩阵乘、稀疏矩阵向量乘、字符串序列比对等计算核心,提出了系列性能优化方法,其中,稠密矩阵乘的计算效率达到单Femi GPU峰值性能的80%,稀疏矩阵向量乘的浮点性能是Intel MKL数学库的3倍以上。. 5、完成了激光聚变辐射流体力学、辐射和中子输运、激光等离子体相互作用、流体界面不稳定性、三维分子动力学等领域七个典型应用软件在数千至数万个处理器核上的验证,3个软件数万核并行效率达到30%。. 项目组出版专著1部,发表论文52篇,其中,在IEEE Trans. on Parallel and Distributed Systems、Journal of Computational Physics等国际高水平期刊上发表SCI论文16篇。. 项目组莫则尧研究员获2014年国家科技进步奖特等奖1项(排名3),获中国科协“求是”杰出青年奖(实用工程奖)和“冯康”科学计算奖,获国家百千万人才工程、有“突出贡献中青年专家”荣誉称号,入选首批国家万人计划,同时获得中国工程物理研究院杰出专家学术荣誉称号。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
智能煤矿建设路线与工程实践
二维FM系统的同时故障检测与控制
药食兼用真菌蛹虫草的液体发酵培养条件优化
扶贫资源输入对贫困地区分配公平的影响
面向万亿次量级嵌入式应用的高效能计算模型与体系结构技术
面向C4KISR重大应用领域软件可信性需求分析方法与攻击性实验验证环境研究
面向E级计算的高效能片上光交换单元
面向移动计算的能耗优化技术研究