分子动力学(简称MD)是分子模拟的一类基本方法,是研究微观机理的一种有效手段。MD模拟计算强度大,集群并行可提高MD模拟的粒子规模和时间尺度,但仍不能满足实际需要。提高单一计算节点MD程序可模拟的粒子规模是缩小MD模拟能力与实际过程间差距的关键,提高MD粒子规模要应对的不仅是巨大的计算量、还有大规模数据对存取空间及效率的挑战;GPU为解决该问题提供了全新的机会。本项目拟面向MD模拟中粒子规模在数十万到百万级的应用,针对单节点GPU,探索将MD模拟的计算任务映射为大规模GPU线程以应对MD巨大计算量的策略、及GPU多层次存储器有效存取大规模数据的策略;通过优化其大规模线程组织和大规模数据的存取策略、结合计算任务在CPU和GPU之间的分解与协同,解决MD模拟粒子规模受限的问题。研究结果可拓宽PC上MD模拟可应用的范围,提升GPU集群MD程序的性能,有助于改变分子模拟计算主要依赖国外工具的现状。
分子动力学(简称MD)是分子模拟的一类基本方法,它基于经典力学计算每个时间步(步长为~1fs)模拟体系中原子之间的相互作用、以及原子位置、速度的变化,通过对时间步循环考察模拟体系随时间的演变过程。规模为数十万乃至百万原子的大规模体系对应的空间尺度为nm级,时间步长为1fs、循环1,000,000步对应的时间尺度为1ns,常用ns/day来衡量MD模拟的计算性能。目前MD可计算的时空尺度与实际物理过程差别甚大,因此MD是典型的高性能计算问题。集群/超级计算机并行可提高MD模拟的时空尺度,但因投入和运行成本高昂,还难以成为日常计算平台。提高单节点MD程序的计算性能是缩小MD模拟能力限制的关键。GPU(Graphic Processing Unit)因其突出的理论计算峰值和带宽,为解决该问题提供了全新机会。.本项目提出了基于GPU加速MD程序的整体策略,研究了MD计算最耗时的非键作用、以及组成MD模拟循环其他不可缺少模块的GPU并行算法及其优化方法,建立了具有自主知识产权、基于单节点GPU并行的MD程序GMD(单卡)和MGMD(多卡),可计算规模和性能获得显著提升,GMD在C2050单GPU卡上可计算规模为100万粒子的聚乙烯(PE)体系。采用国际知名的MD程序GROMACS 4.6.3版(2013年发布)作为测试基准,对含36万个粒子的大规模PE体系测试结果表明,若GROMACS每10步计算一次能量,GMD的计算性能(单卡)是GROMACS GPU的80%,单节点4 GPU卡上的性能是GROMACS GPU版的1.2倍。若GROMACS每步计算一次能量,GMD单卡计算性能是GROMACS八核CPU性能的2.0倍,是其GPU版本1.7倍,4 GPU卡计算性能是GROMACS的2.4倍。GMD已应用于大规模聚乙烯体系结晶过程的模拟,为获得小规模体系模拟难以获得的PE结晶机理新认识发挥了关键作用。在与国际上实力雄厚的主流MD软件研制者飞速发展其GPU版本的竞争中,单GPU卡的GMD计算性能与国际主流MD软件系统的GPU最新版本接近,单节点4 GPU卡的MGMD程序应用于大规模聚乙烯体系结晶过程的计算效率略优于国际领先的GROMACS程序。研究结果表明桌面机+GPU是适合大多数研究人员、性价比合理的模拟应用平台。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
MSGD: A Novel Matrix Factorization Approach for Large-Scale Collaborative Filtering Recommender Systems on GPUs
钢筋混凝土带翼缘剪力墙破坏机理研究
五轴联动机床几何误差一次装卡测量方法
利用GPU实现大规模复杂体系反应分子动力学模拟的方法
复杂气固流动的颗粒团离散模型及基于GPU的大规模模拟
材料界面力学行为的大规模分子动力学模拟研究
面向长程大规模分子动力学模拟的快速多极子算法研究