In complex ocean environment, the computation of 3D underwater acoustic propagation can’t provide rapid acoustic field data to surport real-time application, and the parallel algorithm is a predominant technique to improve it’s computational efficiency. For the acoustic application on the performance prediction of sonar system, underwater acoustic signal processing and environment simulation, this project integrate the characteristic of the domestic high-performance computer’s architecture and programming, using the combined theoretical analysis, algorithm design and numerical experimentation method, to develop the key parallel technique of the 3D underwater acoustic propagation, including multilayer scalable parallel algorithm and performance optimization on many-core and collaborative parallel computation on heterogeneous many-core platform. The purpose is to solve the problem of 3D underwater acoustic propagation on calculated speed and requirement of internal memory capacity, which can substantially promote the computational efficiency of the 3D underwater acoustic propagation, and provide technical support for the deep research of the object detection, matched field localization, broadband acoustic propagation and acoustic field reconstruction.
复杂海洋环境下的三维水声传播计算难以为实时应用提供快速的声场数据支持,并行计算是提高其计算效率的有力手段。本项目以声纳探测效能预测、水声信号处理和水声环境仿真等水声应用问题为背景,结合国产高性能异构众核计算平台的体系结构和编程模型特点,采用理论分析、算法设计与数值试验相结合的方法,着力发展考虑辐角耦合影响的三维水声传播多层次可扩展众核并行算法、众核并行性能优化、异构众核协同并行等核心技术,重点解决三维水声传播模型计算速度慢、内存需求大的问题,大幅提升复杂海洋环境下的三维水声传播的计算效率,为目标检测、匹配场定位、宽带声传播、声场反演等问题的深入研究提供技术支撑。
三维水声传播模型的计算时间长、占用存储空间大,给复杂海洋环境中的快速声场分析带来了严峻的挑战。本项目基于异构众核平台,采用理论分析、算法设计与数值试验相结合的方法,发展了三维水声传播高效并行算法。.(1)根据天河二号平台体系结构和编程模型提供的并发机制,发展了三维水声传播任务级、数据级和指令级多层次可扩展并行算法。依据不同任务的同时性将不同计算子集分配给不同的处理器,对三维抛物水声传播模型的核心求解算法进行了高效并行设计,实现了MPI+OpenMP混合并行计算和热点代码的指令级并行优化。算例测试表明,24进程并行效率达到87.5%,24线程并行加速比能达到近6.1,合理配置进程与线程数目能够提升程序性能。.(2)结合第二代MIC架构至强融核处理器KNL体系结构特征,建立了三维水声传播并行性能优化方法和性能模型。通过变换代码来消除循环的相关性,从并行效率、OpenMP库的开销、线程负载均衡、循环调度、线程亲核性等方面分析FOR3D程序在KNL上的OpenMP性能。算例测试表明,FOR3D程序的性能明显地受限于访存带宽,在KNL上获得加速比约20,不包含主线程时的均衡度均在95%以上,内存局部性对程序多线程并行的影响不大。.(3)基于天河二号GPU节点上的Tesla k80卡,实现了三维水声传播计算在主设备和加速设备之间的协同并行。通过对FOR3D程序进行热点分析,建立了面向异构平台的三维水声传播并行计算任务剖分模型,采用OpenACC的parallel和loop构件及其数据管理导语,实现了计算热点的GPU加速。算例测试表明,本项目提出的异构并行方法有效发挥了众核计算能力、隐藏了数据传输,GPU加速比达到2.1。.本项目充分利用了我国在高性能计算领域的技术优势,相关技术方法可为高性能异构并行研究提供借鉴,主要成果可有效提升复杂海洋环境条件下的三维水声传播计算效率,为目标检测、匹配场定位、宽带声传播、声场反演等问题的深入研究提供技术支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
特斯拉涡轮机运行性能研究综述
内点最大化与冗余点控制的小型无人机遥感图像配准
中国参与全球价值链的环境效应分析
异构众核平台CFD高效预条件JFNK并行求解算法及应用
面向众核平台的高能效大规模图并行算法研究
面向高性能异构众核架构的大规模CFD并行算法与应用
面向数十万核以上异构众核平台的CFD领域性能建模与应用