The real-time synthetic aperture radar (SAR) imaging technique has attracted many interests in military and remote sensing fields. SAR imaging processing has mass data and computations, which presents a huge demand for high performance computing. The newly-developing CPU-GPU heterogeneous system has shown powerful computing potential, and thus how to use the CPU-GPU heterogeneous system to accelerate SAR imaging algorithms is worth studying further. Due to the special executing pattern and complex programming method of CPU-GPU heterogeneous system, it brings tough challenges to optimize and measure SAR imaging algorithms on CPU-GPU heterogeneous system. Therefore, based on the CPU-GPU heterogeneous system platform, this program will research deeply on parallel optimizing and performance measuring techniques of SAR imaging algorithms. The main contents cover the following three aspects: firstly, deeply mining the parallel characters of SAR imaging algorithms based on the performance advantages of the heterogeneous platforms; secondly, studying the synergetic parallel pattern, memory optimizing technique and latency hiding technique of SAR imaging based on the first step; finally, proposing a comprehensive performance metric model, which uniformly measures computing performance and developing overheads. The results of this program will promote the study of the parallel optimizing theory based on heterogeneous systems, and will be significant to accelerate the development and application of high performance SAR imaging technique.
实时合成孔径雷达(SAR)成像技术是当前军事和遥感领域的研究热点。SAR成像处理具有庞大的数据量和运算量,对高性能计算的需求巨大。新型的CPU-GPU异构系统具有强大的计算潜力,如何采用CPU-GPU异构系统加速SAR成像算法是值得深入研究的问题。CPU-GPU异构系统具有特殊的执行模式和复杂的编程方法,对基于该平台的SAR成像算法的并行优化和性能度量提出了严峻挑战。为此,本课题以CPU-GPU异构系统为平台,深入研究SAR成像算法的并行优化和性能度量技术,主要研究内容包括三个方面:首先基于异构平台的性能优势,深入挖掘SAR成像算法的可并行化特征;在此基础上,研究SAR成像算法的协同并行模式、存储优化技术和延迟隐藏技术;最后建立统一度量综合计算性能和开发开销的综合性能度量模型。本项目的研究成果将推动基于异构系统的并行优化理论研究,对于促进高性能SAR成像技术的发展和应用具有重要意义。
本课题以CPU-GPU异构系统为平台,深入研究SAR成像算法的并行优化和性能度量技术,主要研究内容包括以下五个方面:.(1)剖析了异构系统性能感知的SAR成像算法可并行化特征。开发高性能仿真程序的前提是获得算法的可并行化特征以及明确程序的并行优化方向。为此,剖析了该算法在信号级、任务级和数据级三方面的并发性,研究了并行计算平台和高性能仿真程序之间的适用性。.(2)研究了基于算法特征的层次式协同并行模式。以典型SAR成像程序——R-D程序为代表,研究了高性能SAR成像程序的并行模式选择技术,重点针对并行模式框架中的选择并行化区域、确定并行粒度、确定映射层次和确定控制模式等四个关键部分进行了研究。.(3)提出了基于矩阵变换的存储局部性优化技术。首先,建立面向CPU-GPU异构系统的有效访存模型——数据计算矩阵(D&C矩阵),用于描述SAR成像算法中的循环和数组的关系。其次,定义了面向GPU体系结构的重用相关概念。基于以上研究,提出了面向CPU-GPU平台的SAR成像算法局部性优化技术。实验结果表明,论文提出的局部性优化算法能够显著提高片上存储局部性。.(4)提出了面向混合架构的多级延迟隐藏技术。延迟隐藏机制是提高程序性能不可或缺的优化手段。为此,本项目研究了面向CPU-GPU混合架构的SAR成像算法多级延迟隐藏技术,重点研究了访存与计算重叠、通信与计算重叠两类延迟隐藏技术。实验结果证明,经过多级延迟隐藏优化的SAR成像程序具有高速网络带宽利用率。.(5)建立了基于性能开销的综合性能度量模型。随着程序规模和性能需求的增长,如何实施并行优化技术使得应用程序开发同时达到高性能和低开销,成为了并行优化需要考虑的关键问题之一。为此,本项目建立了统一度量开发开销和计算性能的综合性能度量模型。并且开发人员依据该模型,能够更加有效地评价优化程序,指导并行优化技术的设计和改进。
{{i.achievement_title}}
数据更新时间:2023-05-31
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
特斯拉涡轮机运行性能研究综述
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
MSGD: A Novel Matrix Factorization Approach for Large-Scale Collaborative Filtering Recommender Systems on GPUs
栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究
CPU/GPU异构平台下并行保结构算法的研究
异构并行系统上负载感知的新型稀疏算法性能优化研究
基于异构平台的高复杂度生物序列分析算法并行化研究
基于异构众核平台的三维水声传播高效并行算法研究