In many domains with high requirments for high performance efficiency, reconfigurable computing is becoming an important approach to overcome traditional computing infrastructure due to outstanding performance. However, as the scale of reconfigurable system is increasing and heterogeneous computing systems is becoming mainstream, some key issues, such as compute model of large scale reconfigurable system, uniform architecture design and management,problems incured by asymmetric units et al., limit reconfiguable computing's progress and application extremely. Emerging stream compute model provide a new progress space for reconfigurable computing due to decoupling computation and load/store,exposing data level parallelism,data regularization,and high predictability. This project introduces stream compute model into reconfigurable computing. We present reconfigurable stream computing theory and technology research on the large-scale asymmetrical system. On the basis of multi-morph reconfigurable compute model and reconfigurable stream architecture template, the reconfigurable system can be quickly constructed for some special application, while hardware-software collaborative management can be used to optimize and improve the real computation efficiency. The research has creativity. It would benefit for developing high efficiency computing platform for high-end digital signal processing, scientific simulation et al.
在众多高效能计算需求领域,可重构技术以其极为卓越的性能而被寄予厚望,成为超越传统计算架构的重要手段。然而,随着可重构系统资源大规模化、异构化的发展趋势,一些关键基础问题,例如大规模可重构系统计算模型、体系结构一体化设计及管理、非对称性难题等等,极大限制了可重构计算的发展和应用。新兴的流计算模型以存储与计算解耦合、计算密集化、数据规则化和高预知性等特点,为可重构计算的发展提供了新的思路。本课题对流计算模型进行创新并引入到可重构计算中,首次提出大规模非对称可重构流计算理论与技术研究,引入了多态可重构计算模型和与之相匹配的可重构流体系结构模板,并基于共有模型和模板对可重构系统进行软硬件协同管理,支持面向应用快速构建和优化可重构平台,提高可重构系统实际计算效能。该项研究具有原创性,对我国发展面向大规模数字信号处理、科学模拟以及其它特殊领域的高效能计算平台具有重要意义。
本项目研究以面向未来纳米级VLSI时代的大规模可重构计算系统为目标,课题进展的四年间,课题组对以下内容进行了深入的研究,圆满完成了研究目标:.1).面向大规模应用的可重构流体系结构计算模型与编程模型研究。.可重构流体系结构计算模型和编程模型的是一个互相促进、螺旋式上升的设计过程。为满足高性能、高能效、高可靠、高实时需求和高的可扩展性,我们选用了cluster on chip的并行计算模型。我们希望借鉴巨型机的并行编程模式,因此我们基于天河1A,天河-2超级计算机,对peta级的应用进行了以并行编程优化为主的研究,对MPI,OpenMP,CUDA,OpenCL等并行编程以及混合编程模型有了深入的理解。在此基础上,提出面向非对称流体系结构的OpenCL+细粒度MPI并行计算模型和编程框架。.2).层次化的可重构流体系结构模板及软硬件协同的非对称流控管理优化技术。.基于统一的流编程环境,我们提出了统一的流体系结构模板。顶层视图由大量可重构运算簇、少量标量核和片上路由组成。每个标量核上运行一个runtime,用来管理各个运算簇;每个运算簇都可以作为标量核的一个设备运行,用于对目标应用的加速;片上网络为标量核和运算簇之间的数据、通信提供实际的物理通道。整个系统的外部存储和IO也通过标量核来控制。结合具体机器视觉应用进行应用领域、并行算法等研究,基于统一的流体系结构模板,结合软硬件协同的非对称流控管理优化技术,我们设计出面向现代深度卷积神经网络(CNN)图像分类应用的加速计算核,以及对应片上存储层次等关键模块。实验结果表明基于可重构流体系结构模板设计的加速器在性能、功耗、面积等指标上都取得了良好的结果。.3).原型系统及工具链的构建。.面向应用的体系结构设计能够大幅提高处理器的能效比,基于cluster on chip的计算模型,我们提出了基于可编程加速器的大规模异构片上集群结构。我们设计了配套原型系统以及工具链,对核心处理器体系结构的基本主键件、全系统性能等进行了充分的验证。.研究形成了一批有价值的创新成果,取得良好的国际国内学术影响。其中发表文章19篇,其中SCI检索10篇,EI检索8篇,出版专著1部,申请专利3项,培养研究生32名。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
拥堵路网交通流均衡分配模型
针灸治疗胃食管反流病的研究进展
卫生系统韧性研究概况及其展望
端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响
大规模MIMO信号处理粗粒度可重构计算方法研究
高效粗粒度可重构阵列计算关键技术研究
基于云计算的城市大规模供水管网系统可重构智能调度方法研究
可重构深度/光流/编码运动矢量估计算法及硬件电路架构研究