未来十年,万亿次量级(Terascale)的嵌入式计算将广泛存在于国防军事、航空航天、安全监控等重大应用领域。在峰值性能提升的同时,人们更加注重实际效率、能耗、可靠性、可用性和实时性等效能指标。然而在纳米级VLSI时代,通过高端计算平台技术下移提升嵌入式计算性能这一传统方式已显现较大的副作用,高端计算平台发展所面临的软件墙、存储墙、频率墙、能耗墙和可靠性墙等难题在嵌入式计算中更为突出。新的嵌入式计算平台必须在计算模型和体系结构等基础问题上取得突破,才能适应万亿次计算的需求。本课题提出面向万亿次量级嵌入式应用的高效能计算模型与体系结构技术研究,其主要思想是以多级动态同步数据流模型为基础,设计并行、访存和通信显式可控的程序模型,并构建与之匹配的高效能核心处理器体系结构,在性能满足单芯片1 Tops以上重大目标应用需求的同时,提升系统的实际效能。
根据项目既定的每秒万亿次量级的高效能嵌入式系统的研究目标,在课题进展的四年间,课题组对以下内容进行了深入的研究,坚持自主创新,圆满完成了研究目标:.1)万亿次嵌入式计算典型应用.应用始终是体系结构设计的驱动力,对一款面向Tflops的高效能嵌入式体系结构就更是如此。我们在众多的应用中,挑选了两个典型万亿次量级的应用:h.264编码和现代大规模卷积神经网络,对它们的算法结构、数据处理粒度、数据访问局域性、数据和控制相关、并行计算模式等关键特征进行深入细致研究,并评估其对性能的影响,用于指导目标体系结构的设计。结合研究目标,我们实现了高质量的并行算法,该算法是体系结构设计的基础。2)面向应用的高效能嵌入式并行计算模型与编程模型.并行计算模型和编程模型的是一个互相促进、螺旋式上升的设计过程。为满足高性能、高能效、高可靠、高实时需求和高的可扩展性,我们选用了cluster on chip的并行计算模型,局部存储、显式通讯,这也是主流趋势之一。基于此,我们希望借鉴巨型机的并行编程模式,从历史上看,技术下移也是计算机发展的一个重要趋势,因此我们基于天河1A,天河2,对peta级的应用进行了以并行编程优化为主的研究,研究和评估面向大规模异构系统的混合编程技术;提出虚拟化设备支持和运行时调度技术来简化编程;提出目标应用和平台相结合的负载划分、延迟隐藏、多层次并行技术来提高性能;在此基础上,提出面向目标体系结构的OpenCL+细粒度MPI并行计算模型和编程框架。.3)高效能核心处理器体系结构.我们提出了基于可编程加速器的大规模异构片上集群结构。以能效为目标,面向h.264和CNN两个万亿次嵌入式计算应用,分别设计了面向指令级并行和数据并行的加速器结构。同时,我们设计了配套原型系统以及工具链,对核心处理器体系结构进行了充分的验证。基于硬件体系结构,我们提出了面向嵌入式应用的任务调度策略,对功耗、性能和容错进行综合管理。以及提出软硬结合的自适应余度容错机制,通过专用硬件来加速错误检测、通过软件配置来平衡性能和容错能力、通过动态检查点设置来加速错误恢复。.研究形成了一批有价值的创新成果,取得良好的国际国内学术影响。其中发表文章34篇,其中SCI检索14篇,EI检索20篇,出版专著1部,申请专利4项,软件著作权1项,并培养了研究生16名,组织国际学术交流20人次,应邀作大会报告1次。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
中国参与全球价值链的环境效应分析
针灸治疗胃食管反流病的研究进展
端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响
面向百万万亿次高性能计算系统的容错计算模型研究
面向千万亿次超级计算机的HLA扩展技术研究
面向重大应用领域的高效能计算优化理论与技术
万亿次并行计算系统性能评价分析优化关键技术