面向深度学习算法的阵列加速器结构设计与负载映射技术研究

基本信息

批准号：61802420

项目类别：青年科学基金项目

资助金额：27.00

负责人：乔寓然

学科分类：

依托单位：中国人民解放军国防科技大学

批准年份：2018

结题年份：2021

起止时间：2019-01-01 - 2021-12-31

项目状态：已结题

项目参与者：杨乾明,沈俊忠,曹壮,黄友,王得光,杭子钧,冯权友,李永进

关键词：

机器学习芯片神经元芯片负载映射阵列加速器

结项摘要

Deep learning is a kind of machine learning method that represents the most advanced level at present, and is very demanding for computing performance. The general purpose processor is restricted by the development of semiconductor technology, and it is gradually unable to meet the needs of deep learning application. The heterogeneous computing system composed of custom hardware accelerators is an important development direction to meet the energy efficiency demand in the future. Systolic array is designed for parallel computing, which is very applicable to the computation involved in the deep learning. However, at present, systolic array based accelerators for deep learning still have the problems of incomplete support for deep learning algorithms and low execution efficiency. This project aims to break through the design limitations of the existing array accelerator for deep learning, and propose the mapping method to run complete deep learning algorithm efficiently on the array accelerator by researching and exploring the hardware structure and load mapping algorithm of the systolic array accelerator. This project will fill the gap of current hardware accelerator in the field of deep learning training, and promote AI technology to provide more efficient services to the related industries.

深度学习是一种代表着当前最先进水平的机器学习方法，对计算性能要求极高。通用体系结构受到工艺水平发展的制约，逐渐无法满足深度学习应用的需求。使用定制硬件加速器所构成的异构计算系统是满足未来计算能效需求的重要发展方向。脉动阵列是一种为并行计算而设计的体系结构，非常适用于处理深度学习算法所涉及的计算。然而目前，面向深度学习的脉动阵列加速器依然存在对深度学习算法支持不完整运行效率较低等问题。本项目拟通过对脉动阵列加速器硬件结构与负载映射算法的研究与探索，突破现有阵列加速器在面向深度学习应用时的设计局限，使完整的深度学习算法可以在阵列加速器上高效运行。本项目研究将会填补当前硬件加速器在深度学习训练领域的空白，促使人工智能技术向社会相关行业提供更为高效的服务。

项目摘要

深度学习是一种代表着当前最先进水平的机器学习方法，对计算性能要求极高。通用体系结构受到工艺水平发展的制约，逐渐无法满足深度学习应用的需求。使用定制硬件加速器所构成的异构计算系统是满足未来计算能效需求的重要发展方向。阵列加速器是一种为并行计算而设计的体系结构，非常适用于处理深度学习算法所涉及的计算。本课题从体系结构设计、算法映射、应用优化、原型平台构建多个角度开展研究工作：设计了一套模板化的深度卷积神经网络加速器体系结构，可以支持各类2D和3D卷积神经网络结构；完成了不同网络结构的运算负载向加速器阵列的高效映射；对片上存储器设计进行了优化，使其面积更小、功耗更低；针对肺癌检测、深度图卷积神经网络两种典型应用进行了加速优化；本本课题还构建了一套由多块FPGA计算节点组成的高性能原型平台，并对多个FPGA计算节点间的通信做了特殊优化。本课在人工智能计算领域做出了一些贡献，可帮助向相关行业提供更为高效的智能计算服务。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.13973/j.cnki.robot.210412

发表时间：2022

DOI：10.12305/j.issn.1001-506x.2022.03.19

发表时间：2022

DOI：DOI 10.3760/cma.j.issn.1007—9408.2018.03.005

发表时间：2018

乔寓然的其他基金

相似国自然基金

深度学习算法可重构加速器关键技术研究

批准号：61303070

批准年份：2013

负责人：姜晶菲

学科分类：F0204

资助金额：23.00

项目类别：青年科学基金项目

面向深度学习的高能效FPGA计算架构及映射方法研究

批准号：61876172

批准年份：2018

负责人：杨海钢

学科分类：F0608

资助金额：62.00

项目类别：面上项目

面向病理图像处理的深度学习算法研究

批准号：11701018

批准年份：2017

负责人：李宏锋

学科分类：A0505

资助金额：19.00

项目类别：青年科学基金项目

面向城市遥感图像分割的深度学习算法研究

批准号：61802380

批准年份：2018

负责人：李海昌

学科分类：F0210

资助金额：25.00

项目类别：青年科学基金项目

面向深度学习算法的阵列加速器结构设计与负载映射技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

新型树启发式搜索算法的机器人路径规划

现代优化理论与应用

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

空中交通延误预测研究综述

四例Jacob sen综合征胎儿的产前诊断

乔寓然的其他基金

相似国自然基金