面向深度学习的高能效FPGA计算架构及映射方法研究

基本信息
批准号:61876172
项目类别:面上项目
资助金额:62.00
负责人:杨海钢
学科分类:
依托单位:中国科学院空天信息创新研究院
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:刘洋,黄志洪,李园强,魏星,毛宁,狄新凯,屈心媛,唐林怀,蔡朋成
关键词:
通用智能处理器现场可编程门阵列低功耗智能芯片高能效计算神经网络处理器
结项摘要

Artificial neural network computing chips include FPGA, CPU and ASIC. It is difficult for CPU to meet processing speed and power dissipation requirements in realizing complex deep neural networks. ASIC has fixed functions and only suits some specific computational applications. However, FPGA can implement all different neural network algorithms by reconfiguration of the hardware circuit structure, yet constrained in performance by the existing redundancy. There are two fundamental problems needed to be resolved in FPGA applications to the deep neural network: (1) The conventional FPGA architecture is logic operation oriented through embedding heterogeneous multiplier cores, to meet fast digital signal processing tasks. For an ultra large volume of convolution operations and multiple layer processing characteristics associated with a given deep neural network, we shall explore how to design highly energy efficient computational circuit structure on FPGA. (2) For targeting the high energy efficient design, we shall find out how to optimally realize algorithm synthesis and physical mapping of FPGA employed to implement the deep neural network. This project aims to study systematically optimal design theory and methodology for deep neural network FPGA. By parametrical modeling and analysis of the computation architecture, the deep neural network can be adapted to different FPGA devices. Hence a highly energy efficient programmable deep neural network processor can be achieved.

人工神经网络计算芯片包括现场可编程门阵列(FPGA)、通用处理器(CPU)和专用处理器(ASIC)等。CPU在实现复杂深度神经网络时难以达到处理速度和功耗的要求;ASIC功能固化,只针对特定计算应用;FPGA通过配置改变硬件电路结构可实现不同神经网络应用,却存在冗余导致的性能瓶颈。FPGA应用于深度神经网络面临的二个主要基本问题需要突破:(1)传统FPGA结构以逻辑运算为导向,通过嵌入异质乘法器专用核,满足快速数字信号处理的要求。针对特定深度神经网络的海量单位卷积运算以及多层处理等特点,如何在FPGA上设计具有高能效特性的计算电路结构。(2)如何围绕高能效的设计目标,解决深度神经网络在FPGA上进行算法综合和物理映射的优化实现。本课题将研究深度神经网络的FPGA 系统性优化设计理论和方法,通过计算架构的参数化建模和分析,能够适配不同FPGA芯片结构,实现高能效可编程深度神经网络处理器。

项目摘要

人工神经网络计算芯片包括现场可编程门阵列(FPGA)、通用处理器(CPU)和专用处理器(ASIC)等。CPU在实现复杂深度神经网络时难以达到处理速度和功耗的要求;ASIC功能固化,只针对特定计算应用;FPGA通过配置改变硬件电路结构可实现不同神经网络应用,却存在冗余导致的性能瓶颈。本课题研究了FPGA应用于深度神经网络面临的二个主要基本问题:(1)传统FPGA结构以逻辑运算为导向,通过嵌入异质乘法器专用核,满足快速数字信号处理的要求。针对特定深度神经网络的海量单位卷积运算以及多层处理等特点,如何在FPGA上设计具有高能效特性的计算电路结构。(2)如何围绕高能效的设计目标, 解决深度神经网络在FPGA上进行算法综合和物理映射的优化实现。本课题探讨了深度神经网络的FPGA系统性优化设计理论和方法,通过计算架构的参数化建模和分析,能够适配不同FPGA芯片结构,设计实现了多种高能效可编程深度神经网络处理器。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020
2

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
3

人工智能技术在矿工不安全行为识别中的融合应用

人工智能技术在矿工不安全行为识别中的融合应用

DOI:10.16265/j.cnki.issn1003-3033.2019.01.002
发表时间:2019
4

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

DOI:
发表时间:2020
5

涡轮叶片厚壁带肋通道流动与传热性能的预测和优化

涡轮叶片厚壁带肋通道流动与传热性能的预测和优化

DOI:10.7652/xjtuxb202112004
发表时间:2021

杨海钢的其他基金

批准号:61271149
批准年份:2012
资助金额:80.00
项目类别:面上项目

相似国自然基金

1

基于FPGA的专用高能效图计算加速研究

批准号:61902375
批准年份:2019
负责人:刘成
学科分类:F0204
资助金额:27.00
项目类别:青年科学基金项目
2

面向非规则计算算法的FPGA逻辑映射优化

批准号:61072135
批准年份:2010
负责人:江先阳
学科分类:F0118
资助金额:28.00
项目类别:面上项目
3

高能效FPGA高层次综合研究

批准号:61404140
批准年份:2014
负责人:林郁
学科分类:F0402
资助金额:26.00
项目类别:青年科学基金项目
4

面向深度神经网络加速的高能效RRAM存内计算芯片技术研究

批准号:61904197
批准年份:2019
负责人:窦春萌
学科分类:F0402
资助金额:23.00
项目类别:青年科学基金项目