基于3D-cube结构的卷积神经网络硬件加速

Hardware acceleration of convolutional neural network based on 3 D-cube structure

下载PDF

导出

摘要传统的卷积神经网络需要大量的运算单元和繁琐的数据存取,导致计算速度较慢,效率不高.本文设计了全新的数据块结构以充分利用数据复用,大大减少数据读取次数,并且全面调用FPGA的并行运算资源,同时进行多个乘加操作,实现了高效并行卷积计算电路.将权重和偏置参数分别融合、最优化量化,减少了内存占用.通过以VGG16作为测试网络,在识别Imagenet数据集时,精度仅损失了0.02%,在200 MHz的情况下,吞吐率达到了129.6 GOPS,功耗仅为5.26 W. Traditional convolutional neural network requires a large number of computing units and too much data access,resulting in slow calculation speed and low efficiency.A new data block structure is designed to make full use of data multiplexing»greatly reducing the number of data reading and fully calling the parallel computing resources of the FPGA.In this way,multiple multiplication and addition operations are carried out simultaneously,to realize an efficient parallel convolution calculation circuit.The weight and bias parameters are separately fused,optimized and quantized to reduce memory usage.By using VGG16 as the test network,when identifying the Imagenet data set,the accuracy was only lost by 0.02%.In the case of 200 MHz,the throughput rate reached 129.6 GOPS and the power consumption was only 5.26W.

作者隋远峰常亮赵思濛常玉春 SUI Yuanfeng;CHANG Liang;ZHAO Simeng;CHANG Yuchun(School of Microelectronics,Dalian University of Technology,Dalian 116100,Liaoning,China;The Thirty Second Research Institute,China Electronics Technology Group Corporation,Shanghai 201808,China)

机构地区大连理工大学微电子学院中国电子科技集团公司第三十二研究所

出处《微电子学与计算机》 2021年第8期34-39,共6页 Microelectronics & Computer

基金国家自然科学基金项目(11975066,61801450) 中央高校基本科研基金(DUT20RC(3)058)。

关键词卷积神经网络数据复用 FPGA 参数量化 convolutional neural network data reuse FPGA parameter quantization

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

1张坤宁,赵烁,孙庆斌,邓宁,何虎.基于FPGA的多核可扩展卷积加速器设计[J].计算机工程与设计,2021,42(6):1592-1598. 被引量：1
2张章,李超,韩婷婷,许傲,程心,刘钢,解光军.基于忆阻器的感存算一体技术综述[J].电子与信息学报,2021,43(6):1498-1509. 被引量：4
3范丽.“互联网+”时代数字档案管理的途径[J].办公室业务,2021(14):162-164.
4刘永强,宋述停,王强.电力科技项目全过程数据处理系统研究[J].自动化技术与应用,2021,40(7):161-163.
5曹洁,魏然,彭春雪,顾婕,许传亮.基于分光测色仪测量法的膀胱冲洗液比色卡研制[J].护理学报,2021,28(14):60-63. 被引量：2
6李欣瑶,刘飞阳,文鹏程,李鹏.卷积神经网络的软硬件协同加速技术[J].航空兵器,2021,28(3):99-104. 被引量：6
7高浩阳,张晓瀛,赵海涛,王玲,魏急波.受限多普勒功率谱建模方法研究[J].信号处理,2021,37(7):1217-1225. 被引量：1
8孙占锋,包空军.人工智能大数据信用风险区集中化检测系统设计[J].现代电子技术,2021,44(15):39-43. 被引量：2

微电子学与计算机

2021年第8期

浏览历史

内容加载中请稍等...

基于3D-cube结构的卷积神经网络硬件加速

相关作者

相关机构

相关主题

浏览历史