基于FPGA的卷积神经网络加速器被引量：36

FPGA-based Accelerator for Convolutional Neural Network

下载PDF

导出

摘要现有软件实现方案难以满足卷积神经网络对运算性能与功耗的要求。为此,设计一种基于现场可编程门阵列(FPGA)的卷积神经网络加速器。在粗粒度并行层面对卷积运算单元进行并行化加速,并使用流水线实现完整单层运算过程,使单个时钟周期能够完成20次乘累加,从而提升运算效率。针对MNIST手写数字字符识别的实验结果表明,在75 MHz的工作频率下,该加速器可使FPGA峰值运算速度达到0.676 GMAC/s,相较通用CPU平台实现4倍加速,而功耗仅为其2.68%。 Aiming at the problem that existing software implementation schemes of Convolutional Neutral Network （CNN） cannot meet the requirements of computing performance and power consumption,this paper proposes a Field Programmable Gate Array （FPGA）-based accelerator for CNN.The convolution computation unit is paralled accelerated in the coarse-grained paralleled level and the whole process is fully pipelined.This optimization allows 20 multiplyaccumulations to finish in a single cycle,which greatly improves calculation efficiency.Experimental results for MNIST handwritten digits character recoghition show that the proposed FPGA-based accelerator can achieve peak performance of 0.676 GMAC/s under 75 MHz,and be 4 times faster than general CPU platform,while the power consumption is only 2.68percent of it.

作者余子健马德严晓浪沈君成

机构地区浙江大学电气工程学院杭州电子科技大学电子信息学院

出处《计算机工程》 CAS CSCD 北大核心 2017年第1期109-114,119,共7页 Computer Engineering

基金国家"863"计划项目"CMC系列芯片的设计开发与制造"(2012AA041701)

关键词卷积神经网络现场可编程门阵列加速器流水线并行化 accelerator pipeline parallelization

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1马焕芳,赵歆波,邹晓春.基于MapReduce的卷积神经网络算法研究[J].中国体视学与图像分析,2015,20(4):339-346. 被引量：2
2吕刚,郝平,盛建荣.一种改进的深度神经网络在小图像分类中的应用研究[J].计算机应用与软件,2014,31(4):182-184. 被引量：23

二级参考文献26

1Bengio Y, et al. Greedy Layer-Wise Training of Deep Networks [ C ]// NIPS ,2007.
2Arel I,et al. Deep Machine Learning-A New Frontier in Artificial In- telligence Research [ J ]. Computational Intelligence Magazine , IEEE, 2010,5(1) :13 -18.
3Hinton G E ,et al. A Fast Learning Algorithm for Deep Belief Nets[ J]. Neural Computation ,2006,18 : 1527 - 1554.
4Pouhney C, et al. Efficient Learning of Sparse Representations with an Energy-Based Model[ M ]. Presented at the NIPS, New York ,2006.
5Dahl G,et al. Context-Dependent Pre-trained Deep Neural Networks for Large Vocabulary Speech Recognition[ J]. IEEE Transactions on Audi- o, Speech, and Language Processing,2011,20:30 - 42.
6Lti G. Recognition of multi-fontstyle characters based on Convolutional neural network [ C ]//Presented at the Computational Intelligence and Design ( ISCID), HANGZHOU ,2011.
7Ackley H ,et aL A learning algorithm for Boltzmann machines[ J]. Cog- nitive Science, 1985,9 : 147 - 169.
8Hinton G. Training products of experts by minimizing contrastive diver- gence[ J]. Neural Computation ,2002,14 : 1771 - 1800.
9Hardisty E, Resnik P. Gibbs Sampling for the Uninitiated [ M ]. Ber- noulli 4956,2010.
10Bergstra J, et al. Theano : A CPU and GPU Math Expression Compiler [C]//Presented at the the Python for Scientific Computing Confer- ence ,2010.

共引文献23

1马力,王致,张丹,洪永健,王天安.基于深度学习的人脸识别技术在电力巡检机器人中的应用研究[J].自动化与仪器仪表,2019(2):36-38. 被引量：3
2薛皓天,杨晶东,谈凯德.一种改进的BP神经网络在手写体识别上的应用[J].电子科技,2015,28(5):20-23. 被引量：8
3高强,李倩.基于多尺度主线方向特征的DBN分类方法[J].电视技术,2015,39(15):120-124. 被引量：1
4吴建胜,祖旭良,薛涵今.基于特征字符识别的文本图像方向判定[J].计算机工程与设计,2015,36(8):2260-2263. 被引量：5
5姜枫,张丽红.基于随机Dropout卷积神经网络的人体行为识别方法研究[J].测试技术学报,2016,30(1):17-22. 被引量：9
6高荣芳,吉春旭,程国建.从浅层网络到深度网络的图像分类研究综述[J].计算机与数字工程,2016,44(10):2020-2024. 被引量：5
7王金甲,陈浩,刘青玉.大数据下的深度学习研究[J].高技术通讯,2017,27(1):27-37. 被引量：18
8詹武平,郑永煌,王金霞.基于深度神经网络模型的雷达目标识别[J].现代雷达,2018,40(1):16-19. 被引量：11
9李爽,甘兴利,祝瑞辉,李雅宁.场景识别与PnP结合的视觉室内定位技术研究[J].无线电工程,2018,48(8):634-638. 被引量：4
10楚超勤,肖秦琨,高嵩.基于深度学习和动态时间规整的人体运动检索[J].计算机技术与发展,2018,28(6):59-63. 被引量：2

同被引文献137

1朱红,高鸿坚,张明,罗兴,周冬旭.基于噪声预处理的线变识别算法及其FPGA实现[J].电子测量技术,2020(11):142-147. 被引量：1
2万磊,佟鑫,盛明伟,秦洪德,唐松奇.Softmax分类器深度学习图像分类方法应用综述[J].导航与控制,2019,0(6):1-9. 被引量：58
3赖华平,郑链,王克勇,宋承天.神经网络的硬件实现及其在引信中的应用研究[J].测试技术学报,2002,16(z1):711-714. 被引量：1
4郝智泉,王贞松.BP算法的脉动阵列结构在FPGA上的实现[J].计算机工程,2006,32(21):18-21. 被引量：4
5李昂,王沁,李占才,万勇.基于FPGA的神经网络硬件实现方法[J].北京科技大学学报,2007,29(1):90-95. 被引量：20
6崔小乐,陈红英,崔小欣,张兴.一种软硬件协同设计工具原型及其设计描述方法[J].微电子学与计算机,2007,24(6):28-30. 被引量：4
7井小沛,武斌,张青春.基于FPGA的卷积码的编/译码器设计[J].电子测量技术,2008,31(2):116-118. 被引量：11
8陈新永,杨瑞娟,肖玉芬,曾浩.基于FPGA的卷积码Viterbi译码器性能研究[J].现代电子技术,2008,31(7):97-98. 被引量：6
9张智明,张仁杰.神经网络激活函数及其导数的FPGA实现[J].现代电子技术,2008,31(18):139-142. 被引量：13
10李利歌,阎保定,侯忠.基于FPGA的神经网络硬件可重构实现[J].河南科技大学学报（自然科学版）,2009,30(1):37-40. 被引量：7

引证文献36

1王昆,周骅.深度学习中的卷积神经网络系统设计及硬件实现[J].电子技术应用,2018,44(5):56-59. 被引量：7
2杨景明,杜韦江,吴绍坤,李良,魏立新.基于FPGA的BP神经网络硬件实现及改进[J].计算机工程与设计,2018,39(6):1733-1737. 被引量：6
3王开宇,生梦林,韩睿,李伯轩,刘晨阳,申人升.卷积神经网络的FPGA实现及优化[J].实验室科学,2018,21(4):79-84. 被引量：2
4张庭略.基于硬件的神经网络加速[J].通讯世界,2018,0(8):77-79. 被引量：1
5赵晖.一种基于ARIMA的FPGA系统级动态功耗预测建模框架[J].电子设计工程,2018,26(23):147-151.
6任卫欣.基于FPGA的硬件加速系统[J].电子制作,2018,26(23):73-76. 被引量：1
7冯光顺,应三丛.ZYNQ的卷积神经网络硬件加速通用平台设计[J].单片机与嵌入式系统应用,2019,19(3):3-6. 被引量：2
8魏浚峰,王东,山丹.基于FPGA的卷积神经网络加速器设计与实现[J].中国集成电路,2019,28(7):18-22. 被引量：6
9李宗凌,汪路元,禹霁阳,程博文,郝梁,张伟功.基于多并行计算和存储的CNN加速器[J].计算机技术与发展,2019,29(7):11-16. 被引量：1
10李子聪,曾宇航,熊晓明.基于SoC的卷积神经网络系统设计[J].电子测量技术,2019,42(10):126-131. 被引量：6

二级引证文献113

1陈卓,陈羿多,田春生,邱培熠,邸志雄.一种面向ZynqNet硬件加速器的缓存优化结构设计[J].微电子学,2023,53(5):841-845.
2孙立法,易茂祥,刘正文,鲁迎春,梁华国.建筑电气监控L-N总线控制器设计与测试[J].电子测量技术,2023,46(21):100-106. 被引量：1
3杜忠文,李庚霖,蒋菡,褚江恒,伍俊.基于次级缓存的SDRAM调度策略的研究[J].电子测量技术,2023,46(14):37-42. 被引量：1
4程换新,郭占广,刘文翰,张志浩.基于胶囊神经网络的交通标志识别研究[J].电子测量技术,2020(11):112-116. 被引量：3
5王利翔,林珊玲,林志贤,郭太良.基于Zynq平台的图像目标检测系统[J].半导体光电,2023,44(1):147-152.
6刘曜溪,徐志强,黄太一,谷文启,李蕴晖,杜高明.高效高精度车牌识别系统[J].中国科技论文在线精品论文,2020(4):456-464.
7林少丹,洪朝群,陈雨雪.结合胶囊网络和卷积神经网络的目标识别模型[J].电讯技术,2019,59(9):987-994. 被引量：8
8金德发,吕勇,夏润秋,陈青山.基于LabVIEW FPGA的音圈电机神经网络控制方法[J].微特电机,2020,48(5):48-51. 被引量：1
9洪耀球.基于卷积神经网络图像识别的智能电子秤系统[J].景德镇学院学报,2020,35(3):1-4. 被引量：7
10梁盛德,王寻,梁金福.基于卷积神经网络和心电QRS波群的身份识别[J].电子测量与仪器学报,2020,32(4):1-10. 被引量：10

1王娟.口诀在分部积分法求解不定积分中的应用[J].价值工程,2017,36(24):223-224.
2超频的概念及方法[J].电脑,2003(2):56-56.
3胡苏太.微处理器的新发展[J].计算机信息,2000(5):15-16.
4鲁永全.超频实践[J].贵州电力技术,1998,22(2):47-49.
5高素梅.目前中小企业办公自动化系统的开发[J].中国数据通信,2002,4(4):51-54.
6戴忆荫.拔牙心慌慌[J].天天爱学习（一年级）,2017,0(27):17-17.
7心朗,赵秉中.未来微处理机的编译器技术[J].电子计算机,1997(1):10-18.
8陈抗.北汽股份：借助“加速器”驶入快车道[J].浙商,2017,0(18):84-85.
9刘培俊.巧用Delphi开发C／S应用程序[J].新浪潮,1998(4):29-30.
10徐长波,惠恩刚.第四讲使用Delphi开发C／S应用软件[J].中国计算机用户,1996(23):48-50. 被引量：1

计算机工程

2017年第1期

浏览历史

内容加载中请稍等...

基于FPGA的卷积神经网络加速器被引量：36

参考文献2

二级参考文献26

共引文献23

同被引文献137

引证文献36

二级引证文献113

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络加速器 被引量：36

参考文献2

二级参考文献26

共引文献23

同被引文献137

引证文献36

二级引证文献113

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络加速器被引量：36