基于FPGA的卷积神经网络卷积层并行加速结构设计被引量：6

FPGA-based Design of Accelerator for Convolution Layer of Convolutional Neural Network

下载PDF

导出

摘要随着近年来硬件的飞速发展,深度学习又一次成为了研究的热门领域,其中卷积神经网络在多个方面显示了突出的表现.卷积层是卷积神经网络中最重要的组成部分,具有大量乘加计算.针对该特点,提出了流水线式的FPGA卷积层并行加速模块.该电路可以在一个周期内获得一个计算结果.在相同结构和数据集的情况下,FPGA的计算效率分别是CPU,GPU的近7倍和5倍,而功耗只有GPU的28.87%. With the development of hardware, deep learning has been a hot area again, in which Convolutional Neural Network （CNN） shows excellent performance in several aspects. Convolution layer is the most important part of CNN, and has lots of multiplications and additions. For this [eature, a FPGA-based accelerator with pipelineis designed for convolution layer. The designed circuit can compute one result in a single clock cycle. Under the same framework and dataset, FPGA has nearly 7x and 5x computational efficiency of CPU and GPU, and has only 28. 87% power consumption of GPU.

作者陈煌祝永新田犁汪辉封松林 CHEN Huang;ZHU Yong-xin;TIAN Li;WANG Hui;FENG Song-lin(Shanghai Advanced Research Institute,Chinese Academy of Sciences,CIS Lab,Shanghai 201210,China;University of Chinese Academy of Sciences,Beijing 100049,China;ShanghaiTech University,School of Information Science ＆ Technology,Shanghai 201210,China)

机构地区中国科学院上海高等研究院CMOS图像传感器实验室中国科学院大学上海科技大学信息科技与技术学院

出处《微电子学与计算机》 CSCD 北大核心 2018年第10期85-88,共4页 Microelectronics & Computer

基金国家重点研发计划(2017YFA206104) 上海市科学技术委员会科研计划项目(16511108701) 张江管委会公共服务平台项目(2016-14)

关键词卷积神经网络 FPGA 卷积层 convolutional neural network FPGA convolution layer

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(9):2508-2515. 被引量：546
2李施豪,应三丛.基于FPGA的卷积神经网络浮点激励函数实现[J].微电子学与计算机,2017,34(10):105-109. 被引量：10

二级参考文献69

1LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning applied to document recognition [J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.
2HINTON G E, OSINDERO S, TEH Y W. A fast learning algorithm for deep belief nets [J]. Neural Computation, 2006, 18(7): 1527-1554.
3LEE H, GROSSE R, RANGANATH R, et al. Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations [C]// ICML '09: Proceedings of the 26th Annual International Conference on Machine Learning. New York: ACM, 2009: 609-616.
4HUANG G B, LEE H, ERIK G. Learning hierarchical representations for face verification with convolutional deep belief networks [C]// CVPR '12: Proceedings of the 2012 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2012: 2518-2525.
5KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks [C]// Proceedings of Advances in Neural Information Processing Systems. Cambridge, MA: MIT Press, 2012: 1106-1114.
6GIRSHICK R, DONAHUE J, DARRELL T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation [C]// Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2014: 580-587.
7LONG J, SHELHAMER E, DARRELL T. Fully convolutional networks for semantic segmentation [C]// Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2015: 3431-3440.
8SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition [EB/OL]. [2015-11-04]. http://www.robots.ox.ac.uk:5000/~vgg/publications/2015/Simonyan15/simonyan15.pdf.
9SZEGEDY C, LIU W, JIA Y, et al. Going deeper with convolutions [C]// Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2015: 1-8.
10HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition [EB/OL]. [2016-01-04]. https://www.researchgate.net/publication/286512696_Deep_Residual_Learning_for_Image_Recognition.

共引文献552

1侯帅鹏,石英,华逸伦,苏涛.基于改进SSD的行人检测模型[J].武汉理工大学学报,2019,41(7):95-102. 被引量：1
2苟玉晓,江永全,杨燕,周冠禄,林凯.基于全卷积神经网络的公交专用道识别[J].计算机应用研究,2020,37(S01):406-407.
3杨颖.基于MobileNet-SSD的蝶类昆虫识别算法[J].智能计算机与应用,2021,11(4):156-158. 被引量：2
4雷慧静.卷积神经网络综述[J].中国科技纵横,2018,0(16):44-47. 被引量：1
5张玮,张华熊.基于卷积神经网络的纺织面料主成分分类[J].浙江理工大学学报（自然科学版）,2019,41(1):1-8. 被引量：7
6徐思,孙仁诚.结合聚类的半监督分类方法[J].青岛大学学报（自然科学版）,2018,31(4):49-53. 被引量：2
7李辉,钟平,戴玉静,吕东辉.基于深度学习的输电线路锈蚀检测方法的研究[J].电子测量技术,2018,41(22):54-59. 被引量：19
8曾平平,李林升.基于卷积神经网络的水果图像分类识别研究[J].机械设计与研究,2019,35(1):23-26. 被引量：36
9蒋承知,于起,叶文强,甘凇元.卷积神经网络算法的比较探究[J].电子技术与软件工程,2017(7):78-80. 被引量：7
10梁锐,朱清新,廖淑娇,牛新征.基于多特征融合的深度视频自然语言描述方法[J].计算机应用,2017,37(4):1179-1184. 被引量：6

同被引文献36

1牛斌凯,雍少为,张建,陈亮.基于System Generator开发数字信号处理系统[J].舰船电子工程,2010,30(1):129-132. 被引量：12
2孙延腾,吴艳霞,顾国昌.基于VHDL语言的参数化设计方法[J].计算机工程与应用,2010,46(31):68-71. 被引量：9
3甘学温,莫邦燹.低功耗CMOS逻辑电路设计综述[J].微电子学,2000,30(4):263-267. 被引量：13
4安晶,艾萍,徐森,刘聪,夏建生,刘大琨.一种基于一维卷积神经网络的旋转机械智能故障诊断方法[J].南京大学学报（自然科学版）,2019,55(1):133-142. 被引量：28
5刘进锋.一种简洁高效的加速卷积神经网络的方法[J].科学技术与工程,2014,22(33):240-244. 被引量：16
6李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(9):2508-2515. 被引量：546
7常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312. 被引量：419
8李施豪,应三丛.基于FPGA的卷积神经网络浮点激励函数实现[J].微电子学与计算机,2017,34(10):105-109. 被引量：10
9李德利,张曦煌.基于并行学习的多层极限学习机[J].计算机应用研究,2018,35(2):459-461. 被引量：7
10张军阳,郭阳,扈啸.二维矩阵卷积的并行计算方法[J].浙江大学学报（工学版）,2018,52(3):515-523. 被引量：7

引证文献6

1赵玉琳,王东辉,王雷欧.卷积神经网络卷积层的FPGA实现[J].网络新媒体技术,2021(1):47-50. 被引量：2
2蒋佩卿,吴丽君.基于FPGA的改进二值化卷积层设计[J].电气开关,2019,57(6):8-13. 被引量：2
3周瑾,薛玉群,詹毅,蒋见花.一种语音编码算法的高吞吐率实现[J].微电子学与计算机,2020,37(3):9-13.
4安国臣,袁宏拓,韩秀璐,王晓君,侯雨佳.基于FPGA的通用卷积层IP核设计[J].河北科技大学学报,2021,42(3):241-247. 被引量：3
5王凤领,王涵,赵方珍,薛亮.非关系型大数据层间并行访问权限控制仿真[J].计算机仿真,2022,39(11):496-500. 被引量：1
6成鸿群,刘宜成,涂海燕,徐金鹏,王广泰.基于System Generator的卷积加速结构设计与实现[J].计算机应用与软件,2024,41(4):224-227.

二级引证文献8

1安国臣,袁宏拓,韩秀璐,王晓君,侯雨佳.基于FPGA的通用卷积层IP核设计[J].河北科技大学学报,2021,42(3):241-247. 被引量：3
2蔡晓军,栾峻峰,申兆岩,赵梦莹,于东晓,李永明,贾智平.面向冯·诺依曼计算机的指令执行虚拟仿真设计与探讨[J].实验技术与管理,2022,39(5):89-93. 被引量：4
3任勇峰,尚辰阳.FPGA千兆以太网接口的IP核设计[J].单片机与嵌入式系统应用,2022,22(11):49-53. 被引量：1
4徐胜,文丰.基于FPGA的UART自适应接收IP核设计[J].单片机与嵌入式系统应用,2023,23(11):14-16.
5余华东.无线传感网络中大数据访问安全等级盲检测[J].辽宁科技学院学报,2023,25(5):39-42.
6陈扬,周江,虞凌云.基于LSTM的电炉控制器多语言文本数据预处理研究[J].工业加热,2023,52(12):34-37.
7方子卿,林瑞全,孙小坚.基于FPGA的CNN分类器设计[J].电气开关,2024,62(1):64-68.
8张灿宇,封岸松,张华良,易星,王俊彭.基于FPGA的图像处理硬件加速系统的设计[J].计算机工程与设计,2024,45(3):723-731.

1杨维科,贺光辉,景乃锋.基于Rocket-Chip开源处理器的CNN加速模块的设计及实现[J].微电子学与计算机,2018,35(4):17-21. 被引量：6
2韩国重离子加速器前端超导加速试验取得成功[J].航天器工程,2018,27(2):138-139.
3华为再度彰显科技创新品牌硬实力获多项“天翼展”大奖[J].通信世界,2018,0(26):58-58.
4张翼,宾光宇,吴水才.一种可穿戴式多参数心脏活动监测设备的设计[J].中国医疗设备,2018,33(3):18-21. 被引量：7
5许牡丹.一种缓存加速设备技术研究[J].城市建设理论研究（电子版）,2018,8(12):181-181.
6陈涵,顾锋.众筹筹资效果的影响因素分析——基于众筹网的实证研究[J].上海管理科学,2018,40(5):1-5.
7王芳,顾松龄.关于医疗器械领域投资细分方向等的思考与建议[J].华东科技,2018(9):66-68. 被引量：1
8张航.基于语料库的财经新闻英汉文本特征分析[J].安阳师范学院学报,2018(4):98-103.

微电子学与计算机

2018年第10期

浏览历史

内容加载中请稍等...

基于FPGA的卷积神经网络卷积层并行加速结构设计被引量：6

参考文献2

二级参考文献69

共引文献552

同被引文献36

引证文献6

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络卷积层并行加速结构设计 被引量：6

参考文献2

二级参考文献69

共引文献552

同被引文献36

引证文献6

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络卷积层并行加速结构设计被引量：6