基于FPGA的卷积神经网络并行加速器设计被引量：4

Parallel accelerator design for convolutional neural networks based on FPGA

下载PDF

导出

摘要近年来,卷积神经网络在许多领域中发挥着越来越重要的作用,然而功耗和速度是限制其应用的主要因素。为了克服其限制因素,设计一种基于FPGA平台的卷积神经网络并行加速器,以Ultra96-V2为实验开发平台,而且卷积神经网络计算IP核的设计实现采用了高级设计综合工具,使用Vivado开发工具完成了基于FPGA的卷积神经网络加速器系统设计实现。通过对GPU和CPU识别率的对比实验,基于FPGA优化设计的卷积神经网络处理一张图片的时间比CPU要少得多,相比GPU功耗减少30倍以上,显示了基于FPGA加速器设计的性能和功耗优势,验证了该方法的有效性。 In recent years,convolutional neural network plays an increasingly important role in many fields.However,power consumption and speed are the main factors limiting its application.In order to overcome its limitations,a convolutional neural network parallel accelerator based on FPGA platform is designed.Ultra96-v2 is used as the experimental development platform,and the design and implementation of convolutional neural network computing IP core adopts advanced design synthesis tools.The design and implementation of convolutional neural network accelerator system based on FPGA is completed by using vivado development tools.By comparing the recognition rate of GPU and CPU,the convolutional neural network based on FPGA optimized design takes much less time to process a picture than CPU,and reduces the power consumption of GPU by more than 30 times.It shows the performance and power consumption advantages of FPGA accelerator design,and verifies the effectiveness of this method.

作者王婷陈斌岳张福海 Wang Ting;Chen Binyue;Zhang Fuhai(College of Electronic Information and Optical Engineering,Nankai University,Tianjin 300350,China)

机构地区南开大学电子信息与光学工程学院

出处《电子技术应用》 2021年第2期81-84,共4页 Application of Electronic Technique

关键词并行计算卷积神经网络加速器流水线 parallel computing convolutional neural network accelerator pipeline

分类号 TN402 [电子电信—微电子学与固体电子学]

引文网络
相关文献

参考文献2

1余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：610
2吴艳霞,梁楷,刘颖,崔慧敏.深度学习FPGA加速器的进展与趋势[J].计算机学报,2019,42(11):2461-2480. 被引量：58

二级参考文献14

1MarkoffJ. How many computers to identify a cat?[NJ The New York Times, 2012-06-25.
2MarkoffJ. Scientists see promise in deep-learning programs[NJ. The New York Times, 2012-11-23.
3李彦宏.2012百度年会主题报告:相信技术的力量[R].北京:百度,2013.
410 Breakthrough Technologies 2013[N]. MIT Technology Review, 2013-04-23.
5Rumelhart D, Hinton G, Williams R. Learning representations by back-propagating errors[J]. Nature. 1986, 323(6088): 533-536.
6Hinton G, Salakhutdinov R. Reducing the dimensionality of data with neural networks[J]. Science. 2006, 313(504). Doi: 10. 1l26/science. 1127647.
7Dahl G. Yu Dong, Deng u, et a1. Context-dependent pre?trained deep neural networks for large vocabulary speech recognition[J]. IEEE Trans on Audio, Speech, and Language Processing. 2012, 20 (1): 30-42.
8Jaitly N. Nguyen P, Nguyen A, et a1. Application of pretrained deep neural networks to large vocabulary speech recognition[CJ //Proc of Interspeech , Grenoble, France: International Speech Communication Association, 2012.
9LeCun y, Boser B, DenkerJ S. et a1. Backpropagation applied to handwritten zip code recognition[J]. Neural Computation, 1989, I: 541-551.
10Large Scale Visual Recognition Challenge 2012 (ILSVRC2012)[OLJ.[2013-08-01J. http://www. image?net.org/challenges/LSVRC/2012/.

共引文献666

1贾彦哲.论人工智能研发者过失犯的注意义务[J].华中师范大学研究生学报,2020(2):40-46.
2毕思文,Henri Jaffrès,Chandra Sekhar Roychoudhuri.量子遥感发展新态势——世界首次量子遥感国际会议评述[J].全球变化数据学报（中英文）,2019,3(4):317-325. 被引量：1
3范敏,胥小波,聂小明.基于字符级扩张卷积网络的Web攻击检测方法[J].计算机应用研究,2020,37(S02):234-237. 被引量：4
4孟威,尉永清,刘文锋.基于CRT机制混合神经网络的特定目标情感分析[J].计算机应用研究,2020,37(2):360-364. 被引量：1
5华夏,王新晴,马昭烨,王东,邵发明.基于递归神经网络的视频多目标检测技术[J].计算机应用研究,2020,37(2):615-620. 被引量：8
6刘树霄,衣立,张苏平,时晓曚,薛允传.基于全卷积神经网络方法的日间黄海海雾卫星反演研究[J].海洋湖沼通报,2019(6):13-22. 被引量：11
7杜忠文,李庚霖,蒋菡,褚江恒,伍俊.基于次级缓存的SDRAM调度策略的研究[J].电子测量技术,2023,46(14):37-42. 被引量：1
8王海涛.自主无人系统——概念、体系架构和设计要素[J].电信快报,2021(5):6-9.
9郭龙银,扎西多吉,尚慧杰,旦增.基于LSTM的藏语语音识别[J].电脑知识与技术,2020,0(4):154-155. 被引量：2
10李佳意,董万鹏,任梦,张吉超,弓成美琪.新时代计算机智能制造模式的研究进展[J].智能计算机与应用,2021,11(3):98-105. 被引量：1

同被引文献32

1孙延腾,吴艳霞,顾国昌.基于VHDL语言的参数化设计方法[J].计算机工程与应用,2010,46(31):68-71. 被引量：9
2谭曼琼,徐成,刘彦.位串行SVD处理器的设计[J].小型微型计算机系统,2012,33(6):1358-1362. 被引量：2
3安晶,艾萍,徐森,刘聪,夏建生,刘大琨.一种基于一维卷积神经网络的旋转机械智能故障诊断方法[J].南京大学学报（自然科学版）,2019,55(1):133-142. 被引量：28
4李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(9):2508-2515. 被引量：557
5常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312. 被引量：426
6仇越,马文涛,柴志雷.一种基于FPGA的卷积神经网络加速器设计与实现[J].微电子学与计算机,2018,35(8):68-72. 被引量：11
7屈家丽,贺光辉,王国兴.语音识别中卷积神经网络的FPGA实现[J].微电子学与计算机,2018,35(9):37-41. 被引量：6
8刘志成,祝永新,汪辉,田犁,封松林.基于FPGA的卷积神经网络并行加速结构设计[J].微电子学与计算机,2018,35(10):80-84. 被引量：9
9陈煌,祝永新,田犁,汪辉,封松林.基于FPGA的卷积神经网络卷积层并行加速结构设计[J].微电子学与计算机,2018,35(10):85-88. 被引量：6
10黄佼,宾光宇,吴水才.基于一维卷积神经网络的患者特异性心拍分类方法研究[J].中国医疗设备,2018,33(3):11-14. 被引量：6

引证文献4

1安国臣,袁宏拓,韩秀璐,王晓君,侯雨佳.基于FPGA的通用卷积层IP核设计[J].河北科技大学学报,2021,42(3):241-247. 被引量：3
2郭金贵.A*算法的FPGA实现[J].科学技术创新,2021(30):17-19.
3郝一帆,支天,杜子东.基于位串行计算的动态精度神经网络处理器[J].高技术通讯,2022,32(9):881-893.
4刘晛,吴瑞琦,高尚尚,刘泽浩,刘海波,孔祥晔,王庆,郭乃宏,周锋,王如刚.基于ZYNQ的通用型卷积神经网络设计与实现[J].电子器件,2023,46(1):121-125. 被引量：2

二级引证文献5

1蔡晓军,栾峻峰,申兆岩,赵梦莹,于东晓,李永明,贾智平.面向冯·诺依曼计算机的指令执行虚拟仿真设计与探讨[J].实验技术与管理,2022,39(5):89-93. 被引量：4
2任勇峰,尚辰阳.FPGA千兆以太网接口的IP核设计[J].单片机与嵌入式系统应用,2022,22(11):49-53. 被引量：3
3徐胜,文丰.基于FPGA的UART自适应接收IP核设计[J].单片机与嵌入式系统应用,2023,23(11):14-16.
4陈灵毓,田蕊.基于动态联盟的多Agent系统神经网络构架设计研究[J].信息记录材料,2023,24(12):108-110.
5陈思浩,吴黎明,彭克锦,许志杰.基于ZYNQ平台的卷积神经网络加速器设计与实现[J].自动化与信息工程,2024,45(1):30-34. 被引量：1

1黄家明,陈寰,史庆杰,陈海宝.基于FPGA的红外目标识别神经网络加速器设计[J].飞控与探测,2020,3(6):66-75. 被引量：2
2陆翔,王鹏,袁幸杰,孙农亮.基于Ardunio的智能家居实验开发平台研究[J].实验室科学,2020,23(6):76-79.
3唐蕊,焦继业,徐华昊.面向嵌入式的卷积神经网络硬件加速器设计[J].计算机工程与应用,2021,57(4):252-257. 被引量：4
4周先春,郭亮可,邹宇,朱雯.基于FPGA实现二维卷积滤波器的图像处理[J].现代电子技术,2021,44(4):17-22. 被引量：5
5郭庆胜,黎佳宜,曹元晖,王勇,刘纪平,郑传帮.建筑物白模多边形的自动合并[J].武汉大学学报（信息科学版）,2021,46(1):12-18. 被引量：4
6张子豪,郭俊康,洪军,孙岩辉.航空发动机高压转子装配偏心预测和相位优化的智能算法应用研究[J].西安交通大学学报,2021,55(2):47-54. 被引量：10

电子技术应用

2021年第2期

浏览历史

内容加载中请稍等...

基于FPGA的卷积神经网络并行加速器设计被引量：4

参考文献2

二级参考文献14

共引文献666

同被引文献32

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络并行加速器设计 被引量：4

参考文献2

二级参考文献14

共引文献666

同被引文献32

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络并行加速器设计被引量：4