基于FPGA的卷积神经网络加速器设计与实现被引量：6

Design and Implementation of Convolutional Neural Network Accelerator Based on FPGA

下载PDF

导出

摘要卷积神经网络作为传统神经网络的改进,已经获得了广泛的应用。但其实现方式多以软件形式在PC机上运行,在实时性、低功耗和小型化方面都难易适应嵌入式应用需要。鉴于此,本文充分利用现场可编程门阵列(FPGA)的并行计算能力和低功耗等优势,设计了一种基于FPGA的卷积神经网络加速器。采用硬件电路实现方式,充分利用FPGA内部逻辑资源,引入多级流水线并行处理技术,不仅提高运算速度、降低功耗,而且更加适用于嵌入式应用需要。 Convolutional neural network, as an improvement of traditional neural network, has been widely used. However, most of its implementation is in the form of software running on PC, which is difficult to meet the needs of embedded applications in terms of real-time, low power consumption and miniaturization. In view of this, a convolutional neural network accelerator based on field programmable gate array (FPGA) is designed in this paper, which takes full advantage of the parallel computing ability and low power consumption of FPGA. by hardware circuit implementation, making full use of internal logic resources of FPGA and introducing multi-level pipeline parallel processing technology and structured design, the system not only improves the operation speed, reduces power consumption, but also is more suitable for embedded applications.

作者魏浚峰王东山丹 WEI Jun-feng;WANG Dong;SHAN Dan(Dalian Neusoft University of Information, Dalian 116023, China)

机构地区大连东软信息学院电子工程系

出处《中国集成电路》 2019年第7期18-22,67,共6页 China lntegrated Circuit

关键词卷积神经网络现场可编程门阵列加速器并行化流水线 Convolutional Neural Network Field Programmable Gate Array Accelerator Parallelization, Pipelining

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1余子健,马德,严晓浪,沈君成.基于FPGA的卷积神经网络加速器[J].计算机工程,2017,43(1):109-114. 被引量：36
2周莉莉,姜枫.图像分割方法综述研究[J].计算机应用研究,2017,34(7):1921-1928. 被引量：115

二级参考文献2

1吕刚,郝平,盛建荣.一种改进的深度神经网络在小图像分类中的应用研究[J].计算机应用与软件,2014,31(4):182-184. 被引量：23
2马焕芳,赵歆波,邹晓春.基于MapReduce的卷积神经网络算法研究[J].中国体视学与图像分析,2015,20(4):339-346. 被引量：2

共引文献149

1陈林,陈国良.无人机低空飞行中具有复杂背景的运动目标检测算法[J].数字制造科学,2023(1):45-50.
2伍凡,沙俊伟,刘若鹏,徐贵力.基于搭桥式点云拼接的管道三维重建研究[J].电子测量技术,2023,46(21):151-158.
3瞿伟廉,陈朝晖,徐幼麟.被动及半主动摩擦阻尼器对合肥翡翠电视塔地震反应的控制[J].地震工程与工程振动,2000,20(2):101-106. 被引量：7
4徐红运,徐小力,左云波,吴国新.复杂背景下的风力机组叶片图像分割方法研究[J].电子测量技术,2018,41(22):60-65. 被引量：5
5宋国磊,侯巍.SAR图像分割算法综述[J].计算机时代,2017(5):1-5. 被引量：2
6王庆敏,赵亮.基于最小生成树的图像分割方法[J].电脑编程技巧与维护,2017(15):74-76. 被引量：1
7黄金土.一种六维的FCM彩色图像分割方法[J].福建电脑,2017,33(8):121-122.
8王贝贝,杨明,燕慧超.基于改进谱聚类算法在图像分割中的应用[J].河北工业科技,2018,35(1):55-60. 被引量：1
9李玉,李杰,王玉,赵泉华.结合波利亚罐模型和M-H算法的遥感图像分割[J].信号处理,2018,34(3):319-330.
10王昆,周骅.深度学习中的卷积神经网络系统设计及硬件实现[J].电子技术应用,2018,44(5):56-59. 被引量：7

同被引文献24

1崔小乐,陈红英,崔小欣,张兴.一种软硬件协同设计工具原型及其设计描述方法[J].微电子学与计算机,2007,24(6):28-30. 被引量：4
2余子健,马德,严晓浪,沈君成.基于FPGA的卷积神经网络加速器[J].计算机工程,2017,43(1):109-114. 被引量：36
3施一飞.对使用TensorRT加速AI深度学习推断效率的探索[J].科技视界,2017,0(31):26-27. 被引量：11
4杨一晨,张国和,梁峰,何平,吴斌,高震霆.一种基于可编程逻辑器件的卷积神经网络协处理器设计[J].西安交通大学学报,2018,52(7):153-159. 被引量：7
5仇越,马文涛,柴志雷.一种基于FPGA的卷积神经网络加速器设计与实现[J].微电子学与计算机,2018,35(8):68-72. 被引量：11
6卢冶,陈瑶,李涛,蔡瑞初,宫晓利.面向边缘计算的嵌入式FPGA卷积神经网络构建方法[J].计算机研究与发展,2018,55(3):551-562. 被引量：46
7蔡瑞初,钟椿荣,余洋,陈炳丰,卢冶,陈瑶.面向“边缘”应用的卷积神经网络量化与压缩方法[J].计算机应用,2018,38(9):2449-2454. 被引量：18
8熊国强,徐渊,朱明程,王少博,刘宏伟.一种基于ZYNQ的嵌入式高尔夫球体花纹识别系统设计与实现[J].电子器件,2019,42(2):484-490. 被引量：4
9姜芃旭,傅洪亮,陶华伟,雷沛之.一种基于卷积神经网络特征表征的语音情感识别方法[J].电子器件,2019,42(4):998-1001. 被引量：22
10吴艳霞,梁楷,刘颖,崔慧敏.深度学习FPGA加速器的进展与趋势[J].计算机学报,2019,42(11):2461-2480. 被引量：57

引证文献6

1雷小康,尹志刚,赵瑞莲.基于FPGA的卷积神经网络定点加速[J].计算机应用,2020,40(10):2811-2816. 被引量：10
2程佳风,王红亮.基于HLS工具的CNN加速器的设计与优化方法研究[J].电子技术应用,2021,47(3):18-21. 被引量：2
3王红亮,程佳风.基于嵌入式设备应用的CNN加速器的设计研究[J].电子器件,2021,44(4):797-801. 被引量：6
4马晓光,蒋占军.卷积神经网络图像识别算法的FPGA加速优化研究[J].兰州交通大学学报,2021,40(5):51-57. 被引量：3
5贾亮,徐善博,邢轶博.基于FPGA的卷积神经网络图像识别算法研究[J].电脑与电信,2022(12):58-61. 被引量：1
6刘晛,吴瑞琦,高尚尚,刘泽浩,刘海波,孔祥晔,王庆,郭乃宏,周锋,王如刚.基于ZYNQ的通用型卷积神经网络设计与实现[J].电子器件,2023,46(1):121-125. 被引量：2

二级引证文献23

1王利翔,林珊玲,林志贤,郭太良.基于Zynq平台的图像目标检测系统[J].半导体光电,2023,44(1):147-152.
2邱文杰,叶进,胡亮青,杨娟,李其利,莫贱友,易万茂.面向植物病害识别的卷积神经网络精简结构Distilled-MobileNet模型[J].智慧农业（中英文）,2021,3(1):109-117. 被引量：6
3李磊,徐国伟,李文婧,宋庆增.基于深度学习的舰船目标检测算法与硬件加速[J].计算机应用,2021,41(S01):162-166. 被引量：7
4满涛,郭子豪,曲志坚.卷积神经网络的FPGA并行加速设计与实现[J].电讯技术,2021,61(11):1438-1445. 被引量：9
5马毅超,张晓盼,王鑫.基于HLS的BWT算法的硬件加速方法[J].电子技术与软件工程,2021(21):143-146.
6吴宇航,何军.基于FPGA的人体行为识别系统的设计[J].南京信息工程大学学报（自然科学版）,2022,14(3):331-340.
7张育敬,陶青川.基于改进BiSeNet的轻量级水利语义分割算法[J].现代计算机,2022,28(7):53-58. 被引量：2
8吴宇航,何军.基于FPGA加速的行为识别算法研究[J].电子测量技术,2022,45(13):25-32. 被引量：4
9何家俊,苏成悦,罗荣芳,施振华,陈堆钰,罗俊丰.基于FPGA的量化推理CNN加速系统研究与设计[J].计算机测量与控制,2022,30(9):162-169. 被引量：1
10崔业梅,杨焕峥,徐玲.嵌入式人工智能与物联网图形化编程项目教学应用[J].实验技术与管理,2022,39(9):222-227. 被引量：8

1李子聪,曾宇航,熊晓明.基于SoC的卷积神经网络系统设计[J].电子测量技术,2019,42(10):126-131. 被引量：6
2李小燕,张欣,闫小兵,任德亮,李彦青,傅长娟.基于FPGA的卷积神经网络加速系统[J].河北大学学报（自然科学版）,2019,39(1):99-105. 被引量：5
3赵赫,黄志洪,余乐,杨海钢,许仕龙,郝亚男.适用于FPGA的浮点型DSP硬核结构设计[J].太赫兹科学与电子信息学报,2019,17(3):524-530. 被引量：1
4张淑,田泽,郑新建,张骏,许宏杰,王维.面向低抖动GPU像素Cache的像素写合并缓冲技术[J].微电子学与计算机,2019,36(7):93-97.
5鲍喜荣,沈晓燕,张石,苏婷.基于改进DMAS的平面波超声成像算法及其GPU实现[J].东北大学学报（自然科学版）,2019,40(7):925-931.
6吴建军,李磊,方平凯,孟小前,谭均铭.电力巡线直升机激光扫描数据的高效组织与显示[J].激光技术,2019,43(3):318-323. 被引量：9
7李凯利,张卫航,郭桂良.基于Bus-Invert编码的低功耗AES加密电路设计[J].微电子学与计算机,2019,36(7):27-31. 被引量：1

中国集成电路

2019年第7期

浏览历史

内容加载中请稍等...

基于FPGA的卷积神经网络加速器设计与实现被引量：6

参考文献2

二级参考文献2

共引文献149

同被引文献24

引证文献6

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络加速器设计与实现 被引量：6

参考文献2

二级参考文献2

共引文献149

同被引文献24

引证文献6

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络加速器设计与实现被引量：6