基于FPGA的深度学习目标检测系统的设计与实现被引量：10

Design and implementation of FPGA-based deep learning object detection system

下载PDF

导出

摘要针对当前深度学习目标检测算法计算复杂度高和内存需求大等问题,设计并实现了一种基于FPGA的深度学习目标检测系统。设计对应YOLOv2-Tiny目标检测算法的硬件加速器,对加速器各模块的处理时延建模,给出卷积计算模块的详细设计。实验结果表明,与CPU相比,CPU+FPGA的异构系统是双核ARM-A9能效的67.5倍,Xeon的94.6倍;速度是双核ARM-A9的84.4倍,Xeon的5.5倍左右。并且,当前设计在性能上超过之前的工作。 Aiming at the problems of higher computational complexity and larger memory requirements of current object detection algorithm, we designed and implemented an FPGA-based deep learning object detection system. We also designed the hardware accelerator corresponding to the YOLOv2-Tiny object detection algorithm, modeled the processing delay of each accelerator module, and describe the design of the convolution module. The experimental results show that it is 5.5x and 94.6x of performance and energy gains respectively when comparing with the software Darknet on an 8-core Xeon server, and 84.8x and 67.5x over the software version on the dual-core ARM cortex-A9 on Zynq. Also, the current design outperforms the previous work in performance.

作者陈辰严伟夏珺柴志雷 Chen Chen;Yan Wei;Xia Jun;Chai Zhilei(School of Internet of Things Engineering,Jiangnan University,Wuxi 214122,China;School of Software & Microelectronics,Peking University,Beijing 102600,China)

机构地区江南大学物联网工程学院北京大学软件与微电子学院

出处《电子技术应用》 2019年第8期40-43,47,共5页 Application of Electronic Technique

关键词深度学习目标检测 FPGA 硬件加速器 deep learning object detection FPGA hardware accelerator

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1张雲轲,刘丹.基于小型Zynq SoC硬件加速的改进TINY YOLO实时车辆检测算法实现[J].计算机应用,2019,39(1):192-198. 被引量：9

二级参考文献3

1傅沈文.复杂环境下基于图和条件随机域的运动车辆检测[J].计算机应用,2012,32(6):1581-1584. 被引量：1
2王德宇,徐友春,李永乐,陆峰,郑凯文.基于深度学习的车辆检测方法[J].计算机与现代化,2017(8):56-60. 被引量：4
3陈艳,严腾,宋俊芳,宋焕生.基于高斯混合模型和AdaBoost的夜间车辆检测[J].计算机应用,2018,38(1):260-263. 被引量：6

共引文献8

1阮有兵,徐海黎,万旭,邢强,沈标.适用于嵌入式平台的E-YOLO人脸检测网络研究[J].计算机应用与软件,2020,37(2):147-151. 被引量：5
2孙盛婷,贺盼博,马远浩.基于二元卷积神经网络的快速目标检测法[J].电子技术与软件工程,2020(9):139-142. 被引量：1
3奚正波,胡芳铁,谭振宙.基于视频监控辅助电话闭塞法行车的技术应用研究[J].城市建设理论研究（电子版）,2020(24):65-68.
4高宗斌,崔永杰,李凯.基于T-YOLO-LITE树干检测的模型部署方法[J].计算机应用与软件,2021,38(2):132-139. 被引量：2
5房思思,卢安安,杨利红,姜少波,甘彤,商国军.基于目标检测的地铁站人群数量估计[J].计算机应用,2021,41(S01):64-68. 被引量：2
6梅志伟,丁兴军,刘金鹏.基于FPGA的YOLOv3-tiny卷积神经网络加速设计[J].舰船电子对抗,2022,45(2):81-88.
7赵鑫,孟令军,刘威宏.基于Zynq平台的垃圾分类系统实现[J].工业仪表与自动化装置,2022(5):26-31. 被引量：2
8黄沛昱,赵强,李煜龙.基于FPGA的卷积神经网络硬件加速器设计[J].计算机应用与软件,2023,40(3):38-44. 被引量：3

同被引文献48

1刘骁彬.空间电压矢量脉宽调制技术中零矢量调制的算法研究与FPGA实现[J].佳木斯大学学报（自然科学版）,2011,29(6):838-841. 被引量：1
2袁延强.物联网技术与皮带秤远程专家系统[J].衡器,2012,41(10):40-44. 被引量：4
3方睿,刘加贺,薛志辉,杨广文.卷积神经网络的FPGA并行加速方案设计[J].计算机工程与应用,2015,51(8):32-36. 被引量：27
4盛伯湛,时坚敏.ZLNET^(TM)——阵列皮带秤^(TM)的好搭档[J].衡器,2015,44(8):16-19. 被引量：3
5王阳,陶华敏,肖山竹,戴华东.基于脉动阵列的矩阵乘法器硬件加速技术研究[J].微电子学与计算机,2015,32(11):120-124. 被引量：6
6靳晓芳,Liu Mengxuan,Shao Min,Jin Libiao,Huang Xianglin.Research on the adaptive hybrid search tree anti-collision algorithm in RFID system[J].High Technology Letters,2016,22(1):107-112. 被引量：3
7季辉,丁泽军.双人博弈问题中的蒙特卡洛树搜索算法的改进[J].计算机科学,2018,45(1):140-143. 被引量：11
8罗嗣卿,王佳玉,李冰珂.改进的组合优化决策树谣言判别方法研究[J].计算机仿真,2018,35(2):219-223. 被引量：9
9孙润稼,刘玉田.基于深度学习和蒙特卡洛树搜索的机组恢复在线决策[J].电力系统自动化,2018,42(14):40-47. 被引量：25
10张军阳,王慧丽,郭阳,扈啸.深度学习相关研究综述[J].计算机应用研究,2018,35(7):1921-1928. 被引量：125

引证文献10

1王春林,谭克俊.基于脉动阵列的卷积计算模块硬件设计[J].电子技术应用,2020,46(1):57-61. 被引量：1
2陈建国,方振国,柏雪婷.树搜索优化算法在FPGA中的应用与实现[J].佳木斯大学学报（自然科学版）,2020,38(2):48-51.
3施懿,浦昕鑫,沈刘潼,徐也.基于卷积神经网络和关键词的目标检测系统[J].电脑知识与技术,2021,17(8):162-164.
4祁星晨,卓旭升.基于改进MTCNN算法的低功耗边缘人脸检测跟踪系统[J].电子技术应用,2021,47(5):40-44. 被引量：2
5程钰清,贺占庄,马钟,毕瑞星,毛远宏.面向嵌入式FPGA的智能目标检测算法[J].微电子学与计算机,2021,38(6):87-92. 被引量：3
6刘腾达,朱君文,张一闻.FPGA加速深度学习综述[J].计算机科学与探索,2021,15(11):2093-2104. 被引量：9
7寇振伟.人工智能自动检测领域应用初探[J].衡器,2021,50(9):41-45.
8聂煜桐,沈月峰,杨帆,王吕大.基于FPGA的双乘法器卷积加速算子的封装方法[J].计算机工程与设计,2022,43(8):2385-2392. 被引量：1
9罗苑琪.基于FPGA的飞机新型总线脱粘故障诊断技术[J].粘接,2023,50(10):137-140.
10郁媛,李沛君,王光奇,张德兵,张春.用于VSLAM系统的CNN在FPGA平台上的加速[J].计算机工程与设计,2024,45(1):71-78.

二级引证文献16

1杜忠文,李庚霖,蒋菡,褚江恒,伍俊.基于次级缓存的SDRAM调度策略的研究[J].电子测量技术,2023,46(14):37-42.
2程婧,王志俊,李国栋,魏珂.多波束渔用声呐波束成形算法设计与FPGA实现[J].渔业现代化,2021,48(6):95-102. 被引量：3
3康萍萍,侯进,周浩然,陈子锐,李晨.基于空间注意力与图卷积的多标签图像分类算法[J].微电子学与计算机,2022,39(5):10-19. 被引量：1
4李福海,宋皓宇,马宏琳.基于人脸识别技术的高校在线考试系统设计与实现[J].电脑知识与技术,2022,18(14):56-57. 被引量：2
5李慧琳,柴志雷.基于Vitis AI的语义分割网络加速器研究与实现[J].单片机与嵌入式系统应用,2022,22(7):17-20.
6张亚维,史强强,张乐.发动机进气道监测系统设计和实现[J].测控技术,2022,41(8):48-53. 被引量：2
7何斌斌,张波,彭小春,彭华梁.可信身份师生人脸智能采集的研究和实现[J].科学与信息化,2022(18):44-47.
8刘鑫昌,冯路,李继东,马钟,毕瑞星.基于线性核函数的高速核化相关跟踪算法[J].微电子学与计算机,2022,39(11):78-84.
9穆向阳,雷妍,王闻博.一种中值滤波快速系统的FPGA实现[J].西安石油大学学报（自然科学版）,2023,38(2):128-134.
10吴昱昊.基于FPGA的目标检测系统与加速器设计[J].现代信息科技,2023,7(7):101-104.

1孙焘,季少雄.基于集中供热时延的温度预测模型及仿真[J].系统仿真学报,2018,30(4):1328-1336. 被引量：4
2翟社平,邱程,杨媛媛,李婧,江婷婷.基于FPGA的卷积神经网络加速器设计与实现[J].微电子学与计算机,2019,36(8):83-86. 被引量：9
3蒉秀惠,王燕锋.转移概率部分未知的网络化马尔科夫跳变系统镇定（英文）[J].控制工程,2018,25(12):2279-2284. 被引量：1
4卞景帅,卢家品,罗月童,张敏.基于Faster-RCNN的结核杆菌自动检测方法研究与应用[J].图学学报,2019,40(3):608-615. 被引量：6
5宜勇,秦灿辉.未雨绸缪做好新技术环境下数据安全管控[J].祖国,2019,0(10):30-31.
6吴建耀,程树英,郑茜颖.一种改进的DSOD目标检测算法[J].半导体光电,2019,0(3):428-432. 被引量：1
7葛晓瑜,沈国华,黄志球,邓刘梦,宛伟健.一种基于失效传播模型的危害分析方法[J].计算机工程与科学,2019,41(6):1026-1033. 被引量：1
8蔡凯,周永霞.采用Ranking Saliency算法改进的交通标志检测方法[J].中国计量大学学报,2019,30(2):138-143. 被引量：1
9蹇强,张培勇,王雪洁.一种可配置的CNN协加速器的FPGA实现方法[J].电子学报,2019,47(7):1525-1531. 被引量：19
10赵谦,薛改样,杨新花.基于视觉注意机制的行人目标检测[J].计算机仿真,2019,36(7):411-414. 被引量：5

电子技术应用

2019年第8期

浏览历史

内容加载中请稍等...

基于FPGA的深度学习目标检测系统的设计与实现被引量：10

参考文献1

二级参考文献3

共引文献8

同被引文献48

引证文献10

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于FPGA的深度学习目标检测系统的设计与实现 被引量：10

参考文献1

二级参考文献3

共引文献8

同被引文献48

引证文献10

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于FPGA的深度学习目标检测系统的设计与实现被引量：10