用于实时目标检测的FPGA神经网络加速器设计被引量：5

Design of FPGA-based neural network accelerator for real-time objective detection

下载PDF

导出

摘要在FPGA上实现YOLO等目标检测算法,需要从模型量化到硬件优化等多种优化方法.为了缩短硬件延时,使用了三种技术:(1)利用层融合和位宽量化策略来降低计算复杂度;(2)利用具有padding跳过技术的基于列的流水线架构来减少启动时间;(3)利用设计空间探索算法来平衡流水线时间,提高DSP使用效率.为了验证提出的神经网络加速器架构,在ZC706 FPGA上实现了具有1280×384输入的YOLO网络.与传统加速器相比,取得了1.97倍的延迟缩减或者1.54倍的DSP效率提升. Implementing object detection algorithms,such as YOLO,in FPGA requires multi-level optimization,starting from model quantization to hardware optimization.To optimize hardware latency,three techniques are used:(1)bit-width quantization and layer fusion strategies are used to minimize the computation complexity,(2)a column-based pipeline architecture with padding skip technique is introduced to reduce the start-up time of pipeline and(3)a design space exploration algorithm is proposed to balance the pipeline and improve the DSP efficiency.To demonstrate the proposed neural network accelerator architecture,YOLO with 1280×384 input is implemented on ZC706 FPGA and achieves a 1.97×latency reduction or a 1.54×DSP efficiency improvement over traditional accelerators.

作者李岑贺光辉 LI Cen;HE Guang-hui(School of Electronic Information and Electrical Engineering,Shanghai Jiao Tong University,Shanghai 200240,China)

机构地区上海交通大学电子信息与电气工程学院

出处《微电子学与计算机》北大核心 2020年第7期6-11,共6页 Microelectronics & Computer

基金国家重点研发计划(2016YFE0116900)。

关键词 YOLO FPGA加速器基于列的流水线架构低延时高DSP效率 YOLO FPGA accelerator column-based pipeline architecture low latency high DSP efficiency

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1吴佳祥,刘辉,贺光辉.一种应用于高分辨率遥感图像目标检测的尺度自适应卷积神经网络[J].微电子学与计算机,2018,35(8):78-81. 被引量：4
2林健巍.YOLO图像检测技术综述[J].福建电脑,2019,35(9):80-83. 被引量：19

共引文献21

1王鑫杰,王吉平.YOLO目标检测算法综述[J].广西物理,2024,45(2):50-53.
2池美珠,陆中权,除辉.新生儿缺氧缺血性脑病血糖、血皮质醇水平变化及临床意义[J].新生儿科杂志,2000,15(1):12-13. 被引量：10
3刘志宏,李玉峰.基于特征融合卷积神经网络的SAR图像目标检测方法[J].微处理机,2020,41(2):31-37. 被引量：1
4陈俊松,何自芬,张印辉.改进YOLOv3算法的筷子毛刺缺陷检测方法[J].食品与机械,2020,36(3):133-138. 被引量：2
5常莹,蔡蓉宾.基于卷积神经网络的多类别路面病害识别研究[J].上海电气技术,2020,13(2):61-66. 被引量：6
6郭浩.基于神经网络算法的高速动车组智能检修处理系统研究[J].甘肃科技纵横,2020,49(9):8-11. 被引量：2
7席孝倩,刘威.基于目标检测算法的肺结节辅助诊断系统[J].计算机与现代化,2020(11):1-7. 被引量：5
8张晓华,马煜,杨晨辉,隋雨杉.基于卷积神经网络的设备安装位置智能识别方法[J].工业仪表与自动化装置,2021(1):13-17. 被引量：5
9吴文韬,刘威.基于YOLOv3的宫颈细胞识别系统[J].电子设计工程,2021,29(3):51-55. 被引量：2
10肖博健,万烂军,陈俊权.采用YOLOV5模型的口罩佩戴识别研究[J].福建电脑,2021,37(3):35-37. 被引量：25

同被引文献16

1宋子豪,李涛,杜晓鸽,邢立冬.光栅化中多格式除法器的设计与实现[J].电子世界,2020,0(5):114-115. 被引量：2
2张嘉琛,蒋剑飞,毛志刚.基于功能复用的高性能ALU设计[J].信息技术,2010,34(3):58-60. 被引量：4
3刘容,赵洪深,李晓今.基于改进型选择进位加法器的32位浮点乘法器设计[J].现代电子技术,2013,36(16):133-136. 被引量：4
4何军,黄永勤,朱英.一种高性能四倍精度浮点乘加器的设计与实现[J].计算机工程,2014,40(2):294-299. 被引量：1
5李涛,杨婷,易学渊,蒲林,钱博文,黄光新,黄虎才,韩俊刚.萤火虫2:一种多态并行机的硬件体系结构[J].计算机工程与科学,2014,36(2):191-200. 被引量：16
6延酉玫,李涛,王鹏博,韩俊刚,李雪丹,姚静,乔虹.OpenVX与三维渲染在多态GPU上的并行实现[J].计算机应用,2015,35(1):53-57. 被引量：4
7李涛,孙建,王鹏博.基于PAAG的OpenVX核心库函数并行化实现[J].西安邮电大学学报,2015,20(2):7-10. 被引量：5
8高向强,冯春阳,闫鑫,杨靓,曹辉.一种面向64位DSP处理器的可重构ALU研究及设计[J].微电子学与计算机,2015,32(10):1-6. 被引量：2
9车文博,刘衡竹,田甜.M-DSP中高性能浮点乘加器的设计与实现[J].计算机应用,2016,36(8):2213-2218. 被引量：1
10章子凯,武继刚,姜文超,刘竹松.容错处理器阵列的多逻辑列并行重构算法[J].计算机工程与科学,2018,40(1):24-33. 被引量：1

引证文献5

1谢帅,蒋力,叶瑶瑶.针对实时目标检测的多维度并行FPGA加速器设计[J].微电子学与计算机,2021,38(8):13-19. 被引量：2
2王宇,李涛,邢立冬,冯臻夫.OpenVX高效能并行可重构运算通路的设计与实现[J].计算机工程,2021,47(12):236-248. 被引量：1
3凌元,韩文俊,张辉,陈子洋.基于FPGA的高效MobilenetV2加速器设计[J].信息技术与信息化,2022(6):60-64.
4丁建国,党鑫,李文婧,宋庆增.面向人车识别的目标检测系统实现[J].计算机工程与设计,2023,44(3):739-745. 被引量：1
5王戈,李江勇,杨德振,张子林,柴欣.轻量化卷积神经网络红外目标识别性能分析与FPGA实现[J].激光与红外,2024,54(3):466-472.

二级引证文献4

1张鹏昊,秦斌.深度强化学习研究进展[J].电脑知识与技术,2021,17(28):104-106. 被引量：1
2呼延烺,李映,蒋冬梅,张艳宁,周诠,魏佳圆,刘娟妮.在轨高效目标检测加速技术[J].宇航学报,2022,43(11):1544-1556.
3李晟召,王琴.基于帧间相似性的目标检测FPGA加速器设计[J].计算机工程与设计,2023,44(6):1885-1892.
4曹鎏,徐巧玉.基于OC&PGMF的弱监督行人检测方法[J].计算机工程与设计,2024,45(9):2725-2732.

1王鹏飞,陈晓斐,盛修贵.螺旋断层放疗在妇科肿瘤应用进展[J].中华肿瘤防治杂志,2019,26(19):1410-1415. 被引量：6
2李泽嵩,董光宇.基于动态映射的卷积神经网络量化重训练方法[J].信息技术,2020,44(7):84-91. 被引量：2
3欧阳魁.基于FPGA的低功耗低资源的BP神经网络推理加速器设计[J].集成电路应用,2020,37(4):10-12. 被引量：1
4李永博,王琴,蒋剑飞.稀疏卷积神经网络加速器设计[J].微电子学与计算机,2020,37(6):30-34. 被引量：1
5杨俊蕾.主持人语[J].电影新作,2020(1):10-10.
6赵琪琪,马慧芳,刘海姣,贾俊杰.融合节点属性与结构信息的子空间异常社区检测方法[J].计算机工程,2020,46(6):94-102. 被引量：1
7汪先锋,黄真根,潘青.X线、超声、磁共振成像多技术联合鉴别乳腺良恶性肿块的价值[J].现代诊断与治疗,2020(4):593-594. 被引量：2
8叶万洋,郎荣玲.基于软件无线电的机会信号实时盲分离系统[J].导航定位与授时,2020,7(3):30-37.
9胡航天,刘凯,马士超,郭子博.专用指令集在基于FPGA的神经网络加速器中的应用[J].空间控制技术与应用,2020,46(3):36-41. 被引量：4
10伍京华,郄晓彤,王佳莹.基于Agent的提议修正的情感劝说交互模型[J].计算机集成制造系统,2020,26(5):1384-1396. 被引量：3

微电子学与计算机

2020年第7期

浏览历史

内容加载中请稍等...

用于实时目标检测的FPGA神经网络加速器设计被引量：5

参考文献2

共引文献21

同被引文献16

引证文献5

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

用于实时目标检测的FPGA神经网络加速器设计 被引量：5

参考文献2

共引文献21

同被引文献16

引证文献5

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

用于实时目标检测的FPGA神经网络加速器设计被引量：5