面向低延时目标检测的FPGA神经网络加速器设计

FPGA Neural Network Accelerator for Low-Latency Object Detection

下载PDF

导出

摘要目标检测网络算法具有更高的检测精度,但庞大的计算复杂度使得传统硬件难以满足实时计算需求。为此,一种面向低延时目标检测的FPGA神经网络加速器被设计研究。该加速器能够支持高并行卷积稀疏计算,进而优化计算延时;同时设计了集中式存储阵列结构,能够实现存储阵列和计算阵列非一一对应的数据交互。基于Xilinx VCU118开发板和YOLOv3深度神经网络的测试结果显示,加速器单帧延时只有24.36 ms,并具有2704 GOPS的吞吐性能和更高的面积效率。 The object detection network algorithms have higher detection accuracy.However,the huge computational complexity makes it difficult for traditional processors to realize real-time processing.Therefore,a neural network accelerator based on FPGA is proposed for low-latency object detection.It can support high-parallel convolutional sparse calculating,which improves the parallelism and reduces the calculation delay.Also,a centralized storage array structure is designed to achieve non-one-to-one data interaction between storage array and comput⁃ing array.Finally,the YOLOv3 network is implemented on the Xilinx VCU118 development board.The accelerator delay is only 24.36 ms,achieving 2704 GOPS throughput and higher area efficiency.

作者郑思杰李杰贺光辉 ZHENG Sijie;LI Jie;HE Guanghui(School of Electronic Information and Electrical Engineering,Shanghai Jiao Tong University,Shanghai 200240;Shanghai Academy of Spaceflight Technology(SAST),Shanghai 201109)

机构地区上海交通大学电子信息与电气工程学院上海航天测控通信研究所

出处《现代计算机》 2021年第18期38-43,共6页 Modern Computer

基金国家重点研发计划项目(No.2019YFB2204500) 上海航天先进技术联合研究基金项目(No.USCAST2019-28)。

关键词 FPGA加速器目标检测卷积神经网络低延时稀疏计算 FPGA Accelerator Object Detection Convolutional Neural Network Low-Latency Sparse Calculating

分类号 TP183 [自动化与计算机技术—控制理论与控制工程] TN791 [电子电信—电路与系统]

引文网络
相关文献

1谢帅,蒋力,叶瑶瑶.针对实时目标检测的多维度并行FPGA加速器设计[J].微电子学与计算机,2021,38(8):13-19. 被引量：2
2张志刚,李涛,张玉霞,刘艳辉.基于Linux的视频网络嵌入式控制系统设计[J].现代电子技术,2021,44(13):60-64. 被引量：2
3吴欣欣,欧焱,李文明,王达,张浩,范东睿.基于粗粒度数据流架构的稀疏卷积神经网络加速[J].计算机研究与发展,2021,58(7):1504-1517. 被引量：7
4刘旸,丁涛杰,汤明宏,刘志利.一种RISC-V验证系统的设计与实现[J].电子技术与软件工程,2021(13):107-108. 被引量：1
5沈林耀,王琴,蒋剑飞,景乃锋.一种面向忆阻器加速器的神经网络模型压缩框架[J].微电子学与计算机,2021,38(8):20-27. 被引量：2
6孙雷,乔庐峰,陈庆华,王雷淘.基于IEEE 802.1AS的TSN时间同步系统设计[J].电声技术,2021,45(5):59-65. 被引量：6
7李波,余达,刘金国,孔德柱,梅贵,陈佳豫,赵莹.多工作模式的刷新成像系统[J].液晶与显示,2021,36(7):1035-1041. 被引量：1
8李欣瑶,刘飞阳,文鹏程,李鹏.卷积神经网络的软硬件协同加速技术[J].航空兵器,2021,28(3):99-104. 被引量：6

现代计算机

2021年第18期

浏览历史

内容加载中请稍等...

面向低延时目标检测的FPGA神经网络加速器设计

相关作者

相关机构

相关主题

浏览历史