-
题名高性能实时目标检测加速器设计与实现
- 1
-
-
作者
程才菲
梁峰
秦海鹏
曹琪
陈昇杰
-
机构
西安交通大学微电子学院
-
出处
《电子设计工程》
2024年第22期175-180,185,共7页
-
基金
航空科学基金(ASFC-20184370012)。
-
文摘
随着神经网络技术的发展,深度学习在目标检测领域取得了非常好的性能和应用效果,但深度学习算法的边缘部署一直是一个挑战。为了克服这一挑战,设计了一种基于YOLOv3-Tiny网络的实时目标检测硬件加速器,旨在实现高效准确的目标识别和跟踪,并满足边缘计算对性能和功耗的要求。为了减少FPGA在浮点运算上的开销,将神经网络的浮点数量化成了定点数进行计算;同时使用了DSP乘法优化、深度可配置的行缓冲机制,流水与并行划分等一系列的策略来提高性能。在口罩识别与运动跟踪以及COCO数据集的基准测试中,该文的加速器功能得以实现,有效算力为107.5 GOPs,帧率可达27.6 fps。
-
关键词
深度学习
目标检测
量化
YOLOv3-Tiny
FPGA
-
Keywords
deep learning
object detection
quantization
YOLOv3-Tiny
FPGA
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-