-
题名YOLO目标检测后处理算法的优化和硬件加速
被引量:3
- 1
-
-
作者
邹知炜
孙文浩
陈松
-
机构
中国科学技术大学微电子学院
-
出处
《微电子学与计算机》
2024年第4期31-37,共7页
-
基金
国家重点研发计划(2019YFB2204800)
国家自然科学基金(61931008)。
-
文摘
YOLO目标检测网络系列因具有高精度低延时的特点而得到广泛运用,但如何加速其后处理仍未得到充分研究。利用YOLO计算特点,优化了后处理算法:(1)融合detect层和后处理计算过程,通过将置信度阈值判断移至detect层计算前,避免无效计算和通信;(2)结合模型量化,实现基于脉动阵列的后处理硬件加速。实验表明:YOLOv3、YOLOv5的detect层卷积计算量减少了87.3%~99.9%;加速硬件设计在Virtex Ultrascale+VCU112上实现,100 MHz时钟频率下,YOLOv3的detect层与后处理计算相较优化前加速比达到7.2~9.3,在3000选框中筛选5个最佳选框条件下延时1736μs。相比现有工作,本文的detect层与后处理计算速度提升了4.7~5.0倍,后处理所需FF资源仅为9.9%~10.5%。较后处理优化前,稀疏化的YOLOv3网络整体推理速度提升1.2%~1.3%。
-
关键词
YOLO
目标检测
后处理
硬件加速
FPGA
-
Keywords
YOLO
object detection
post processing
hardware acceleration
FPGA
-
分类号
TN911.73
[电子电信—通信与信息系统]
-