期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
YOLO目标检测后处理算法的优化和硬件加速 被引量:3
1
作者 邹知炜 孙文浩 陈松 《微电子学与计算机》 2024年第4期31-37,共7页
YOLO目标检测网络系列因具有高精度低延时的特点而得到广泛运用,但如何加速其后处理仍未得到充分研究。利用YOLO计算特点,优化了后处理算法:(1)融合detect层和后处理计算过程,通过将置信度阈值判断移至detect层计算前,避免无效计算和通... YOLO目标检测网络系列因具有高精度低延时的特点而得到广泛运用,但如何加速其后处理仍未得到充分研究。利用YOLO计算特点,优化了后处理算法:(1)融合detect层和后处理计算过程,通过将置信度阈值判断移至detect层计算前,避免无效计算和通信;(2)结合模型量化,实现基于脉动阵列的后处理硬件加速。实验表明:YOLOv3、YOLOv5的detect层卷积计算量减少了87.3%~99.9%;加速硬件设计在Virtex Ultrascale+VCU112上实现,100 MHz时钟频率下,YOLOv3的detect层与后处理计算相较优化前加速比达到7.2~9.3,在3000选框中筛选5个最佳选框条件下延时1736μs。相比现有工作,本文的detect层与后处理计算速度提升了4.7~5.0倍,后处理所需FF资源仅为9.9%~10.5%。较后处理优化前,稀疏化的YOLOv3网络整体推理速度提升1.2%~1.3%。 展开更多
关键词 YOLO 目标检测 后处理 硬件加速 FPGA
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部