期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于ZYNQ的卷积神经网络加速器设计 被引量:4
1
作者 吴健 顾明剑 +2 位作者 曾长紊 邵春沅 范余茂 《计算机工程与设计》 北大核心 2022年第6期1572-1581,共10页
针对卷积神经网络在嵌入式系统需要耗费大量计算资源、计算复杂度高等问题,提出一种基于ZYNQ系列FPGA的加速方法。通过HLS工具对卷积神经网络加速器进行设计,提出相邻层位宽合并和权重参数重排序的策略实现数据传输的优化,利用卷积分解... 针对卷积神经网络在嵌入式系统需要耗费大量计算资源、计算复杂度高等问题,提出一种基于ZYNQ系列FPGA的加速方法。通过HLS工具对卷积神经网络加速器进行设计,提出相邻层位宽合并和权重参数重排序的策略实现数据传输的优化,利用卷积分解、并行展开充分发挥FPGA并行计算的优势。为验证卷积神经网络加速器的加速效果,将YOLO目标检测模型进行部署。实验结果表明,在PYNQ-Z2上达到了39.39 GOP/s的计算性能,是intel i5-2400 CPU的3.4倍,是ARM-Cortex A9 CPU的147.5倍。在相同FPGA平台上与之前的工作相较也有更高的性能。 展开更多
关键词 卷积神经网络(CNN) 现场可编程门阵列(FPGA) 高层次综合(HLS) 硬件加速器 目标检测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部