期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于ZYNQ的卷积神经网络加速器设计
被引量:
4
1
作者
吴健
顾明剑
+2 位作者
曾长紊
邵春沅
范余茂
《计算机工程与设计》
北大核心
2022年第6期1572-1581,共10页
针对卷积神经网络在嵌入式系统需要耗费大量计算资源、计算复杂度高等问题,提出一种基于ZYNQ系列FPGA的加速方法。通过HLS工具对卷积神经网络加速器进行设计,提出相邻层位宽合并和权重参数重排序的策略实现数据传输的优化,利用卷积分解...
针对卷积神经网络在嵌入式系统需要耗费大量计算资源、计算复杂度高等问题,提出一种基于ZYNQ系列FPGA的加速方法。通过HLS工具对卷积神经网络加速器进行设计,提出相邻层位宽合并和权重参数重排序的策略实现数据传输的优化,利用卷积分解、并行展开充分发挥FPGA并行计算的优势。为验证卷积神经网络加速器的加速效果,将YOLO目标检测模型进行部署。实验结果表明,在PYNQ-Z2上达到了39.39 GOP/s的计算性能,是intel i5-2400 CPU的3.4倍,是ARM-Cortex A9 CPU的147.5倍。在相同FPGA平台上与之前的工作相较也有更高的性能。
展开更多
关键词
卷积神经网络(CNN)
现场可编程门阵列(FPGA)
高层次综合(HLS)
硬件加速器
目标检测
下载PDF
职称材料
题名
基于ZYNQ的卷积神经网络加速器设计
被引量:
4
1
作者
吴健
顾明剑
曾长紊
邵春沅
范余茂
机构
中国科学院
上海技术物理研究所
中国科学院
上海技术物理研究所
红外成像与探测重点实验室
中国科学院上海技术物理研究所苏州研究院
中国科学院
大学
出处
《计算机工程与设计》
北大核心
2022年第6期1572-1581,共10页
基金
国家重点研发计划基金项目(2018YFB0504800、2018YFB0504802)。
文摘
针对卷积神经网络在嵌入式系统需要耗费大量计算资源、计算复杂度高等问题,提出一种基于ZYNQ系列FPGA的加速方法。通过HLS工具对卷积神经网络加速器进行设计,提出相邻层位宽合并和权重参数重排序的策略实现数据传输的优化,利用卷积分解、并行展开充分发挥FPGA并行计算的优势。为验证卷积神经网络加速器的加速效果,将YOLO目标检测模型进行部署。实验结果表明,在PYNQ-Z2上达到了39.39 GOP/s的计算性能,是intel i5-2400 CPU的3.4倍,是ARM-Cortex A9 CPU的147.5倍。在相同FPGA平台上与之前的工作相较也有更高的性能。
关键词
卷积神经网络(CNN)
现场可编程门阵列(FPGA)
高层次综合(HLS)
硬件加速器
目标检测
Keywords
convolutional neural network(CNN)
field-programmable gate array(FPGA)
high-level synthesis(HLS)
hardware accelerator
target detection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于ZYNQ的卷积神经网络加速器设计
吴健
顾明剑
曾长紊
邵春沅
范余茂
《计算机工程与设计》
北大核心
2022
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部