基于片上系统的可配置卷积神经网络加速器的设计与实现

Design and implementation of configurable CNN accelerator based on SoC

下载PDF

导出

摘要针对现阶段卷积神经网络(CNN)加速器的设计只能部署在单一现场可编程门阵列(FPGA)平台、不支持硬件平台升级迭代的问题,设计了一种基于片上系统(SoC)的可配置CNN加速器。该加速器具备以下2个特点:(1)在电路设计中将数据位宽、中间缓存空间大小、乘法器阵列(MAC)并行度作为一种可选配置参数,通过调整资源使用量,使得该加速器能够适配不同FPGA硬件;(2)提出了动态数据复用的策略,通过对比数据传输过程中不同复用方式下的总参数量差异,动态地选择复用方法,以减少数据传输的等待时间,提高乘法器阵列利用率。该方案在ZCU104板卡上进行了实验,实验结果表明,当数据位宽选择8、乘法器阵列并行度选择1024、核心运算模块工作在180 MHz时,卷积运算阵列峰值吞吐量为180 GOPs,功耗为3.75 W,能效比达到47.97 GOPs·W^(-1),对于VGG16网络,其卷积层的平均乘法器阵列利用率达到84.37%。 A configurable convolutional neural network(CNN)accelerator based on system of chip(SoC)is designed to address the issue that the current design of CNN accelerators can only be deployed within a single field programmable gate array(FPGA)and cannot be used across platforms.The accelerator has two characteristics.First,in the circuit design,data bit width,intermediate buffer space size,and multiply accumulate(MAC)array parallelism are optional configuration parameters.By adjusting the resource utilization,the accelerator can adapt to different FPGA hardware.Second,a dynamic data reuse strategy is proposed to reduce the waiting time for data transmission and improve the utilization of the MAC array by dynamically selecting the reuse method based on the difference in total parameter amounts between different reuse methods during data transmission.The scheme is tested on the ZCU104 board,and the experimental results show that when the data bit width is 8,the multiplier array parallelism is 1024,and the core operation module works at 180 MHz,the peak throughput of the convolution operation array is 180 GOPs,with a power consumption of 3.75 W,and an energy efficiency ratio of 47.97 GOPs·W^(-1).For the VGG16 network,the average MAC utilization rate of its convolutional layers reaches 84.37%.

作者张立国杨红光金梅申前 ZHANG Liguo;YANG Hongguang;JIN Mei;SHEN Qian(School of Electrical Engineering,Yanshan University,Qinhuangdao 066004)

机构地区燕山大学电气工程学院

出处《高技术通讯》 CAS 北大核心 2024年第7期744-754,共11页 Chinese High Technology Letters

基金国家重点研发计划(2020YFB1711001)资助项目。

关键词卷积神经网络(CNN) 现场可编程门阵列(FPGA) CNN加速器可配置异构加速 convolutional neural network(CNN) field programmable gate array(FPGA) CNN accelerator configurable isomerization acceleration

分类号 TP183 [自动化与计算机技术—控制理论与控制工程] TN47 [电子电信—微电子学与固体电子学]

引文网络
相关文献

参考文献3

1胡硕,赵银妹,孙翔.基于卷积神经网络的目标跟踪算法综述[J].高技术通讯,2018,28(3):207-213. 被引量：19
2付秀丽,黎玲萍,毛克彪,谭雪兰,李建军,孙旭,左志远.基于卷积神经网络模型的遥感图像分类[J].高技术通讯,2017,27(3):203-212. 被引量：26
3张志超,王剑,章隆兵,肖俊华.面向目标检测的卷积神经网络优化方法[J].高技术通讯,2022,32(3):227-238. 被引量：2

二级参考文献6

1谭琨,杜培军.基于支持向量机的高光谱遥感图像分类[J].红外与毫米波学报,2008,27(2):123-128. 被引量：108
2刘勇,廖士中.基于支持向量机泛化误差界的多核学习方法[J].武汉大学学报（理学版）,2012,58(2):149-156. 被引量：3
3姜小光,王长耀,王成.成像光谱数据的光谱信息特点及最佳波段选择——以北京顺义区为例[J].干旱区地理,2000,23(3):214-220. 被引量：73
4蹇强,张培勇,王雪洁.一种可配置的CNN协加速器的FPGA实现方法[J].电子学报,2019,47(7):1525-1531. 被引量：20
5陈朋,陈庆清,王海霞,张怡龙,刘义鹏,梁荣华.基于改进动态配置的FPGA卷积神经网络加速器的优化方法[J].高技术通讯,2020,30(3):240-247. 被引量：3
6赵烁,范军,何虎.基于FPGA的CNN加速SoC系统设计[J].计算机工程与设计,2020,41(4):939-944. 被引量：9

共引文献43

1方堃,谢淑丽,齐微微,王伯燕,王锐,姚青.超像素图像分割算法及其应用研究进展[J].家电科技,2022(S01):604-607.
2付兴武,杨哲,姜文涛.因式分解卷积运算的多尺度目标跟踪算法[J].辽宁工程技术大学学报（自然科学版）,2019,38(5):463-471.
3江涛,王新杰.基于卷积神经网络的高分二号影像林分类型分类[J].北京林业大学学报,2019,41(9):20-29. 被引量：6
4王菲,杨秋菊.基于卷积神经网络的极光图像分类[J].极地研究,2018,30(2):123-131.
5崔璐,张鹏,车进.基于深度神经网络的遥感图像分类算法综述[J].计算机科学,2018,45(B06):50-53. 被引量：24
6马凯,罗泽.基于卷积神经网络的青海湖区域遥感影像分类[J].计算机系统应用,2018,27(9):137-142. 被引量：5
7王传立,张晓芳,唐鼐,袁梦,文益君,郭瑞.基于多核极限学习机的遥感影像林地信息提取[J].中南林业科技大学学报,2018,38(9):20-25. 被引量：7
8王斌,范冬林.深度学习在遥感影像分类与识别中的研究进展综述[J].测绘通报,2019(2):99-102. 被引量：48
9贾云侠,韩晋.基于深度卷积神经网络的遥感影像分类研究[J].企业科技与发展,2018,0(3):123-124.
10方芳.基于神经网络算法的大数据分析方法研究[J].软件工程,2018,21(9):34-36. 被引量：5

1王豪洋,田茂义,俞家勇.超轻量级点云分类网络[J].计算机应用,2024,44(S01):65-70.
2赵良瑾,卢宛萱,于泓峰,孙显.基于组合优化的遥感图文检索轻量化[J].指挥与控制学报,2024,10(2):146-153.
3卓成华.退休将军:要“充电”,才能“放电”[J].家庭,2023(19):19-21.
4范佳欣.浅谈政府单位云平台升级改造思路[J].计算机产品与流通,2024(2):18-20.
5福建省:建设省级“运管服”平台,提升城市管理现代化水平[J].中国建设信息化,2024(15):14-17.
6罗雪锋.数据中台背景下电网企业固定资产管理优化探究[J].西部财会,2024(8):55-57.
7滕达,杨凌.美军NC3系统的发展观瞻[J].中国军转民,2024(13):53-55.
8王贵峰,袁昕,姜云辉,王建飞,林志芳.一种新型双端口三电平变换器[J].电力工程技术,2024,43(4):217-225.
9吴偲琪,金成瑞.价值共创理论视角下数智文娱型企业的生态系统构建之路——基于顺网科技的案例分析[J].金融,2024,14(4):1248-1257.
10申卫星.论数据来源者权[J].比较法研究,2024(4):104-117.

高技术通讯

2024年第7期

浏览历史

内容加载中请稍等...

基于片上系统的可配置卷积神经网络加速器的设计与实现

参考文献3

二级参考文献6

共引文献43

相关作者

相关机构

相关主题

浏览历史