基于混合架构的卷积神经网络算法加速研究被引量：3

Research on Acceleration of Convolutional Neural Network Algorithm Based on Hybrid Architecture

下载PDF

导出

摘要具有优越性能的卷积神经网络算法已得到广泛应用,但其参数量大、计算复杂、层间独立性高等特点也使其难以高效地部署在较低功耗和较少资源的边缘场景。为此结合该种算法的特点提出了一种基于混合架构的卷积神经网络计算加速方法,该方法选用CPU加FPGA的混合架构,对网络模型进行了压缩优化;在FPGA上通过指令控制数据流的DSP阵列结构实现了卷积计算加速;通过YOLO算法测试了该方法的加速性能,在7 000万门级FPGA上各类资源消耗低于50%且总功耗为7.36 W的情况下,吞吐率达到了120 GOPS。 Convolutional neural network algorithms with superior performance have a wide range of application, but their large parameters, complex calculations, and high inter-layer independence make it difficult to efficiently deploy in edge scenarios with lower power consumption and fewer resources. For this reason, this article combines the characteristics of this algorithm and proposes a convolutional neural network computing acceleration method based on a hybrid architecture. This method uses a hybrid architecture of CPU and FPGA. The network model is compressed and optimized. Instructions are passed on the FPGA. The DSP array structure that controls the data flow realizes the acceleration of the convolution calculation. The acceleration performance of the method is tested through the YOLO algorithm. The consumption of various resources on the 70 million gate-level FPGA is less than 50% and the total power consumption is 7.36 W. In this case, the throughput rate reaches 120 GOPS.

作者郭子博高瑛珂胡航天弓铎刘凯吴宪云 GUO Zibo;GAO Yingke;HU Hangtian;GONG Duo;LIU Kai;WU Xianyun(School of Computer Science and Technology,Xidian University,Xi’an 710071,China;Beijing Institute of Control Engineering,Beijing 100089,China;School of Communication Engineering,Xidian University,Xi’an 710071,China)

机构地区西安电子科技大学计算机科学与技术学院北京控制工程研究所西安电子科技大学通信工程学院

出处《计算机工程与应用》 CSCD 北大核心 2022年第6期88-94,共7页 Computer Engineering and Applications

基金国家自然科学基金(61850410523)。

关键词现场可编程门阵列(FPGA) 卷积神经网络 DSP脉冲阵列 field programmable gate array(FPGA) convolutional neural network(CNN) digital signal process(DSP)pulse array

分类号 TP302.1 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1胡航天,刘凯,马士超,郭子博.专用指令集在基于FPGA的神经网络加速器中的应用[J].空间控制技术与应用,2020,46(3):36-41. 被引量：4

二级参考文献4

1陈智勇.基于FPGA的流水线微处理器设计[J].微计算机信息,2009,25(5):173-175. 被引量：2
2马飞,刘琦,包斌.基于FPGA的AXI4总线时序设计与实现[J].电子技术应用,2015,41(6):13-15. 被引量：25
3杨晋生,李亚洲.一种基于模块化神经网络的场强预测方法[J].小型微型计算机系统,2017,38(11):2423-2426. 被引量：5
4孙永杰.寒武纪:独创AI指令集云、端战略并行[J].通信世界,2018,0(13):27-27. 被引量：4

共引文献3

1梅继林,杨隆兴,孙自浩,陆顺,邢琰,姜甜甜,胡瑜.面向资源受限无人系统的深度神经网络轻量化软件设计与应用[J].空间控制技术与应用,2021,47(6):9-18. 被引量：2
2蔡晓军,栾峻峰,申兆岩,赵梦莹,于东晓,李永明,贾智平.面向冯·诺依曼计算机的指令执行虚拟仿真设计与探讨[J].实验技术与管理,2022,39(5):89-93. 被引量：4
3璩泽旭,方火能,肖化超,张佳鹏,袁玉,张超.一种基于深度学习的光学遥感影像在轨目标检测方法[J].空间控制技术与应用,2022,48(5):105-115. 被引量：4

同被引文献17

1吴艳霞,梁楷,刘颖,崔慧敏.深度学习FPGA加速器的进展与趋势[J].计算机学报,2019,42(11):2461-2480. 被引量：57
2郭敏钢,宫鹤.基于Tensorflow对卷积神经网络的优化研究[J].计算机工程与应用,2020,56(1):158-164. 被引量：18
3时庆涛,朱兴宇,于超.多光谱图像纹理特征数据挖掘方法仿真[J].计算机仿真,2020,37(2):247-250. 被引量：5
4凌晨,张鑫彤,马雷.基于Mask R-CNN算法的遥感图像处理技术及其应用[J].计算机科学,2020,47(10):151-160. 被引量：16
5李娜,顾庆,姜枫,郝慧珍,于华,倪超.一种基于卷积神经网络的砂岩显微图像特征表示方法[J].软件学报,2020,31(11):3621-3639. 被引量：9
6岳根霞.基于遗传算法的多模态病变图像关联挖掘仿真[J].计算机仿真,2021,38(2):225-229. 被引量：6
7杨培伟,周余红,邢岗,田智强,许夏瑜.卷积神经网络在生物医学图像上的应用进展[J].计算机工程与应用,2021,57(7):44-58. 被引量：23
8王耀领,王宏琦,许滔.CGAN样本生成的遥感图像飞机识别[J].中国图象图形学报,2021,26(3):663-673. 被引量：5
9董旭彬,赵清华.改进Mask R-CNN在航空影像目标检测的研究应用[J].计算机工程与应用,2021,57(8):133-144. 被引量：8
10韦越,陈世超,朱凤华,熊刚.基于稀疏正则化的卷积神经网络模型剪枝方法[J].计算机工程,2021,47(10):61-66. 被引量：14

引证文献3

1马嘉翔,宋晓宁.基于彩票假设的软剪枝算法[J].计算机工程,2023,49(5):97-104.
2张雨豪,叶有时,彭宇,张德正,阎之泓,王东.一种基于FPGA的深度神经网络硬件加速器系统[J].空间控制技术与应用,2024,50(2):83-92.
3郭红建,赵燕飞.一种传感图像特征快速挖掘算法设计[J].传感技术学报,2024,37(5):869-876.

1张景东,葛页,赵明旭,刘帆,郭倩倩.相控阵雷达增程扩容系统设计与实现[J].测控技术,2020,39(5):86-90. 被引量：2
2《电脑爱好者》编辑部.写在新平台碰撞之前浅析2022年笔记本的选购思路[J].电脑爱好者,2022(6):4-12.
3李学敏,黄海宁,李宇,叶青华,张扬帆,韦琳哲.宽带高分辨DOA估计的CPU-CUDA协同实现[J].网络新媒体技术,2020,9(5):9-14. 被引量：1
4吕文韬,秦启茂,周泰武.空调交流接触器电寿命试验的加速方法研究[J].制冷与空调,2022,22(3):33-35.
5李强,武文波,何明一.基于MPSoC的遥感图像目标检测算法硬件加速研究[J].航天返回与遥感,2022,43(1):58-68. 被引量：6
6王光辉.OBE理念下工程项目管理课程教学改革[J].西部素质教育,2022,8(6):131-133. 被引量：5
7贾志国,潘红,张丽.4种鲜食坚果营养成分比较分析[J].贵州农业科学,2022,50(3):103-108. 被引量：2
8雷晨,何乐生,王威廉.APSoC心音辅助诊断算法硬件加速方法[J].计算机工程与设计,2022,43(3):661-667. 被引量：1
9王淑玮,李燕,杨瑛.2种染色方法对高透氧化锆陶瓷半透明性的影响[J].南昌大学学报（医学版）,2022,62(1):69-72.
10叶煜,李敏,文燕.农业类大数据分类预测算法研究[J].计算机与数字工程,2022,50(3):468-470.

计算机工程与应用

2022年第6期

浏览历史

内容加载中请稍等...

基于混合架构的卷积神经网络算法加速研究被引量：3

参考文献1

二级参考文献4

共引文献3

同被引文献17

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于混合架构的卷积神经网络算法加速研究 被引量：3

参考文献1

二级参考文献4

共引文献3

同被引文献17

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于混合架构的卷积神经网络算法加速研究被引量：3