基于脉动阵列的卷积计算模块硬件设计被引量：1

Hardware design of convolution calculation module based on systolic array

下载PDF

导出

摘要针对FPGA实现卷积神经网络中卷积计算的过程中,高并行度带来长广播、多扇入/扇出的数据通路问题,采用脉动阵列来实现卷积神经网络中卷积计算模块,将权重固定到每个处理单元中,并按照输入和输出特征图的维度来设置脉动阵列的大小,最后通过Vivado高层次综合实现卷积计算模块的硬件设计。实验结果表明,本设计在实现1级流水化时序要求的同时,具有较低的资源占用和良好的扩展性。 Aiming at the long broadcast, much fan in/fan out data path problem brought by high parullelism in the process of the Field Programmable Gate Array(FPGA) to realize the convolution computation in convolutional neural network, this paper adopts pulse array to realize convolution calculation module of convolutional neural network, fixes weights to each processing unit, according to the dimension of the input and output characteristic figure sets to pulse array size, and finally by Vivado high level synthesis real-izes convolution calculation module hardware design. The experimental results show that the design has low resource occupancy and good expansibility while realizing the time-series requirements of level 1 pipelining.

作者王春林谭克俊 Wang Chunlin;Tan Kejun(Information Science and Technology College,Dalian Maritime University,Dalian 116026,China)

机构地区大连海事大学信息科学技术学院

出处《电子技术应用》 2020年第1期57-61,共5页 Application of Electronic Technique

关键词 FPGA 脉动阵列卷积计算高层次综合 FPGA systolic array convolution computation high level synthesis

分类号 TN402 [电子电信—微电子学与固体电子学] TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1张杰,隋阳,李强,李想,董玮.基于卷积神经网络的火灾视频图像检测[J].电子技术应用,2019,45(4):34-38. 被引量：19
2陈辰,严伟,夏珺,柴志雷.基于FPGA的深度学习目标检测系统的设计与实现[J].电子技术应用,2019,45(8):40-43. 被引量：10
3王阳,陶华敏,肖山竹,戴华东.基于脉动阵列的矩阵乘法器硬件加速技术研究[J].微电子学与计算机,2015,32(11):120-124. 被引量：6

二级参考文献13

1Brown R G. Introduction to random signal analysis and Kalman filtering[M]. New York.. Wiley, 1983.
2GolubGH,VanLoanCF.矩阵计算[M].袁亚湘,译.北京:科学出版社,2011.
3Cappello J D, Strenski D. A practical measure of FP- GA floating point acceleration for High Performance Computing[C]//Proceedings of the 2003 IEEE 24th International Conference on Application-specific Sys- tems. Washington,DC: IEEE, 2013 : 160-167.
4Bensaali F, Amira A, Sotudeh R. Floating-point ma- trix product on FPGA[C]// proceedings of the IEEE/ ACS International Conference onComputer Systems and Applications, 2007 Computer Systems and Appli- cation. Amman: IEEE, 2007: 466-473.
5Kestur S, Davis J D, Chung E S. Towards a universal FPGA matrix-vector multiplication architecture[C]/// proceeding of the 2012 IEEE 20th Annual International Symposium on Field-Programmable Custom Computing Machines (FCCM). Toronto,oN:IEEE, 2012: 9-16.
6Fleming S T, Thomas D 13. Hardware acceleration of matrix multiplication over small prime finite fields[C] // proceedings of 9th international Conference on Reconofigurable Computing: archiectures tools, and ap- plictions. Berlin, Heiolelberg.-ACM,2013 : 103-114.
7田翔,周凡,陈耀武,刘莉,陈耀.基于FPGA的实时双精度浮点矩阵乘法器设计[J].浙江大学学报（工学版）,2008,42(9):1611-1615. 被引量：21
8刘沛华,鲁华祥,龚国良,刘文鹏.基于FPGA的全流水双精度浮点矩阵乘法器设计[J].智能系统学报,2012,7(4):302-306. 被引量：8
9傅天驹,郑嫦娥,田野,丘启敏,林斯俊.复杂背景下基于深度卷积神经网络的森林火灾识别[J].计算机与现代化,2016(3):52-57. 被引量：33
10林付春,刘宇红,张达峰,张荣芬.基于深度学习的智能路牌识别系统设计[J].电子技术应用,2018,44(6):68-71. 被引量：12

共引文献32

1陈红,胡恩才,白静静.交叉路口信号灯智能管理系统设计[J].机械与电子,2019,37(11):63-66. 被引量：5
2陈建国,方振国,柏雪婷.树搜索优化算法在FPGA中的应用与实现[J].佳木斯大学学报（自然科学版）,2020,38(2):48-51.
3刘占.深度学习技术在火灾图像识别中的应用[J].福建电脑,2020,36(5):1-4. 被引量：2
4汤晓芳.视频火灾自动报警系统设计[J].电子技术与软件工程,2020(9):123-125. 被引量：2
5刘欣,张灿明.基于卷积神经网络的矿井安全帽佩戴检测[J].电子技术应用,2020,46(9):38-42. 被引量：5
6陶常勇,高彦钊,王元磊,张兴明.基于RISC-V的近数据计算系统设计方法[J].火控雷达技术,2020,49(3):92-100.
7王晓宇.高水平游泳运动员训练全过程监控系统设计[J].廊坊师范学院学报（自然科学版）,2020,20(4):95-99. 被引量：1
8施懿,浦昕鑫,沈刘潼,徐也.基于卷积神经网络和关键词的目标检测系统[J].电脑知识与技术,2021,17(8):162-164.
9侯易呈,王慧琴,王可.改进的多尺度火焰检测方法[J].液晶与显示,2021,36(5):751-759. 被引量：9
10汪杨,王晓蕾,袁子昂,袁儒明.一种基于NoC多核系统的矩阵乘法映射技术[J].电子科技,2021,34(5):54-60. 被引量：1

同被引文献14

1孙孝辉,宋庆增,金光浩,姜文超.基于ARM+FPGA平台的二值神经网络加速方法研究[J].计算机应用研究,2020,37(3):779-783. 被引量：6
2陆申阳,冉峰,郭爱英,沈华明.一种用于自适应直方图均衡化的硬件加速器[J].上海大学学报（自然科学版）,2020,26(3):401-412. 被引量：3
3余浩,庄池杰,曾嵘,刘凡,谢施君.提高暂态电压测量精度的自适应小波去噪方法[J].高电压技术,2020,46(6):2139-2147. 被引量：12
4孙超,肖文名,曾乐,白金婷.海量监视数据云存储服务模型的设计与实现[J].武汉大学学报（信息科学版）,2020,45(7):1099-1106. 被引量：11
5傅成豪,潘庭龙.基于改进阈值的风机齿轮箱故障信号小波去噪方法研究[J].可再生能源,2020,38(9):1197-1202. 被引量：17
6张智,陈艳波,宋新甫,刘建琴,李高望,曾鉴,陈浩.基于多指标面板数据特征提取的同调机组分群方法[J].电力系统保护与控制,2020,48(17):27-36. 被引量：10
7蔡冬丽,钟清华,朱永升,廖金湘,韩劢之.三维输入卷积神经网络脑电信号情感识别[J].计算机工程与应用,2021,57(5):161-167. 被引量：5
8段照斌,杜海龙,张鹏.基于QAR2Vec模型的QAR数据特征提取[J].中国安全科学学报,2021,31(1):145-152. 被引量：8
9李伟,黄焱.基于峰度检验和小波包分解的海洋平台脉冲噪声处理方法研究[J].振动与冲击,2021,40(6):220-226. 被引量：7
10王飞,张多利,汪杨,王泽中,宋宇鲲.基于BP算法的片上学习CNN硬件加速器[J].合肥工业大学学报（自然科学版）,2021,44(8):1059-1064. 被引量：2

引证文献1

1危华明,廖剑平.海量数据存储中云服务器性能加速方法仿真[J].计算机仿真,2023,40(5):515-519. 被引量：1

二级引证文献1

1李泽山.改进一致性哈希优化存储邮政数据算法的研究[J].现代电子技术,2024,47(6):43-48.

1王雪丽.基于卷积神经网络的双目测距研究[J].电子质量,2019,0(10):1-3. 被引量：4
2王晓峰.Golang语言实现的流水线模型[J].电子技术与软件工程,2020(1):53-54. 被引量：3
3沈轶伦.没有名字的人[J].中学生阅读（初中读写）,2020,0(1):10-11.
4章琳,袁非牛,张文睿,曾夏玲.全卷积神经网络研究综述[J].计算机工程与应用,2020,56(1):25-37. 被引量：43
5季斌.装配式混凝土结构预制构件质量控制研究[J].工程技术研究,2019,4(20):129-130. 被引量：7
6王磊,吴孙阳,李宗佰,张品选,王春成,吕其丹.光伏组件实现单件流生产的可行性研究[J].太阳能,2019,0(11):37-40.
7陈家敏,陈向东,丁星,李皋,陈一健.动态可重构神经网络的FPGA实现及其在燃爆状态监测中的应用[J].电子设计工程,2020,28(1):1-5. 被引量：3
8范莹晖,任涛.西安外事学院智能视频监控系统融合与创新应用[J].计算机产品与流通,2019,8(11):109-110. 被引量：3
9张蓓,李松涛,钟燕辉,李晓龙,高燕龙.基于BP-PSO联合算法的沥青混合料空隙率反演计算[J].大连理工大学学报,2020,60(1):75-82. 被引量：5
10王巍,周凯利,王伊昌,王广,袁军.基于快速滤波算法的卷积神经网络加速器设计[J].电子与信息学报,2019,41(11):2578-2584. 被引量：6

电子技术应用

2020年第1期

浏览历史

内容加载中请稍等...

基于脉动阵列的卷积计算模块硬件设计被引量：1

参考文献3

二级参考文献13

共引文献32

同被引文献14

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于脉动阵列的卷积计算模块硬件设计 被引量：1

参考文献3

二级参考文献13

共引文献32

同被引文献14

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于脉动阵列的卷积计算模块硬件设计被引量：1