基于FPGA的卷积神经网络加速器动态余数处理映射模型

A dynamic remainder processing mapping model for convolutional neural network accelerator on FPGA

下载PDF

导出

摘要将卷积计算转化为矩阵乘法是FPGA上一种高效实现,而现有的转化方法无法根据卷积参数的不同动态调整,限制了卷积计算的并行度。提出一种新的动态余数处理映射模型。该映射模型包含有3个子模型:特征值映射模型,权值映射模型,和输出映射模型。特征值映射模型将特征值转化为特征值矩阵,权值映射模型将权值转化为权值矩阵,特征值矩阵和权值矩阵通过乘累加计算阵列得到卷积计算结果,由输出映射模型将卷积计算结果存储到内存中。在卷积计算过程中,卷积的输出通道数通常不是乘累加计算阵列行数的整数倍,3个子映射模型会根据产生的余数动态调整映射方法,提高乘累加计算阵列的利用率。通过实验表明,采用动态余数处理映射模型能够将余数并行度的倍数至多提高到卷积核大小,使整个加速器达到了更高的实际吞吐量和能量效率。 Mapping convolutions to matrix multiplications is an efficient implementation on FPGA.However,the existing conversion methods cannot be dynamically adjusted according to different convolution parameters,which limits the parallelism of convolution calculation.This paper proposes a novel dynamic residue processing mapping model.The mapping model contains three sub-models:feature mapping model,weight mapping model,and output mapping model.The feature mapping model converts features into a feature matrix,and the weight mapping model converts weights into a weight matrix.The feature matrix and the weight matrix obtain convolution calculation results by multiply-and-accumulate array,and the convolution calculation results are stored in the memory by the output mapping model.In the process of convolution calculation,the number of output channels of the convolution is usually not an integer multiple of the number of rows of the multiply-and-accumulate array.The three sub-mapping models will dynamically adjust the mapping method according to the remaining number to increase the utilization of the multiply-accumulated array.Experiments show that using the dynamic remainder processing mapping model can increase the multiple of parallelism up to the size of the convolution kernel and achieve higher actual throughput and energy efficiency.

作者赵小强姜晶菲许金伟窦勇 ZHAO Xiao-qiang;JIANG Jing-fei;XU Jin-wei;DOU Yong(College of Computer Science and Technology,National University of Defense Technology,Changsha 410073,China)

机构地区国防科技大学计算机学院

出处《计算机工程与科学》 CSCD 北大核心 2021年第9期1521-1528,共8页 Computer Engineering & Science

基金核高基国家重大专项(2018ZX01028101) 预研项目(31513010602-1)。

关键词卷积矩阵乘法 FPGA 动态余数处理 convolution matrix multiplication FPGA dynamic remainder processing

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1李聪,潘丽丽,陈蓉玉,周燕,邵伟志.采用融合卷积网的图像分类算法[J].计算机工程与科学,2019,41(12):2179-2186. 被引量：8
2马琴,张兴忠,李海芳,邓红霞.基于谱残差和聚类法的运动目标检测研究[J].计算机工程与科学,2018,40(10):1867-1873. 被引量：5

二级参考文献12

1胡光龙,秦世引.动态成像条件下基于SURF和Mean shift的运动目标高精度检测[J].智能系统学报,2012,7(1):61-68. 被引量：6
2屈晶晶,辛云宏.连续帧间差分与背景差分相融合的运动目标检测方法[J].光子学报,2014,43(7):213-220. 被引量：112
3刘宇光,陈耀武.基于运动谱残差的视频显著性检测算法[J].计算机工程,2014,40(12):247-250. 被引量：4
4陈志勇,彭力,张纪宽.动态环境下改进五帧差分的运动目标检测新算法[J].江南大学学报（自然科学版）,2015,14(1):34-37. 被引量：9
5黄小鹏,蓝映峤.基于K-means聚类红外目标检测[J].光电技术应用,2015,30(3):29-32. 被引量：3
6杨思燕,周国庆.基于宽频调谐特征和谱残差分析的显著性目标检测[J].电子设计工程,2015,23(15):177-180. 被引量：1
7薛丽霞,罗文浩,王佐成.动态背景下基于ORB特征匹配的运动目标检测算法[J].计算机应用与软件,2015,32(10):294-297. 被引量：4
8肖春明.基于角点的动态背景下运动目标检测算法改进[J].现代电子技术,2016,39(7):66-70. 被引量：5
9陈天华,王福龙.实时鲁棒的特征点匹配算法[J].中国图象图形学报,2016,21(9):1213-1220. 被引量：17
10陈振学,贺超,刘成云.基于局部特征与全局特征的图像显著性目标检测[J].控制与决策,2016,31(10):1899-1902. 被引量：9

共引文献11

1张寅,蔡旭阳,许倩倩,闫钧华,苏恺,张琨.融合时空上下文的复杂背景下多运动目标检测[J].计算机工程与科学,2020,42(12):2186-2192. 被引量：3
2林海强.基于激光传感器的运动动作智能识别研究[J].激光杂志,2021,42(7):84-89. 被引量：1
3ZHOU Honglei,PENG Zhifei,TAO Ran,ZHANG Lu.Feature Fusion Multi_XMNet Convolution Neural Network for Clothing Image Classification[J].Journal of Donghua University(English Edition),2021,38(6):519-526. 被引量：2
4Rongyu Chen,Lili Pan,Yan Zhou,Qianhui Lei.Image Retrieval Based on Deep Feature Extraction and Reduction with Improved CNN and PCA[J].Journal of Information Hiding and Privacy Protection,2020,2(2):67-76. 被引量：2
5Yan Zhou,Lili Pan,Rongyu Chen,Weizhi Shao.A Novel Image Retrieval Method with Improved DCNN and Hash[J].Journal of Information Hiding and Privacy Protection,2020,2(2):77-86.
6李思璇,胡志刚,王新征,付东辽,祖向阳.改进人工鱼群的ORB特征匹配算法[J].计算机工程与应用,2022,58(1):292-299. 被引量：3
7孔祥魁,樊翠红.多特征融合和最小二乘支持向量机的运动视频图像分类研究[J].南京理工大学学报,2022,46(2):164-169. 被引量：3
8张睿萍,宁芊,雷印杰,陈炳才.基于改进Mask R-CNN的生活垃圾检测[J].计算机工程与科学,2022,44(11):2003-2009. 被引量：4
9梁俊欢,董峦,孙宗玖,马海燕,艾尼玩·艾买尔,阿仁,魏鹏,田聪,阿斯娅·曼力克,郑逢令.基于Mask-RCNN的无人机影像白喉乌头检测[J].草食家畜,2023(1):44-51. 被引量：1
10梁俊欢,董峦,阿斯娅·曼力克,孙宗玖,魏鹏,马海燕,艾尼玩·艾买尔,阿仁,郑逢令.基于ResNet深度残差网络的白喉乌头检测[J].草业科学,2023,40(1):144-151. 被引量：5

1郑思杰,李杰,贺光辉.面向低延时目标检测的FPGA神经网络加速器设计[J].现代计算机,2021,27(18):38-43.
2沈林耀,王琴,蒋剑飞,景乃锋.一种面向忆阻器加速器的神经网络模型压缩框架[J].微电子学与计算机,2021,38(8):20-27. 被引量：2
3吴欣欣,欧焱,李文明,王达,张浩,范东睿.基于粗粒度数据流架构的稀疏卷积神经网络加速[J].计算机研究与发展,2021,58(7):1504-1517. 被引量：7
4田莲莲,朱军,马骞,章屹然,王兆熹,陈睿.胃癌VEGF通路相关基因的预后模型的构建[J].空军医学杂志,2021,37(3):227-231. 被引量：3

计算机工程与科学

2021年第9期

浏览历史

内容加载中请稍等...

基于FPGA的卷积神经网络加速器动态余数处理映射模型

参考文献2

二级参考文献12

共引文献11

相关作者

相关机构

相关主题

浏览历史