面向内存受限设备的新型卷积计算方法被引量：3

A novel convolution calculation algorithm on memory-limited devices

下载PDF

导出

摘要针对卷积神经网络预测过程中内存使用量大,难以部署在内存受限设备上的问题,提出一种面向内存受限设备的新型卷积计算方法。该方法对输入矩阵中部分数据进行卷积计算,并将计算结果存储在临时内存;然后,将临时内存中的计算结果复制到输入矩阵不再使用的内存并重复上述步骤,从而实现对输入矩阵的卷积计算;最后,对单个卷积计算和LeNet进行验证。实验结果表明,该方法计算速度较直接卷积方法更快,且相比im2col、MEC和直接卷积方法,单个卷积计算内存平均使用量分别下降89.29%、82.60%和57.15%,LeNet内存使用量分别下降89.90%、82.21%和28.07%,有效降低了卷积神经网络的内存使用量,有助于在内存受限设备上部署使用。 In the prediction process of convolutional neural network,the memory consumption is large and it is difficult to deploy on memory-limited devices.This paper presents a novel convolution calculation algorithm for memory-limited devices.In this method,part of data in the input matrix is convolved and the result is stored in the temporary memory.Then,the calculation result in the temporary memory is copied to the memory no longer used by the input matrix and the above steps are repeated,so as to realize the convolution calculation of the input matrix.Finally,the single convolution calculation and LeNet are verified.The experimental results show that the average memory usage of single convolution calculation is reduced by 89.29%,82.60% and 57.15%,and the memory usage of LeNet is reduced by 89.90%,82.21% and 28.07% compared with im2col,MEC and direct convolution methods,respectively,when the calculation speed is faster than that of direct convolution method.It effectively reduces the memory usage of convolutional neural networks,which is helpful for the deployment on memory-limited devices.

作者孙雁飞王子牛孙莹亓晋董振江 SUN Yanfei;WANG Ziniu;SUN Ying;QI Jin;DONG Zhenjiang(School of Internet of Things,Nanjing University of Posts and Telecommunications,Nanjing 210003,China;Jiangsu HPC and Intelligent Processing Engineer Research Center,Nanjing University of Posts and Telecommunications,Nanjing 210023,China;College of Automation&College of Artificial Intelligence,Nanjing University of Posts and Telecommunications,Nanjing 210023,China;School of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing 210023,China)

机构地区南京邮电大学物联网学院南京邮电大学江苏省高性能计算与智能处理工程研究中心南京邮电大学自动化学院、人工智能学院南京邮电大学计算机学院

出处《南京邮电大学学报（自然科学版）》北大核心 2022年第5期54-61,共8页 Journal of Nanjing University of Posts and Telecommunications：Natural Science Edition

基金国家自然科学基金(62172235) 中国博士后基金(2019M651923) 江苏省自然科学基金(BK20191381)资助项目。

关键词深度学习卷积计算内存优化数据复用边缘设备 deep learning convolution calculation memory optimization data reuse edge device

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1张索非,冯烨,吴晓富.基于深度卷积神经网络的目标检测算法进展[J].南京邮电大学学报（自然科学版）,2019,39(5):72-80. 被引量：29
2李爽,赵荣彩,王磊.面向申威1621通用矩阵乘算法的实现与优化[J].计算机科学,2021,48(S02):699-704. 被引量：1
3黄春,姜浩,全哲,左克,何楠,刘文超.面向深度学习的批处理矩阵乘法设计与实现[J].计算机学报,2022,45(2):225-239. 被引量：5
4方玉玲,陈庆奎.基于矩阵转换的卷积计算优化方法[J].计算机工程,2019,45(7):217-221. 被引量：2
5童敢,黄立波.Winograd快速卷积相关研究综述[J].计算机科学与探索,2022,16(5):959-971. 被引量：3
6王济民,魏怡,周宇,孙傲,刘源升.基于LeNet-5卷积神经网络和颜色特征的限速标志识别[J].计算机科学,2021,48(S02):345-350. 被引量：8

二级参考文献7

1蒋孟奇,张云泉,宋刚,李玉成.GOTOBLAS一般矩阵乘法高效实现机制的研究[J].计算机工程,2008,34(7):84-86. 被引量：8
2刘昊,刘芳芳,张鹏,杨超,蒋丽娟.基于申威1600的3级BLAS GEMM函数优化[J].计算机系统应用,2016,25(12):234-239. 被引量：10
3李传朋,秦品乐,张晋京.基于深度卷积神经网络的图像去噪研究[J].计算机工程,2017,34(3):253-260. 被引量：57
4周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1781
5王晓晖,盛斌,申瑞民.基于深度学习的深度图超分辨率采样[J].计算机工程,2017,43(11):252-260. 被引量：4
6刘仲,田希.面向多核向量处理器的矩阵乘法向量化方法[J].计算机学报,2018,41(10):2251-2264. 被引量：9
7张文炽,陈黎辉,吴炜,杨晓敏,严斌宇.基于卷积神经网络特征融合的交通标志识别[J].计算机应用,2019,39(A01):21-25. 被引量：12

共引文献42

1汪占琪,柴双进,姚今衡.天津市国有农场体制改革问题探讨[J].中国农垦经济,2000(6):8-9.
2冯烨,张索非,吴晓富.面向目标检测的SSD网络轻量化设计研究[J].信号处理,2020,36(5):756-762. 被引量：3
3胡伏原,李林燕,尚欣茹,沈军宇,戴永良.基于卷积神经网络的目标检测算法综述[J].苏州科技大学学报（自然科学版）,2020,37(2):1-10. 被引量：20
4毛雪宇,彭艳兵.基于通道裁剪的YOLOv3模型[J].电子设计工程,2020,28(16):137-141. 被引量：3
5张琛,张玉安,孟乔.基于改进YOLOv3的道路目标检测[J].青海大学学报,2020,38(6):34-40. 被引量：2
6刘德儿,唐武,陈增辉,赵尘.改进的SSD算法用于盲人户外出行多尺度障碍检测[J].江西理工大学学报,2021,42(1):87-97. 被引量：3
7高强,汪梦闪.基于深度学习算法的航拍绝缘子检测[J].电工技术,2021(3):1-4. 被引量：4
8李杰,孙闽红,仇兆炀.时频域重叠多信号智能检测方法研究[J].信号处理,2021,37(5):878-884. 被引量：3
9林本丰,王呈,孙悦程.融合LSD算法与深度学习的开关状态检测方法[J].计算机工程与应用,2021,57(17):181-189. 被引量：2
10刘天宇,陈晔,刘雪峰.基于NAO机器人的智能抓取技术[J].电子设计工程,2021,29(22):184-188. 被引量：1

同被引文献25

1张烁,罗其友,马力阳.我国马铃薯区域格局演变及其影响因素分析[J].中国农业大学学报,2020,25(12):151-160. 被引量：17
2郑冠楠,谭豫之,张俊雄,李伟.基于计算机视觉的马铃薯自动检测分级[J].农业机械学报,2009,40(4):166-168. 被引量：66
3徐小龙,蒋焕煜,杭月兰.热红外成像用于番茄花叶病早期检测的研究[J].农业工程学报,2012,28(5):145-149. 被引量：23
4李小龙,王库,马占鸿,王海光.基于热红外成像技术的小麦病害早期检测[J].农业工程学报,2014,30(18):183-189. 被引量：29
5赵喜玲.步态与人脸融合的身份识别方法[J].信阳师范学院学报（自然科学版）,2017,30(3):460-463. 被引量：3
6李小薪,梁荣华.有遮挡人脸识别综述:从子空间回归到深度学习[J].计算机学报,2018,41(1):177-207. 被引量：62
7汪成龙,陈广财,陈国壮.基于OpenCV的畸形马铃薯识别方法[J].湖南农业科学,2018(4):85-87. 被引量：5
8刘晓芳,周航,韩权,昝孟恩,韩丹.基于视觉的步态识别研究综述[J].小型微型计算机系统,2018,39(8):1685-1692. 被引量：9
9李玲玲.人脸识别和步态识别技术融合的必要性[J].电脑知识与技术,2018,14(10):187-188. 被引量：5
10郑志强,刘妍妍,潘长城,李国宁.改进YOLO V3遥感图像飞机识别应用[J].电光与控制,2019,26(4):28-32. 被引量：45

引证文献3

1霍智勇,魏俊宇,郭权,陈奕杭.基于3D卷积神经网络的MPI新视点合成算法[J].南京邮电大学学报（自然科学版）,2023,43(5):77-82. 被引量：1
2韩鑫,徐衍向,封润泽,刘天旭,白京波,兰玉彬.基于红外热成像和改进YOLO v5的作物病害早期识别[J].农业机械学报,2023,54(12):300-307. 被引量：1
3沈澍,张文昊,王汝传,沙超,丁浩.人脸和步态特征注意力融合的身份识别方法[J].小型微型计算机系统,2024,45(7):1695-1701.

二级引证文献2

1孙希霞,邓林威,潘甦.基于梯度注意力机制与交叉神经网络的红外与可见光图像融合[J].南京邮电大学学报（自然科学版）,2024,44(3):17-25.
2翟肇裕,张梓涵,徐焕良,王海清,陈曦,杨陈敏.YOLO算法在动植物表型研究中应用综述[J].农业机械学报,2024,55(11):1-20.

1聂道洋,肖安,夏侯杰.基于改进卷积技术的雷达回波图像质量控制方法研究[J].暴雨灾害,2022,41(5):598-606. 被引量：2
2阮顺领,李少博,卢才武,顾清华.多尺度特征融合的露天矿区道路负障碍检测[J].煤炭学报,2021,46(S02):1170-1179. 被引量：8

南京邮电大学学报（自然科学版）

2022年第5期

浏览历史

内容加载中请稍等...

面向内存受限设备的新型卷积计算方法被引量：3

参考文献6

二级参考文献7

共引文献42

同被引文献25

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

面向内存受限设备的新型卷积计算方法 被引量：3

参考文献6

二级参考文献7

共引文献42

同被引文献25

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

面向内存受限设备的新型卷积计算方法被引量：3