一种简洁高效的加速卷积神经网络的方法被引量：16

A Concise and Efficient Method for Accelerating Convolution Neural Networks

下载PDF

导出

摘要卷积神经网络是机器学习领域一种广泛应用的方法,在深度学习中发挥着重要的作用。由于卷积神经网络一般需要多个层,而且训练数据通常都很大,所以网络训练可能需要几小时甚至很多天。目前虽然有一些利用GPU加速卷积神经网络训练的研究成果,但基本上都是实现方式复杂,需要技巧很高,而且容易出错。提出了一种简洁、高效的加速卷积神经网络训练的方法,其主要过程是将卷积层展开,这样卷积层和全连接层的主要训练步骤都可以用矩阵乘法表示;再利用BLAS库高效计算矩阵乘法。这种方法不需要过多考虑并行处理的细节和处理器的内核特点,在CPU和GPU上都能加速。实验证明,GPU上使用该方法比传统的CPU上的实现快了100多倍。 Convolutional neural networks（ CNN） is a good methods in machine learning,it plays an important role in deep learning. As CNN usually have several layers and large training data,network training can take several hours or even several days. At present,although some research of GPU accelerated CNN training have been published,but their implementations are basically complex,with great skill,and prone to error. A concise and efficient method for accelerating CNN training is proposed. The main process is convolutional layer unrolling,this make the training process of convolutional layer and fully connected layer can be represented by matrix multiplication,and accelerated using BLAS libraries. This method does not require much consideration of the details of the processor and parallel processing,and can be accelerated on CPU and GPU. Experiments show that this method on the GPU performs 100 more times faster than traditional CPU implementation.

作者刘进锋

机构地区宁夏大学数学计算机学院

出处《科学技术与工程》北大核心 2014年第33期240-244,共5页 Science Technology and Engineering

基金宁夏自然科学基金(NZ12163)资助

关键词卷积神经网络卷积展开矩阵乘法 CUDA BLAS convolutional neural networks convolution unrolling Matrix multiplication CUDA BLAS

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献98

1陈建,张明.主成分分析在水利工程评标中的应用[J].科技资讯,2008,6(5). 被引量：2
2武翠荣,李权才,毕国进.基于FFT线卷积计算及MATLAB实现[J].华电技术,2006,29(9):73-76. 被引量：1
3周献中,史迎春,王韬.基于HSV颜色空间加权Hu不变矩的台标识别[J].南京理工大学学报,2005,29(3):363-367. 被引量：11
4任玉珑,唐道鸿.投标报价中报高率确定的支持向量机方法研究[J].科技管理研究,2006,26(11):237-241. 被引量：6
5水小妮,井海宁.建筑工程投标价格的合理确定[J].商场现代化,2007(04Z):171-171. 被引量：1
6邓兵,陶然,王越.线性正则变换的卷积定理及其应用[J].中国科学（E辑）,2007,37(4):544-554. 被引量：7
7王雪青,喻刚,孟海涛.基于GA改进BP神经网络的建设工程投标报价研究[J].土木工程学报,2007,40(7):93-98. 被引量：35
8朱宇航.基于FFT的离散卷积算法[J].自动化技术与应用,2007,26(8):32-33. 被引量：1
9张朝勇,王卓甫,邢会歌.基于Choquet模糊积分的工程投标风险评估方法[J].土木工程学报,2007,40(10):98-104. 被引量：18
10LECUN Y, BOTI'OU L, ORR G B. Efficient backprop, neu- ral networks: tricks of the trade [ M ]. Berlin Heidelberg: Springer, 1998.

引证文献16

1许子立,姚剑敏,郭太良.基于递进卷积神经网络的台标识别及其并行化[J].电视技术,2016,40(5):67-73. 被引量：5
2曲景影,孙显,高鑫.基于CNN模型的高分辨率遥感图像目标识别[J].国外电子测量技术,2016,35(8):45-50. 被引量：90
3周英.中国企业参与国外大型工程投标的多目标决策研究[J].中国软科学,2016(12):154-162. 被引量：2
4雷鸣,刘传才.改进的基于深度卷积网的图像匹配算法[J].计算机系统应用,2017,26(1):168-174. 被引量：2
5郭晓洁,陈良,沈长青,刘承建.自适应深度卷积神经网络在人脸识别上的应用[J].自动化技术与应用,2017,36(7):72-77. 被引量：11
6侯一民,周慧琼,王政一.深度学习在语音识别中的研究进展综述[J].计算机应用研究,2017,34(8):2241-2246. 被引量：81
7邓长银,张杰.基于改进LeNet-5模型的手写数字识别[J].信息通信,2018,31(1):109-112. 被引量：19
8汪成龙,黄余凤,庄学敏,谢珩.基于深度学习的马铃薯畸形检测方法研究[J].惠州学院学报,2018,38(3):61-66. 被引量：1
9吴禄慎,常参参,王晓辉,陈华伟.基于局部调节卷积神经网络的图像识别方法[J].计算机工程,2018,44(12):240-246. 被引量：6
10王雪丽.基于卷积神经网络的双目测距研究[J].电子质量,2019,0(10):1-3. 被引量：4

二级引证文献233

1师庆科,郑涛.大型三甲医院患者智能随访语音平台设计与应用[J].中国数字医学,2021,16(8):22-27. 被引量：11
2朱梦帆,汪志成,戴诗柏.基于语谱图与稠密卷积神经网络的性别与年龄识别研究[J].仪表技术,2022(1):66-70. 被引量：3
3王铁君,王维兰.基于本体的唐卡图像标注方法[J].吉林大学学报（工学版）,2020,50(1):289-296. 被引量：2
4何海洋,路玉,乔保军.一种改进Octave神经网络的图像识别模型[J].河南大学学报（自然科学版）,2020(6):700-706.
5王立刚,张志佳,李晋,范莹莹,刘立强.基于卷积神经网络的LED灯类字体数字识别[J].电子测量与仪器学报,2020(11):148-154. 被引量：8
6杨秀芳,陈卓,王驰.基于隐Markov模型的齿轮箱故障识别方法研究[J].电子测量与仪器学报,2020,32(11):115-123. 被引量：6
7黄雨秋,王敬东,赵若辰,杨双.车型识别中感兴趣区域选择方法研究[J].电子测量技术,2020,43(11):102-106. 被引量：1
8李明节,陶洪铸,许洪强,刘金波,张强,张伟.电网调控领域人工智能技术框架与应用展望[J].电网技术,2020,44(2):393-400. 被引量：77
9唐杰,钱进,张涛.基于深度卷积神经网络的汽轮机转子故障诊断[J].智能计算机与应用,2023,13(8):120-124.
10徐英卓,梁学斌.基于深度神经网络的手写数字识别方法研究[J].智能计算机与应用,2020(8):24-25. 被引量：2

1董原生,杜亮,罗九林,杨念宏.装甲装备战场抢修虚拟训练系统设计[J].车辆与动力技术,2011(1):60-63. 被引量：1
2刘林,喻国平.基于自组织特征映射(SOM)网络对潜在客户的挖掘[J].南昌大学学报（理科版）,2006,30(5):507-510. 被引量：2
3张海南,李佩洁,何改云.人工神经网络在液压泵故障诊断中的实现[J].机床与液压,2001,29(4):149-150. 被引量：1
4庄燕.谈用递进法训练汉字录入[J].职业教育研究,2004(7):99-100.
5田大东,邓伟.改进的K均值聚类算法在支持矢量机中的应用[J].计算机工程与应用,2007,43(32):161-163. 被引量：3
6张雪芹,顾春华,吴吉义.异常检测中支持向量机最优模型选择方法[J].电子科技大学学报,2011,40(4):559-563. 被引量：8
7周金荣,黄道,蒋慰孙.一种新型神经网络结构模型的应用研究[J].自动化学报,1996,22(4):436-442. 被引量：1
8王禹,袁楚明,陈幼平.BP神经网络在非接触测量路径规划中的应用[J].机械与电子,2012,30(9):35-39. 被引量：3
9明道洋,孙宗芹.基于BP神经网络的英语ICAI慕课系统设计与实现[J].软件工程,2016,19(5):41-44. 被引量：3
10郭璇,杨晓元,刘佳,韩鹏.基于遗传算法和一类SVM的隐秘图像检测方案[J].计算机工程与应用,2007,43(20):37-39. 被引量：1

科学技术与工程

2014年第33期

浏览历史

内容加载中请稍等...

一种简洁高效的加速卷积神经网络的方法被引量：16

同被引文献98

引证文献16

二级引证文献233

相关作者

相关机构

相关主题

浏览历史

一种简洁高效的加速卷积神经网络的方法 被引量：16

同被引文献98

引证文献16

二级引证文献233

相关作者

相关机构

相关主题

浏览历史

一种简洁高效的加速卷积神经网络的方法被引量：16