基于Dopout与ADAM优化器的改进CNN算法被引量：104

Modified CNN algorithm based on Dropout and ADAM optimizer

导出

摘要在分析当前卷积神经网络模型特征提取过程中存在问题的基础上,提出了基于Dropout与ADAM优化器的改进卷积神经网络算法（MCNN-DA）.设计了二次卷积神经网络结构,通过引入基于Re LU的激活函数以避免梯度消失问题,提高收敛速度;通过在全连接层和输出层之间加入Dropout层解决过拟合问题,并设计了ADAM优化器的最小化交叉熵.以MNIST和HCL2000数据集为测试数据,测试分析了ADAM优化器的不同学习率对算法性能的影响,得出当学习率处于0.04~0.08时,算法具有较好的识别性能.与三种算法的实验比较结果表明：本文算法的平均识别率最高可达99.21%;对于HCL2000测试集,本文算法的平均识别率比基于支持向量机优化的极速学习机算法提高了3.98%. A modified convolution neural network（CNN） algorithm was proposed based on Dropout and adaptive moment estimation（ADAM） optimizer（MCNN-DA） by analyzing the problems of CNN in extracting the convolution feature.A quadratic convolution neural network structure was designed for MCNN-DA,and Re LU was adopted as the activation function to avoid the vanishing gradient problem and accelerate the convergence.Focusing on the over-fitting problem,the algorithm employed an ADAM optimizer to minimize the cross entropy,which was implemented by inserting a Dropout layer into the all-connected layer and the output layer.Datasets MNIST and HCL2000 were used as the benchmark data,and the performance of ADAM optimizer was analyzed under different learning parameters,which shows that the proposed algorithm has better recognition performance when the learning rate is set to 0.04~0.08.Statistic results compared with three kinds of algorithms show that for the benchmark MNIST,the MCNN-DA exhibits high recognition rate of 99.21%;compared with reduced extreme learning machine algorithm optimized with support vector machine,the proposed algorithm＇s average increase of recognition rate is 3.98% for the benchmark HCL2000.

作者杨观赐杨静李少波胡建军 Yang Guanci;Yang Jing;Li Shaobo;Hu Jianjun(Key Laboratory of Advanced Manufacturing Technology of Ministry of Education,Guizhou University,Guiyang 550003,China;Department of Computer Science and Engineering,University of South Carolina,Columbia 29208,USA)

机构地区贵州大学现代制造技术教育部重点实验室美国南卡罗莱纳州大学计算机科学与工程系

出处《华中科技大学学报（自然科学版）》 EI CAS CSCD 北大核心 2018年第7期122-127,共6页 Journal of Huazhong University of Science and Technology(Natural Science Edition)

基金国家自然科学基金资助项目(61640209) 贵州省科技计划资助项目(黔科合人字(2015)13号,黔科合LH字[2016]7433号) 贵州省科技厅基础平台计划资助项目(黔科合平台人才[2018]5702)

关键词卷积神经网络激活函数梯度消失 ADAM优化器梯度饱和问题 convolution neural network activate function gradient disappearence ADAM optimizer vanishing gradient problem

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1628
2张雨浓,曲璐,陈俊维,刘锦荣,郭东生.多输入Sigmoid激励函数神经网络权值与结构确定法[J].计算机应用研究,2012,29(11):4113-4116. 被引量：21
3郝红卫,蒋蓉蓉.基于最近邻规则的神经网络训练样本选择方法[J].自动化学报,2007,33(12):1247-1251. 被引量：37
4罗鹏,李会方.基于Tanh多层函数的量子神经网络算法及其应用的研究[J].计算机与数字工程,2012,40(1):4-6. 被引量：3
5申丰山,王黎明,张军英.基于SVM技术的精简极速学习机[J].华中科技大学学报（自然科学版）,2014,42(6):107-110. 被引量：6
6石祥滨,房雪键,张德园,郭忠强.基于深度学习混合模型迁移学习的图像分类[J].系统仿真学报,2016,28(1):167-173. 被引量：61

二级参考文献50

1梁化楼,戴贵亮.人工神经网络与遗传算法的结合：进展及展望[J].电子学报,1995,23(10):194-200. 被引量：71
2李飞,赵生妹,郑宝玉.量子神经网络及其在CDMA多用户检测中的应用[J].信号处理,2005,21(6):555-559. 被引量：6
3BISHOP C M. Neural networks for pattern recognition [ M ]. New York : Oxford University Press, 1995.
4张青贵.人工神经网络导论[M].北京:高等教育出版社,1992.
5HUANG Guang-bing, ZHU Yu-qin, SIEW C K. Extreme learning machine : theory and applications [ J ]. Neurocomputing, 2006,70 ( 1-3 ) :489-501.
6张雨浓,杨逸文,李巍.神经网络网络权值直接确定法[M].广州:中山大学出版社,2010.
7YU Hao, WILAMOWSK B M. Levenberg-Marquardt training[ J ]. Intelligent Systems,2010 ( 12 ) : 1 - 6.
8HUANG Guang-bing, CHEN Lei, SIEW C K. Universal approximation using incremental constructive feedforward networks with random hidden nodes[J]. [EEE Trans on Neural Networks,2006,17(4) : 879- 883,.
9Femdndez-Delgado M, Cemadas E,Barro S, et al. Dowe Need Hundreds of Classifiers to Solve Real WorldClassification Problems? [J]. Journal of MachineLearning Research (SI 532-4435), 2014, 15(1):3133-3181.
10Joachims T. Making Large-scale Support VectorMachine Learning Practical [C]// Advances in kernelmethods. USA: MIT Press, 1999: 169-184.

共引文献1745

1陆文超,崔海朋.一种基于融合自编码与神经网络的协同过滤算法[J].中国水运（下半月）,2022,22(3):18-20.
2杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
3陆天和,刘莉,贺云涛,杨盾.多无人机航迹规划算法及关键技术[J].战术导弹技术,2020(1):85-90. 被引量：7
4林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：20
5陈仁祥,张勇,杨黎霞,陈才,徐向阳.基于整周期数据和卷积神经网络的谐波减速器健康状态评估[J].仪器仪表学报,2020,41(2):245-252. 被引量：20
6鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：12
7谭宇辰,蔡晶晶,倪辰.基于深度学习的Web攻击检测技术研究[J].信息网络安全,2020(S02):122-126.
8任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321.
9胡伟,文武,魏敏.改进U-Net的高分辨率遥感图像轻量化分割[J].计算机系统应用,2022,31(12):135-146. 被引量：2
10李莉,陈心宇,高文斌.一种基于FPGA的卷积神经网络加速器实现方案[J].北京电子科技学院学报,2022,30(4):96-104.

同被引文献857

1李川,伍依凡,杨帅.不平衡分布的数据驱动故障诊断的研究进展[J].仪器仪表学报,2023,44(8):181-197. 被引量：1
2方立德.关注流体能源与资源准确计量,助力碳达峰与碳中和目标实现[J].仪器仪表学报,2022,43(1):1-1. 被引量：1
3谭峰,李成南,萧红,苏祖强,郑凯.基于LSTM循环神经网络的数控机床热误差预测方法[J].仪器仪表学报,2020,41(9):79-87. 被引量：43
4刘笑楠,张文云,高艳娜.局部置乱结合双随机相位编码的双虹膜身份模板保护方法[J].仪器仪表学报,2020(6):233-239. 被引量：5
5鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：12
6王健,刘雪花.基于深度可分离卷积的苹果叶病理识别[J].计算机系统应用,2020(11):190-195. 被引量：5
7张政,严哲,顾汉明.基于残差网络与迁移学习的断层自动识别[J].石油地球物理勘探,2020(5):950-956. 被引量：22
8傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：49
9李可,祁阳,宿磊,顾杰斐,苏文胜.基于改进ACGAN的钢表面缺陷视觉检测方法[J].机械工程学报,2022,58(24):32-40. 被引量：2
10汪洋,郭利进.一种新型DSCNN-GRU结构的减速机轴承故障诊断方法[J].机械科学与技术,2020,39(2):258-266. 被引量：9

引证文献104

1骆光磊,周建中,赵云发,覃晖,戴领.水库群运行的改进深度神经网络模拟方法[J].水力发电学报,2020,39(9):23-32. 被引量：7
2南晓虎,丁雷.深度学习的典型目标检测算法综述[J].计算机应用研究,2020,37(S02):15-21. 被引量：52
3杨素珍.自贡市一对山乳业总公司实行产业化经营初见成效[J].四川奶牛,2000(1):1-1.
4郜延红,周云轩,刘万崧.地球物理位场可视化建模初步探讨[J].长春科技大学学报,2000,30(2):185-189. 被引量：6
5徐杰,孙超,郭春赫.实时系统下LBP与CNN结合的人脸识别方法[J].黑龙江科技大学学报,2018,28(6):692-696. 被引量：2
6房国志,孙康瞳.多尺度YOLO人脸年龄估计方法研究[J].计算机工程与应用,2019,55(21):135-141. 被引量：7
7陈杰,张雷,张睿,解丹,闫耀东,叶子维,柴钰杰.基于卷积神经网络的掌纹识别[J].软件工程,2019,22(10):7-11. 被引量：3
8丁建立,苏现帅.基于组合式深度学习网络的混合文本情感分类[J].计算机工程与设计,2019,40(11):3254-3258. 被引量：8
9卢涛,陈冲,许若波,张彦铎.基于边缘增强生成对抗网络的人脸超分辨率重建[J].华中科技大学学报（自然科学版）,2020,48(1):87-92. 被引量：4
10费孝峰,樊嘉杰,邓亮,刘健,邢文.基于深度学习的LED车载语音交互氛围灯设计[J].照明工程学报,2020,31(1):64-69. 被引量：4

二级引证文献535

1许毅超.基于人工智能算法的河道智能监控预警系统研究及应用[J].水利科技,2023(4):29-31. 被引量：1
2张伟,李军霞,吴磊,李斌.基于1DCNN-ELM的带式输送机托辊轴承故障诊断研究[J].煤炭科学技术,2023,51(S01):383-389.
3吴国正,王发杰,程隋福,张成鑫.基于物理信息神经网络的内部声场正反问题数值计算[J].计算物理,2022,39(6):687-698. 被引量：2
4刘凯歌,韦笃取.基于WOA-ESN的电机系统混沌振荡预测[J].计算物理,2022,39(4):498-504. 被引量：1
5刘杰,夏彦卫,贾伯岩,吴国强,殷庆栋.基于高精度温度传感器的多股碳纤维导线潜伏性缺陷检测方法[J].电子测量与仪器学报,2023,37(11):65-71.
6李振鹏,董明利,于明鑫,孟凡勇,张羽飞.Encoder-Decoder LSTM网络的输电母排触点温度预测方法[J].电子测量与仪器学报,2022,36(4):32-39. 被引量：4
7姜岚,李远,智李,周蠡,赵阳.基于POD-RBF代理模型和特征点KNN校正的电力舱温度反演方法[J].电子测量技术,2023,46(24):68-76.
8汪志成,王泽旺,朱梦帆,纪荣焕,张斌.基于卷积神经网络的局部放电声音识别研究[J].电子测量技术,2023,46(20):148-155.
9董正琪,姜杰,赵雪成,杨增汪.Adam优化的BP神经网络地铁空调环境模式检测[J].电子测量技术,2022,45(24):111-117. 被引量：8
10周宇辉,何志琴.基于改进注意力机制的图像描述算法[J].智能计算机与应用,2022,12(2):58-63.

1梁雯欣.MCN模式对网红经济的推动分析——以papitube为例[J].传播力研究,2017,0(12):191-191. 被引量：8
2丁俊杰.广告的内容化[J].中国广告,2018,0(7):68-69. 被引量：4
3敖威,何玉林,黄哲学,何玉鹏.基于仿真样本生成的极速学习机泛化能力改进算法[J].南京大学学报（自然科学版）,2018,54(1):75-84.
4谢群辉,田青.权重随机正交化的极速非线性判别分析网络[J].计算机技术与发展,2018,28(1):23-27. 被引量：2
5叶子,肖诗斌.卷积神经网络模型压缩在图像分类中的应用[J].北京信息科技大学学报（自然科学版）,2018,33(3):52-56. 被引量：3
6魏锴,毕于兵,刘媛,张云月,张琳.榆黄蘑果味复合饮料的研制[J].饮料工业,2018,21(2):44-47. 被引量：2
7田旭华,陈克安,李晗,杨立学.加筋板材料辨识的导纳特征表达与冲击声特征提取[J].声学学报,2018,43(4):699-707.
8龙羽,张建.体育器材用细晶镁合金的热处理工艺神经网络优化[J].热加工工艺,2018,47(12):234-236. 被引量：1
9邱爽,聂仁灿,周冬明,李兴叶.自归一化卷积神经网络的人脸识别方法[J].云南大学学报（自然科学版）,2018,40(4):659-664. 被引量：4
10方敏,方梦瑞,汪洋,王玉豪,吕军.基于频谱的茶叶种类识别方法研究[J].黄山学院学报,2018,20(3):23-25. 被引量：2

华中科技大学学报（自然科学版）

2018年第7期

浏览历史

内容加载中请稍等...

基于Dopout与ADAM优化器的改进CNN算法被引量：104

参考文献6

二级参考文献50

共引文献1745

同被引文献857

引证文献104

二级引证文献535

相关作者

相关机构

相关主题

浏览历史

基于Dopout与ADAM优化器的改进CNN算法 被引量：104

参考文献6

二级参考文献50

共引文献1745

同被引文献857

引证文献104

二级引证文献535

相关作者

相关机构

相关主题

浏览历史

基于Dopout与ADAM优化器的改进CNN算法被引量：104