一种机器学习中防止过拟合的Dropout优化算法被引量：9

A Dropout Optimization Algorithm for Preventing Overfitting in Machine Learning

下载PDF

导出

摘要针对机器学习中深度神经网络训练时常见的过拟合问题,提出了一种防止过拟合的Dropout优化算法.Dropout算法是在每批次的神经网络训练中,忽略掉一定概率的特征检测器,让某些神经元暂时停止工作,减少神经元之间的相互作用,隐式去除网络中的神经元、阻止某些特征的协同作用来缓解过拟合.算法中选择被暂时丢弃的神经元是随机概率,而优化算法在神经网络中应用伊辛模型来识别链接能量较低的神经元,并在训练和推理中把这些神经元暂时丢弃掉,算法使模型泛化性更强,有效缓解网络训练过拟合问题. Aiming at the common over-fitting problem of deep neural network training in machine learning,a Dropout optimization algorithm to prevent over-fitting is proposed.The Dropout algorithm neglects some probabilistic feature detectors in each batch of neural network training,makes some neurons stop working temporarily,reduces the interaction between neurons,implicitly removes the neurons in the network,and prevents the synergy of some features to alleviate over-fitting.The selection of temporarily discarded neurons in the algorithm is random probability,while the optimization algorithm applies Ising model to identify neurons with lower link energy in the neural network,and discards these neurons temporarily in training and reasoning.The algorithm makes the model more generalized and effectively alleviates the problem of over-fitting in network training.

作者张云李岚王浩东 ZHANG Yun;LI Lan;WANG Hao-dong(School of Digital Medial,Lanzhou University of Arts and Science,Lanzhou 730000,China;Nanjing Post Distribution Center of China Post Express Logistics,Nanjing 210003,China)

机构地区兰州文理学院数字媒体学院中国邮政速递物流南京集散中心

出处《兰州文理学院学报（自然科学版）》 2019年第6期84-87,共4页 Journal of Lanzhou University of Arts and Science(Natural Sciences)

基金甘肃省高等学校科研项目(2016A-105) 甘肃省大学生创新创业训练计划项目(201611562017) 2017年教育部高教司第二批产学研协同育人项目“基于项目驱动的Java系列课程实践教学改革研究”(201702163024) 2019年甘肃省创新创业项目“基于‘多维度创新’的数字媒体技术专业教学体系研究与构建”

关键词深度神经网络过拟合神经元机器学习伊辛模型 deep neural network over-fitting neurons machine learning Ising model

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1满凤环,陈秀宏,何佳佳.改进的Dropout正则化卷积神经网络[J].传感器与微系统,2018,37(4):44-47. 被引量：10
2程俊华,曾国辉,鲁敦科,黄勃.基于Dropout的改进卷积神经网络模型平均方法[J].计算机应用,2019,39(6):1601-1606. 被引量：24
3周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1591
4任晓霞,薛凡.基于模糊邻域粗糙集的启发式属性约简算法[J].计算机工程与应用,2018,54(9):47-53. 被引量：5
5杨斌,钟金英.卷积神经网络的研究进展综述[J].南华大学学报（自然科学版）,2016,30(3):66-72. 被引量：34
6刘丹枫,刘建霞.面向深度学习过拟合问题的神经网络模型[J].湘潭大学自然科学学报,2018,40(2):96-99. 被引量：16

二级参考文献63

1Rumelhart D E, Hinton G E,Williams R J.Learning rep- resentations by back-propagating errors [ J ]. Nature, 1986,323 (6088) : 533-536.
2Bengio Y.Deep Learning of Representations:looking for- ward [ J]. Lecture Notes in Computer Science, 2013, 7978:1-37.
3Bottou L, Bengio Y, Cun Y L.Global training of document processing systems using graph transformer networks [C3//Proceedings of the IEEE Computer Society Con- ference on Computer Vision and Pattern Recognition.San Juan, Puerto Rico : IEEE, 1997:489-494.
4Hinton G E, Salakhutdinov R R. Reducing the dimension- ality of data with neural networks [ J ].Science, 2006,313 (5786) :504-507.
5Bengio Y.Learning deep architectures for AI[ M ]. Hano- ver: The Association for Computing Machinery ,2009.
6Lecun Y, Bottou L, Bengio Y, et al. Gradient based learning applied to document recognition [ J ].Proceedings of the IEEE, 1998,86 ( 11 ) : 2278-2324.
7Hinton G E, Osindero S,Yw T.A fast learning algorithm for deep belief nets [ J ]. Neural Computation, 2006, 18 (7) : 1527-1554.
8Deng L, Seltzer M, Yu D, et al. Binary coding of speech spectrograms using a deep auto-encoder [ C ]// Proceedings of the llth Annual Conference on Interna- tional Speech Communication Association. Chiba, Japan : Makuhari, 2010:1692-1695.
9He K M, Zhang X, Ren S, et al. Deep residual learning for image recognition [ C ]//Proceedings of the International Conference on Computer Vision and Pattern Recognition. Las Vegas, Nevada.IEEE, 2016 : 770-778.
10Krizhevsky A, Sutskever I, Hinton G E.Imagenet classi- fication with deep convolutional neural networks [ C ]// Proceeding of 26th Annual Conference on Neural Infor- mation Processing System. Lake Tahoe, USA: MIT Press, 2012 : 1097-1105.

共引文献1659

1陆文超,崔海朋.一种基于融合自编码与神经网络的协同过滤算法[J].中国水运（下半月）,2022,22(3):18-20.
2杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
3陆天和,刘莉,贺云涛,杨盾.多无人机航迹规划算法及关键技术[J].战术导弹技术,2020(1):85-90. 被引量：7
4林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：20
5陈仁祥,张勇,杨黎霞,陈才,徐向阳.基于整周期数据和卷积神经网络的谐波减速器健康状态评估[J].仪器仪表学报,2020,41(2):245-252. 被引量：19
6鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：11
7谭宇辰,蔡晶晶,倪辰.基于深度学习的Web攻击检测技术研究[J].信息网络安全,2020(S02):122-126.
8任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321.
9胡伟,文武,魏敏.改进U-Net的高分辨率遥感图像轻量化分割[J].计算机系统应用,2022,31(12):135-146. 被引量：2
10李莉,陈心宇,高文斌.一种基于FPGA的卷积神经网络加速器实现方案[J].北京电子科技学院学报,2022,30(4):96-104.

同被引文献93

1岑瑶,赵烜赫,潘新,郜晓晶,刘霞.基于稀疏表示和HOG特征的掌纹识别方法[J].内蒙古农业大学学报（自然科学版）,2020,41(1):76-80. 被引量：8
2万磊,佟鑫,盛明伟,秦洪德,唐松奇.Softmax分类器深度学习图像分类方法应用综述[J].导航与控制,2019,0(6):1-9. 被引量：55
3郑晓光,杨群,吕伟民.沥青路面水损害的病害特征与机理分析[J].中南公路工程,2006,31(2):96-98. 被引量：18
4张洪亮,陈拴发.沥青路面大修结构组合研究[J].公路工程,2008,33(6):60-63. 被引量：12
5徐红萍,薛冰,徐笛.肿瘤标志物CEA、NSE、CYFRA21-1联合检测在肺癌诊断中的应用[J].实用医学杂志,2010,26(16):2943-2944. 被引量：43
6蒋功雪,彭红卫,孙超林,袁海雅.湖南省高速公路沥青路面车辙病害调查与原因分析[J].公路工程,2011,36(1):1-3. 被引量：24
7乔振夫,朱华.河南省水泥砼路面病害分析与维修研究[J].公路工程,1996,30(3):12-16. 被引量：9
8杨小倩,张义宏,孙波,邓鹏,范骏,沈景昊,朱广宇,顾明芳.痰液MicroRNAs检测在非小细胞肺癌诊断中的应用价值[J].临床肺科杂志,2013,18(2):226-229. 被引量：8
9付丹阳,张捷.肺腺癌诊断的研究进展[J].中国实验诊断学,2019,23(1):172-174. 被引量：19
10张天嵩.调整基线差异:协方差分析[J].临床与病理杂志,2015,35(12):2043-2048. 被引量：2

引证文献9

1鲁江坤,汪林林,陈红阳.基于卷积神经网络特征提取的轻量级包装袋分类模型[J].塑料科技,2020,48(8):69-72.
2赵志焱,杨华,胡志伟,宇海萍.基于TACNN的玉露香梨叶虫害识别[J].计算机工程与应用,2021,57(9):176-181. 被引量：5
3陈阳,李一,姬正一,张胜光,雷博.基于振动时域特征的船用滚动轴承故障诊断方法[J].机床与液压,2021,49(14):193-200. 被引量：7
4周玮辰,韩震,张雪薇.基于融合U-Net及ConvLSTM的海面高度异常预报方法研究[J].海洋通报,2021,40(4):410-416. 被引量：6
5张雨欣,贺琤雯,黄琳,钱昆,陈伟,贾音,胡晶晶,韦琴,王希平,刘善荣.血清代谢组指纹联合机器学习诊断肺癌[J].中华检验医学杂志,2022,45(3):226-233. 被引量：2
6高雅奇,穆军妮,刘培昌.基于数据挖掘算法的本科生学习质量分析[J].微型电脑应用,2022,38(6):60-64.
7余俊,吴海军,王武斌,张宗堂.基于深度学习的公路路面病害智能化检测系统[J].公路工程,2022,47(5):71-77. 被引量：5
8张文栋,刘子琨,梁涛,刘伟.基于CNN-LSTM的综合能源系统负荷预测模型[J].重庆邮电大学学报（自然科学版）,2023,35(2):254-262. 被引量：5
9牛帅,宗诗怡,胡威,许彬,董振华.基于X-CUBE-AI的神经网络手语识别系统设计[J].工业控制计算机,2024,37(3):21-23.

二级引证文献30

1张书锋,陈雪勤.基于多尺度极差熵和专家森林的轴承故障诊断[J].机电工程,2022,39(1):47-52. 被引量：2
2应斌武.分子诊断技术检测感染性疾病的应用和发展[J].中华检验医学杂志,2022,45(3):207-213. 被引量：1
3徐聪,王旭启,刘裕.一种改进可形变FCN的农作物害虫检测方法[J].江苏农业科学,2022,50(9):211-219. 被引量：3
4赵健,蔡瑞阳,孙伟富.集成奇异谱分析和长短期记忆网络的区域海平面变化预测[J].同济大学学报（自然科学版）,2022,50(10):1508-1516. 被引量：2
5胡文艺,王洪坤,杜育佳.基于SE模块和ResNet的番茄病虫害识别方法[J].农业工程,2022,12(9):33-40. 被引量：3
6方文博,郭永刚,关法春,张伟,刘倩倩,王树文,张正超,于皓然.基于改进YOLO v5s算法的大豆叶片虫洞的识别[J].湖南农业大学学报（自然科学版）,2023,49(1):127-132. 被引量：3
7王菲,李学哲,王彦昕,申瑶.面向应急的振动检测模式研究[J].机电信息,2023(5):85-88. 被引量：2
8王芳.基于深度学习的网络传输数据异常识别方法[J].现代电子技术,2023,46(6):62-66. 被引量：2
9侯佐新,袁树文.采用神经网络建模对海下有机材料加固的油井产量预测研究[J].粘接,2023,50(3):178-182. 被引量：2
10周传杰,张林,陈节涛,张航,裴浩然,徐春梅,彭道刚.基于OVMD算法集成学习模型的火电厂关键辅机故障诊断[J].自动化仪表,2023,44(4):43-47. 被引量：1

1郝金红.理和情[J].传奇．传记文学选刊,2019,0(11):91-91.
2邱晓荣,李芸.网络训练对儿童弱视辅助治疗的临床观察[J].临床研究,2014,22(11):39-40.
3蒋芸,张海,陈莉,陶生鑫.基于卷积神经网络的图像数据增强算法[J].计算机工程与科学,2019,41(11):2007-2016. 被引量：15
4黎丽,潘博,杨俊,蒋涛,陈丽,何丰.图像非局部自相似的稀疏表示算法[J].嘉兴学院学报,2019,31(6):23-34.
5巫瑞洁.探讨变电运行跳闸故障与处理技术[J].科学技术创新,2019(31):195-196. 被引量：1
6周美玲,刘悦.基于鲨鱼优化算法的液压伺服系统自抗扰控制[J].电气传动,2019,49(11):76-81. 被引量：4
7李容爽,谢源(指导),金鹏飞,田黄田.GWO-ELMAN神经网络在光伏最大功率点跟踪中的应用[J].上海电机学院学报,2019,22(5):249-254. 被引量：2
8张璇,陈峰.面向汽车入厂物流系统的订单量协同模型及其算法[J].上海交通大学学报,2019,53(10):1159-1164. 被引量：2
9王格格,郭涛,余游,苏菡.基于半监督学习的多层感知器生成对抗网络[J].小型微型计算机系统,2019,40(11):2297-2303. 被引量：9
10张昭,张天奇.基于群体智能的自组织运动控制综述[J].电子科技,2019,32(11):52-57. 被引量：2

兰州文理学院学报（自然科学版）

2019年第6期

浏览历史

内容加载中请稍等...

一种机器学习中防止过拟合的Dropout优化算法被引量：9

参考文献6

二级参考文献63

共引文献1659

同被引文献93

引证文献9

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

一种机器学习中防止过拟合的Dropout优化算法 被引量：9

参考文献6

二级参考文献63

共引文献1659

同被引文献93

引证文献9

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

一种机器学习中防止过拟合的Dropout优化算法被引量：9