卷积神经网络中激活函数的性质分析与改进被引量：11

Analysis and Improvement of Properties of Activation Functions in Convolutional Neural Networks

下载PDF

导出

摘要为了提高卷积神经网络模型的效率,针对激活函数进行了研究。通过研究多种激活函数的发展进程,列举各类激活函数的性质,以及在分析模型前向传播和反向传播中激活函数所起到的作用的基础上,提出了改进的激活函数Re LU-Xe X,有效的缓解了梯度消失、“神经元坏死”等问题。在MNIST、CIFAR-10、CIFAR-100、MSTAR数据集上的试验结果表明,改进的激活函数Re LU-Xe X整体表现强于其它的一些激活函数,且在模型的收敛速度上有所提升。对激活函数的性质进行了较为深入的研究,将激活函数的理论和实际表现进行了对照,用算法仿真论证了改进的激活函数Re LU-Xe X在理论上存在的优势。 In order to improve the efficiency of the convolutional neural network model, this paper studied the activation function. By studying the development process of various activation functions, enumerating the properties of various activation functions and analyzing the role of activation functions in forward and back propagation of the model, an improved activation function Re LU-Xe X is proposed, which effectively alleviated the problems of gradient disappearance and " necrosis of neurons". The experimental results on the MNIST, CIFAR-10, CIFAR-100, and MSTAR datasets show that the improved activation function Re LU-Xe X overall performance is stronger than some other activation functions, and the convergence speed of the model has been improved. In this paper, a more indepth study of the nature of the activation function was carried out, the theoretical and actual performance of the activation function was compared, and the theoretical advantages of the improved activation function Re LU-Xe X were demonstrated by algorithm simulation experiments.

作者张焕张庆于纪言 ZHANG Huan;ZHANG Qing;YU Jiyan(Key Laboratory of National Defense of Intelligent Ammunition Technology,School of Mechanical Engineering,Nanjing University of Science and Technology,Nanjing Jiangsu 210094,China)

机构地区南京理工大学机械工程学院

出处《计算机仿真》北大核心 2022年第4期328-334,共7页 Computer Simulation

基金国防科学技术预先研究基金项目(KO01071)。

关键词图像识别深度学习卷积神经网络激活函数反向传播 Image recognition Deep learning Convolutional neural network Activation function Back propagation

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献10

1崔雍浩,商聪,陈锶奇,郝建业.人工智能综述:AI的发展[J].无线电通信技术,2019,45(3):225-231. 被引量：86
2黄凯奇,任伟强,谭铁牛.图像物体分类与检测算法综述[J].计算机学报,2014,37(6):1225-1240. 被引量：195
3常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312. 被引量：426
4李宏伟,吴庆祥.智能传感器中神经网络激活函数的实现方案[J].传感器与微系统,2014,33(1):46-48. 被引量：8
5曲之琳,胡晓飞.基于改进激活函数的卷积神经网络研究[J].计算机技术与发展,2017,27(12):77-80. 被引量：33
6王红霞,周家奇,辜承昊,林泓.用于图像分类的卷积神经网络中激活函数的设计[J].浙江大学学报（工学版）,2019,53(7):1363-1373. 被引量：58
7张涛,杨剑,宋文爱,宋超峰.关于改进的激活函数TReLU的研究[J].小型微型计算机系统,2019,40(1):58-63. 被引量：9
8刘宇晴,王天昊,徐旭.深度学习神经网络的新型自适应激活函数[J].吉林大学学报（理学版）,2019,57(4):857-859. 被引量：20
9刘小文,郭大波,李聪.卷积神经网络中激活函数的一种改进[J].测试技术学报,2019,33(2):121-125. 被引量：20
10孔令军,王锐,张南,李华康.边缘计算下的AI检测与识别算法综述[J].无线电通信技术,2019,45(5):453-462. 被引量：12

二级参考文献90

1王茜,董学仁,尉吉勇,马玉真.神经网络技术在智能传感器系统中的应用与发展[J].自动化仪表,2004,25(7):1-3. 被引量：2
2李红霞.人工智能的发展综述[J].甘肃科技纵横,2007,36(5):17-18. 被引量：18
3Marr D.Vision:A Computational Investigation Into the Human Representation and Processing of Visual Information.Cambridge:The MIT Press,2010.
4LeCun Y,Bottou L,Bengio Y,Haffner P.Gradient-based learning applied to document recognition.Proceedings of the IEEE,1998,86(11):2278-2324.
5Ferrari V,Jurie F,Schmid C.From images to shape models for object detection.International Journal of Computer Vision,2009,87(3):284-303.
6Latecki L J,Lakamper R,Eckhardt U.Shape descriptors for non rigid shapes with a single closed contour//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Hilton Head,USA,2000,1:424-429.
7Krizhevsky A.Learning Multiple Layers of Features from Tiny Images[M.S.dissertation].University of Toronto,2009.
8Torralba A,Fergus R,Freeman W T.80 million tiny images:A large dataset for non-parametric object and scene recognition.IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,30(11):1958-1970.
9Li FebFei,Fergus R,Perona P.Learning generative visual models from few training examples:An incremental Bayesian approach tested on 101 object categories//Proceedings of the Computer Vision and Pattern Recognition (CVPR),Workshop on Generative-Model Based Vision.Washington,USA,2004:178.
10Griffin G,Holub A D,Perona P.The Caltech 256.Caltech Technical Report CNS-TR-2007-001.

共引文献840

1陈梦,王晓青.全卷积神经网络在建筑物震害遥感提取中的应用研究[J].震灾防御技术,2019,14(4):810-820. 被引量：6
2陈妮亚,阮佳阳,黄金苗,杨伟.结合深度学习与生物特征识别在冷链拣选中的算法研究[J].智能科学与技术学报,2019,0(1):88-95. 被引量：1
3王雷,闫红蕾,张自力.收益率曲面预测及其在信用债投资组合管理中的应用[J].统计研究,2021(4):145-160. 被引量：3
4王维波,徐西龙,盛立,高明.卷积神经网络微地震事件检测[J].石油地球物理勘探,2020(5):939-949. 被引量：12
5李本岳,李伟荣,潘华峰,王宏,王奇.人工智能对中医诊断的影响[J].世界科学技术-中医药现代化,2020,22(5):1624-1628. 被引量：23
6毛自新,王添.TensorFlow人脸识别技术在采煤工作面的应用研究[J].工矿自动化,2024,50(S01):78-81.
7高璇,毕晓君.基于改进Faster R-CNN的低剂量CT图像肺结节检测[J].计算机应用研究,2020,37(S02):404-406. 被引量：2
8赵毅力,李禹成,陈皓.云南野生鸟类图像自动识别系统[J].计算机应用研究,2020,37(S01):423-425. 被引量：5
9华夏,王新晴,马昭烨,王东,邵发明.基于递归神经网络的视频多目标检测技术[J].计算机应用研究,2020,37(2):615-620. 被引量：8
10蒋梦莹,林小竹,柯岩,魏战红.基于权值分布的多模型分类算法研究[J].计算机应用研究,2020,37(1):313-316. 被引量：3

同被引文献100

1徐夷鹏,任志明,李振春,刘畅,贺紫林,陈金茂.一阶近似瞬时频率时间域声波全波形反演[J].石油地球物理勘探,2020(5):1029-1038. 被引量：5
2孙玉莹,王德辉.不同损失函数下偏正态分布的Bayes估计[J].吉林大学学报（理学版）,2012,50(4):638-646. 被引量：10
3鲁恒,付萧,刘超,李龙国,李乃稳,庄文化.基于低空遥感与迁移学习的土地利用信息快速制图方法[J].农业机械学报,2016,47(11):262-269. 被引量：4
4孙娅楠,林文斌.梯度下降法在机器学习中的应用[J].苏州科技大学学报（自然科学版）,2018,35(2):26-31. 被引量：36
5张雪芹,陈嘉豪,诸葛晶晶,余丽君.基于深度学习的快速植物图像识别[J].华东理工大学学报（自然科学版）,2018,44(6):887-895. 被引量：31
6邱骏.基于ZigBee技术的智能家庭安防系统设计[J].电气自动化,2019,41(1):71-74. 被引量：6
7韩如冰,郎超.频率域八阶NAD有限差分模拟及全波形反演[J].石油地球物理勘探,2019,54(6):1254-1266. 被引量：5
8赵立新,侯发东,吕正超,朱慧超,丁筱玲.基于迁移学习的棉花叶部病虫害图像识别[J].农业工程学报,2020,36(7):184-191. 被引量：89
9郭玥秀,杨伟,刘琦,王玉.残差网络研究综述[J].计算机应用研究,2020,37(5):1292-1297. 被引量：69
10辛天亮,黄建平,解飞,周滨,卢子卓.基于数据相似性的不依赖子波的频率域全波形反演[J].石油地球物理勘探,2020,55(2):341-350. 被引量：5

引证文献11

1谭炎金,陈西曲.基于VGG-16和迁移学习的苹果识别[J].武汉轻工大学学报,2022,41(5):109-115.
2高菘,周屋梁.基于移动终端和大数据的自动化定位研究[J].自动化与仪器仪表,2022(11):129-133.
3王春波,果福明.多激活函数的立体神经网络设计[J].济源职业技术学院学报,2023,22(3):62-67.
4冀承泽,贾立新,李荆晖.基于改进YOLOv5s的两种输电杆塔缺陷检测研究[J].计算机技术与发展,2024,34(2):180-185. 被引量：2
5丁颖,邱伟,熊伟光.应用改进卷积神经网络的客户服务业务中台资源异常信息主动报警[J].电气自动化,2024,46(1):43-46.
6魏志,刘罡,张旭.基于MobileNet的轻量化密集行人检测算法[J].软件工程,2024,27(6):6-9.
7韩钰,王磊,郑金亮,王紫玉.面向高机动目标检测的激光雷达探测图像分角域识别方法[J].重庆科技学院学报（自然科学版）,2024,26(3):93-98.
8陈威,蔡奕侨.基于混合神经网络的多维视觉传感信号模式分类[J].传感技术学报,2024,37(6):1035-1040.
9刘超,周怀来,刘兴业,王元君.基于自动生成样本的优化Deeplabv3+网络速度建模方法[J].石油物探,2024,63(5):953-967.
10张佳鑫,张淼,戴一阳,董立春.面向实际化工过程故障诊断的强化深度卷积神经网络模型构建与应用[J].化工进展,2024,43(9):4833-4844.

二级引证文献2

1窦晓欣,梁丽莎,丁兵兵,温耿权,陈家仪.基于AI视觉智能巡检系统的设计与实现[J].电脑知识与技术,2024,20(17):19-21.
2张新.基于机器视觉的精密机械零件表面磨损缺陷检测[J].现代制造技术与装备,2024,60(8):128-131.

1王璐,温显斌.基于胶囊神经网络的SAR图像目标识别[J].天津理工大学学报,2021,37(6):36-40. 被引量：2
2彭广雷.例谈求根式函数最值的三个“妙招”[J].语数外学习（高中版）（下）,2021(10):50-50.
3李尤丰.基于卷积神经网络优化因素的图像分类研究[J].金陵科技学院学报,2022,38(1):26-31. 被引量：1
4应自炉,王发官,翟懿奎,王文琪.基于自注意力特征融合的半监督生成对抗网络用于SAR目标识别[J].信号处理,2022,38(2):258-267. 被引量：7
5殷玉波.聚焦核心素养,提升复习质量--以“函数性质及其综合应用”为例[J].中学数学教学参考,2022(7):12-16.
6巩瑞鑫,贺衎.改进胶囊网络在图像识别中的应用[J].应用数学进展,2022,11(4):1728-1739.
7童其林.构造函数,利用函数性质比较不等式大小[J].中学生数理化（高二数学、高考数学）,2022(8):16-18.
8杜圣杰,贾晓芬,黄友锐,郭永存,赵佰亭.面向CNN模型图像分类任务的高效激活函数设计[J].红外与激光工程,2022,51(3):483-491. 被引量：8
9崔猛,陈斌,刘主根,孙显海,李玉婷,官庆波.核电厂燃料组件在线啜漏装置实现放射性气体标定方法的研发[J].中国核电,2021,14(6):878-881.
10方澄,李慧娟,路稳,宋玉蒙,杨磊.基于形态学自适应分块的高分辨SAR多特征增强算法[J].系统工程与电子技术,2022,44(2):470-479. 被引量：1

计算机仿真

2022年第4期

浏览历史

内容加载中请稍等...

卷积神经网络中激活函数的性质分析与改进被引量：11

参考文献10

二级参考文献90

共引文献840

同被引文献100

引证文献11

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

卷积神经网络中激活函数的性质分析与改进 被引量：11

参考文献10

二级参考文献90

共引文献840

同被引文献100

引证文献11

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

卷积神经网络中激活函数的性质分析与改进被引量：11