卷积神经网络中激活函数的一种改进被引量：18

An Improvement of the Activation Function in Convolutional Neural Networks

下载PDF

导出

摘要卷积神经网络中激活函数的作用是激活神经元的特征,然后保留并映射出来,这是人工神经网络能模拟人脑机制,解决非线性问题的关键.针对传统卷积神经网络出现的震荡、不收敛甚至过拟合的情况,对激活ReLU函数进行优化.提出一种新型矫正激活函数,称其为ReLU阈值函数.通过对数据集caltech101和caltech256进行训练,证明其在图片分类上的性能要优于ReLU函数.其中用Alexnet网络模型对caltech101数据集进行训练时的分类准确率由之前的97.7%提高到99.3%,对caltech256数据集进行训练时的分类准确率由之前的65.4%提高到92.3%. The purpose of the activation function in the convolutional neural network is to activate the characteristics of neurons and then retain and map them. It is the key point that the artificial eural network can simulate human brain mechanisms and solve nonlinear problems. In this paper, to solve problems such as oscillation, non-convergence and even over-fitting of traditional convolutional neural networks, the activation of ReLU function is optimised. A new type of corrective activation function is proposed, which is called the ReLU threshold function. By training the data sets caltech101 and caltech256, it is proved that its performance in image classification is better than the ReLU function. The classification-accuracy rate of the caltech101 dataset was improved from 97.7% to 99.3% when using the Alexnet network model, and when training the caltech256 dataset. It was improved from 65.4% to 92.3%.

作者刘小文郭大波李聪 LIU Xiaowen;GUO Dabo;LI Cong(College of Physics and Electronic Engineering, Shanxi University, Taiyuan 030006, China)

机构地区山西大学物理电子工程学院

出处《测试技术学报》 2019年第2期121-125,共5页 Journal of Test and Measurement Technology

基金山西省基础研究资助项目(201601D102033 201801D121118)

关键词卷积神经网络激活函数 ReLU PReLU convolutional neural network activation function ReLU PReLU

分类号 TP311.1 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17. 被引量：520
2姜枫,张丽红.基于随机Dropout卷积神经网络的人体行为识别方法研究[J].测试技术学报,2016,30(1):17-22. 被引量：9
3段建,翟慧敏.深度卷积神经网络在Caltech-101图像分类中的相关研究[J].计算机应用与软件,2016,33(12):165-168. 被引量：10
4周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1591
5王双印,滕国文.卷积神经网络中ReLU激活函数优化设计[J].信息通信,2018,31(1):42-43. 被引量：29
6蒋昂波,王维维.ReLU激活函数优化研究[J].传感器与微系统,2018,37(2):50-52. 被引量：92

二级参考文献80

1Polana R, Nelson R C. Detection and recognition of periodic, nonrigid motion[J]. International Journal of Computer Vision(IJCV), 1997, 23(3): 261-282.
2Laptev I, Marszalek M. Learning realistic human actions from movies[C]. Proceedings of IEEE Conference on Com- puter Vision and Pattern Recognition (CVPR08), 2008.. 1-8.
3Scovanner P, Ali S, Shah M. A 3-dimensional SIFT descriptor and its application to action recognition[C]. Proceed- ings of the International Conference on Multimedia (MultiMedia'07). Augsburg, Germany, 2007.. 357-360.
4LeCun Y, Boser B, Denker J S, et al. Backpropagation applied to handwritten zip code recognition[J]. Neural compu tation, 1989, 1(4)= 541-551.
5Bengio Y, Lamblin P, Popovici D, et al. Greedy layer-wise training of deep networks[C]. Advances in Neural Infor mation Processing Systems. Cambridge: MIT Press, 2007: 153-160.
6Hinton G E. A practical guide to training restricted Boltzmann machines[M]. Neural Networks= Tricks of the Trade Berlin= Springer-Verlag, 2013= 599-619.
7Fukushima K. Neocognitron: A hierarchical neural network capable of visual pattern Recognition[J]. Neural net works, 1988, 1(2)= 119-130.
8LeCun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11).. 2278-2324.
9Ji Shuiwang, Xu Wei, Yang Ming, et al. 3D convolutional neural networks for human action recognition[J]. Pattern Analysis and Machine Intelligence. IEEE Transactions on, 2013, 35(1): 221-232.
10Glorot X, Bordes A, Bengio Y. Deep sparse rectifier neural networks[J]. Aistats, 2011(15) : 315-323.

共引文献2143

1周晓,焦晨,朱开瑄.基于卷积神经网络的废旧塑料瓶颜色分拣系统[J].数字制造科学,2021(3):227-232. 被引量：3
2陆文超,崔海朋.一种基于融合自编码与神经网络的协同过滤算法[J].中国水运（下半月）,2022,22(3):18-20.
3杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
4陆天和,刘莉,贺云涛,杨盾.多无人机航迹规划算法及关键技术[J].战术导弹技术,2020(1):85-90. 被引量：7
5林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：20
6陈仁祥,张勇,杨黎霞,陈才,徐向阳.基于整周期数据和卷积神经网络的谐波减速器健康状态评估[J].仪器仪表学报,2020,41(2):245-252. 被引量：19
7鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：11
8谭宇辰,蔡晶晶,倪辰.基于深度学习的Web攻击检测技术研究[J].信息网络安全,2020(S02):122-126.
9任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321.
10胡伟,文武,魏敏.改进U-Net的高分辨率遥感图像轻量化分割[J].计算机系统应用,2022,31(12):135-146. 被引量：2

同被引文献131

1傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：49
2项立人.应该加快我国特高压输电前期工作的研究[J].电网技术,1996,20(2):54-58. 被引量：32
3王旭东,邵惠鹤.RBF神经网络理论及其在控制中的应用[J].信息与控制,1997,26(4):272-284. 被引量：175
4李旋,周清锋,何朝津,杨礼平,赵立科,王晓辉.经验模式分解与小波变换在模拟信号中的对比分析[J].地质学刊,2009,33(1):79-83. 被引量：9
5赵志宏,杨绍普,申永军.一种改进的EMD降噪方法[J].振动与冲击,2009,28(12):35-37. 被引量：40
6魏伟波,潘振宽.图像分割方法综述[J].世界科技研究与发展,2009,31(6):1074-1078. 被引量：11
7王春玲,季泽华.一种可适用于正交异性矩形薄板弯曲稳定振动的双重正弦傅立叶级数通解[J].应用力学学报,2010,27(3):616-621. 被引量：4
8唐剑,杨迎建,李永双,张广洲,张小武,何金良.特高压交流输电线路电晕效应的预测方法,Ⅰ:可听噪声[J].高电压技术,2010,36(11):2679-2686. 被引量：31
9刘磊,李敏,李锐海,曾嵘,余占清,王国利,刘智宏.风对高海拔特高压直流输电线路可听噪声影响的初步试验研究[J].南方电网技术,2010,4(A01):19-22. 被引量：11
10彭正涛,方康玲,苏志祁.基于改进PSO算法的Otsu快速多阈值图像分割[J].现代电子技术,2011,34(6):10-14. 被引量：6

引证文献18

1钟元权.基于混合随机深度学习的页岩地层图像增强[J].合肥学院学报（综合版）,2020,37(5):75-80.
2李昕.适应一个更温暖的世界[J].国外科技动态,2000(1):38-39.
3于倩倩,黄文龙,付世荣.基于全卷积神经网络的图像语义分割[J].电脑与信息技术,2019,27(5):16-18. 被引量：2
4佘颢,吴伶,单鲁泉.基于SSD网络模型改进的水稻害虫识别方法[J].郑州大学学报（理学版）,2020,52(3):49-54. 被引量：20
5黄伦文.基于压缩激活机制的轻量级人脸识别网络设计[J].数字通信世界,2020(8):4-6. 被引量：1
6刘志勇,张丽秀,钟婷婷,王幸福,胡声洲.基于改进leNet-5的番茄病虫害识别的研究[J].赣南师范大学学报,2020,41(6):70-74. 被引量：4
7庞俊,刘鑫,段敏霞,任海莉,侯鑫烨.基于改进卷积神经网络轴承故障诊断[J].组合机床与自动化加工技术,2021(3):66-69. 被引量：11
8黄仝宇,胡斌杰,朱婷婷,黄哲文.面向驾驶场景的多尺度特征融合目标检测方法[J].计算机工程与应用,2021,57(14):134-141. 被引量：3
9李滨,曾辉.改进的深度置信网络在电主轴故障诊断中的应用[J].机械科学与技术,2021,40(7):1051-1057. 被引量：6
10刘红红.基于人工智能与数据信息分析的就业质量评估方法研究[J].电子设计工程,2021,29(24):145-149.

二级引证文献60

1江泽,熊细涛.超高压、特高压抛落式自动接地线[J].通信电源技术,2020,37(2):93-94. 被引量：2
2杨朝红,王伟男.基于优化SSD300的小尺度典型军事目标识别方法研究[J].电脑与信息技术,2020,28(4):19-22. 被引量：5
3杨志钢,李辉洋.基于改进GeneGAN的图像背景替换方法[J].哈尔滨商业大学学报（自然科学版）,2020,36(5):560-564.
4徐好好,单志勇,徐超.基于路径增强SSD的遗失物体检测模型[J].软件导刊,2020,19(11):17-20.
5张建功,赵学成,路遥,干喆渊,刘华钢,徐吉来.750 kV/330 kV混压同塔四回输电线路“100 Hz”纯声分布规律研究[J].高压电器,2021,57(1):108-115. 被引量：2
6熊黎剑,吾守尔·斯拉木,许苗苗.基于Django印刷体维吾尔文识别系统的设计与实现[J].郑州大学学报（理学版）,2021,53(3):9-14. 被引量：1
7蒋翼浓,张世义.交通标志识别技术综述[J].汽车工程师,2021(8):15-18. 被引量：2
8肖小梅,杨红云,易文龙,万颖,黄琼,罗建军.改进的Alexnet模型在水稻害虫图像识别中的应用[J].科学技术与工程,2021,21(22):9447-9454. 被引量：12
9孙波,姜宇宏,杨青.SSA优化融合CNN的电机轴承故障诊断方法研究[J].沈阳理工大学学报,2021,40(3):9-13. 被引量：3
10王鑫,胡天亮,习爽.基于卷积神经网络的轴承故障诊断方法[J].林业机械与木工设备,2021,49(10):50-54. 被引量：5

1陈文育.电话指导下CPR的实施效果[J].河南医学研究,2019,28(2):228-229. 被引量：1
2陈海昕,邓凯文,李润泽.机器学习技术在气动优化中的应用[J].航空学报,2019,40(1):47-63. 被引量：34
3戴文战,黄晓姣,沈忱.带遗忘因子的自适应迭代容积卡尔曼滤波算法[J].科技通报,2019,35(1):181-185. 被引量：6
4朱富占,邹海,张馨.改进果蝇算法优化GRNN在弹痕深度预测中的应用[J].微电子学与计算机,2019,36(2):41-45. 被引量：5
5刘炎东,杨復唐,邹思力,严国锋,卢今,曲乐丰.一种改良的小鼠颈动脉不稳定粥样硬化斑块模型构建方法[J].中华医学杂志,2019,99(4):272-278. 被引量：5
6刘洋,潘金冲,张云龙,帅石金.基于神经网络的汽油车三效催化器老化诊断[J].车用发动机,2019(1):34-40. 被引量：2
7闫棣,苏祺,李四平.屈曲问题有限元模拟的随机缺陷法[J].上海交通大学学报,2019,53(1):19-25. 被引量：1
8郭晋平,冯顺易,王博,颞屾,马云杰,闫寒,李勇.救护车上保持施救者身体平衡的固定架对胸外按压质量影响[J].安徽医药,2019,23(4):757-759.
9许臻晔,徐艳丽,王佳玉,张琪,匡洁,黄梁,毛恩强,史霆.医学模拟教学中模拟运作专员的效用探讨与需求分析[J].中华医学教育杂志,2019,39(1):10-14. 被引量：4

测试技术学报

2019年第2期

浏览历史

内容加载中请稍等...

卷积神经网络中激活函数的一种改进被引量：18

参考文献6

二级参考文献80

共引文献2143

同被引文献131

引证文献18

二级引证文献60

相关作者

相关机构

相关主题

浏览历史

卷积神经网络中激活函数的一种改进 被引量：18

参考文献6

二级参考文献80

共引文献2143

同被引文献131

引证文献18

二级引证文献60

相关作者

相关机构

相关主题

浏览历史

卷积神经网络中激活函数的一种改进被引量：18