一种新型激活函数:提高深层神经网络建模能力被引量：2

Application of Activation Function of Deep Neural Network

下载PDF

导出

摘要修正线性单元做为深层神经网络的激活函数,常被用来处理复杂的函数来提高深层神经网络的建模能力。针对传统修正线性单元提出一种新的激活函数——Tanh ReLU,Tanh ReLU在修正线性单元的基础上为其添加一个负值和边界值,同时保证Tanh ReLU函数在原点处相切,以此克服由于修正线性单元激活函数非零均值激活、极大输出值和原点处不连续的缺点而损害网络的生成。将此新的激活函数应用于MNIST手写数据分类实验以验证其建立的深层神经网络的性能;同时针对网络中不同的超参数的选择,来进一步验证Tanh ReLU对于提高深层神经网络模型性能的影响。实验结果表明:与修正线性单元相比,Tanh ReLU建立的深层神经网络得到了更好的分类结果,实现了提高深层神经网络分类性能的目的。 Rectified linear unit( ReLU) is used as an activation function of deep neural network( DNN),which is often used to deal with complex functions to improve the modeling ability of DNN. A new activation function-Tanh ReLU, is presented for correction of traditional ReLU. Tanh ReLU adds a negative value and boundary value to the ReLU, and guarantees that the Tanh ReLU function is tangent at the origin, thereby overcoming the disadvantages of non-zero mean activation, the maximum output value and discontinuity at the origin of the ReLU that harming the network's training. The new activation function is applied to MNIST handwritten data classification experiments to verify the performance of DNN. Meanwhile, the effect of Tanh ReLU on improving the performance of DNN models is verifed by selecting different hyper parameters of network. These experimental results show that the DNN built by Tanh ReLU gets better classification results, and achieves the purpose of improving the classification performance of DNN.

作者贺扬成凌飞张培玲李艳 HE Yang;CHENG Ling-fei;ZHANG Pei-Iing;LI Yan(School of Electrical Engineering and Automation, Henan Polytechnic University, Jiaozuo 454000, China;School of Physics & Electronic Information Engineering, Henan Polytechnic University, Jiaozuo 454000, China)

机构地区河南理工大学电气工程与自动化学院河南理工大学物理与电子信息学院

出处《测控技术》 2019年第4期50-53,58,共5页 Measurement & Control Technology

关键词深层神经网络激活函数修正线性单元分类性能 deep neural network activation function rectified linear unit classification performance

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1韩宇萌,贾晓洪,王炜强,史晓刚.基于BP神经网络的捷联导引头控制系统设计[J].测控技术,2016,35(10):70-74. 被引量：7
2张新良,朱琳,郭晓迪.一种频率依赖性迟滞的神经网络内模控制[J].测控技术,2016,35(9):52-54. 被引量：3
3费清春,严沁,史莹莹.基于BP神经网络软件测试缺陷预测技术研究及应用[J].测控技术,2016,35(1):102-105. 被引量：9

二级参考文献25

1肖仁鑫,张聘义,胡海双,柳继勇,周立钢.滚俯仰式红外导引头稳定平台控制与仿真[J].红外与激光工程,2007,36(z2):363-365. 被引量：14
2胡志军,王鸿斌.BP神经网络数值预测方法的研究[J].长春师范学院学报（自然科学版）,2006,25(5):49-52. 被引量：2
3Taghi M. Khoshgoftaar.??A neural network approach for early detection of program modules having high risk in the maintenance phase(J)The Journal of Systems & Software . 1995 (1)
4XING F,Guo P,Lyu M R.A Novel Method for Early Software Quality Predic-tion Based on Support Vector Machine. International Symposium on Software Reliability Engineering . 2005
5Briand L C,Emam K E,Freimut B G,et al.A comprehensive evaluation of capture-recapture models for estimating software defect content. IEEE Transactions on Software Engineering . 2000
6赵飞,赵新龙,潘海鹏.迟滞非线性系统的滑模逆补偿控制[C]//第31届中国控制会议论文集.2012.
7Economou C G,Morari M,Palsson B O. Internal model control: 5. extenaion to nonlinear system [ J ]. Industrial & Engineer Chemistry Process Design and Development, 1986,25 (2).
8Matausek M R, Stipanovic D M. Modified nonlinear internal model control[ J]. Control and Intelligent Systems,1988,26(2).
9Zhang X L, Tan Y H, Su M Y. Modeling of hysteresis in pie- zoelectric actuators using neural networks [J]. Mechanical Systems and Signal Processing,2009,25 (8) :2699 - 2711.
10Zhang X L, Tan Y H, Su M Y. et al. Neural networks based identification and compensation of rate-dependent hysteresis in piezoelectric actuators [ J ]. Physica B : Condensed Mat- ter,2010,405 (12) : 2687 - 2693.

共引文献16

1郑蒙蒙,李新利,巨汉基,庞富宽,李斯琪.基于BP神经网络的电能表软件故障分类研究[J].华北电力技术,2016(8):8-12. 被引量：2
2赵彬宏,王建鹏,王元元.基于自构建小波神经网络的内模控制[J].太原科技大学学报,2018,39(4):255-262. 被引量：2
3张良,韩宇萌.滚仰式半捷联稳定平台的神经网络自适应控制算法[J].测控技术,2018,37(6):5-8. 被引量：5
4袁建平,施一萍,江鹏,蒋宇,贾日晶,姚德亮.基于BP神经网络PID算法的风力摆控制系统的设计[J].测控技术,2018,37(11):144-147. 被引量：4
5于淑香,温一军.基于GWO-BP算法的软件缺陷预测模型[J].安徽电子信息职业技术学院学报,2018,17(6):8-12. 被引量：1
6李文,李民赞,孙明.基于PCA和神经网络的农残含量预测模型研究[J].测控技术,2018,37(12):34-37. 被引量：4
7刘峰,辛国华,王昆睿.大型运输机显示控制系统自动化测试平台设计[J].测控技术,2019,38(6):68-71. 被引量：5
8李宁,戴文博,卫津逸,徐珞.基于本体的韧性信息服务测试生成技术[J].指挥信息系统与技术,2019,10(3):95-100.
9韩宇萌,贾晓洪.基于卡尔曼滤波器的半捷联导引头控制系统设计[J].兵器装备工程学报,2019,40(10):146-150. 被引量：1
10王远飞,刘晓利,陈志华.速率稳定滚仰式导引头跟踪回路自抗扰控制器设计与仿真[J].航空兵器,2020,27(1):64-70. 被引量：2

同被引文献36

1李林恒,甘婧,曲栩,冒培培,冉斌.智能网联环境下基于安全势场理论的车辆跟驰模型[J].中国公路学报,2019,32(12):76-87. 被引量：31
2吴炎,杜栋.基于改进BP神经网络对江苏省粮食产量的仿真预测[J].微型电脑应用,2009(6):1-3. 被引量：5
3臧庆凯,李春贵,钟宛余.基于三个并行BP神经网络的机器人逆运动学求解[J].计算机测量与控制,2012,20(8):2244-2247. 被引量：11
4吴陈,张明华.基于最优朴素贝叶斯分类器的个人信用预测[J].江苏科技大学学报（自然科学版）,2012,26(4):376-380. 被引量：7
5李世宝,陈瑞祥,刘建航,陈海华,丁淑妍,龚琛.基于反向传播神经网络改进的增益修改卡尔曼滤波算法[J].计算机应用,2016,36(5):1196-1200. 被引量：3
6苏曼.跨境电商专业人才胜任素质模型研究[J].高等工程教育研究,2016,64(3):170-174. 被引量：77
7隗寒冰,陈尧,贾志杰,赖锋.融合历史轨迹的智能汽车城市复杂环境多目标检测与跟踪算法[J].西安交通大学学报,2018,52(10):132-140. 被引量：6
8隗寒冰,曹旭,赖锋.智能汽车环境感知算法测试评价系统开发[J].中国机械工程,2018,29(19):2298-2305. 被引量：6
9杨鹤标,龚文彦.基于卷积神经网络的反向传播算法改进[J].计算机工程与设计,2019,40(1):126-130. 被引量：23
10王艺,蔡英凤,陈龙,王海,何友国,李健.基于模型预测控制的智能网联汽车路径跟踪控制器设计[J].机械工程学报,2019,55(8):136-144. 被引量：53

引证文献2

1马百皓.基于BP神经网络的农产品跨境电商人才培养方案设计与应用[J].微型电脑应用,2020,36(5):145-148. 被引量：4
2刘庆.基于多任务神经网络的智能网联汽车环境自动感知研究[J].山东交通学院学报,2022,30(4):1-7. 被引量：2

二级引证文献6

1张赠富,廖苗昀,应洪斌.基于CiteSpace的农产品跨境电商知识图谱分析[J].时代经贸,2022,19(7):24-29. 被引量：3
2张懿木,于琛.智能网联汽车公交服务场景示范运营探索--以上海临港新片区环滴水湖未来交通生态圈智能网联项目为例[J].交通与港航,2022,9(6):35-41. 被引量：1
3蒋戴丽.我国农产品跨境电商的发展和对策[J].现代商业,2022(36):44-47.
4郝朔,张囡囡.“大数据+跨境电商”人才需求特征分析研究[J].中国电子商务,2023(19):57-60.
5崔巍,李慧.基于大数据驱动的农村电商产品自动化识别系统[J].现代电子技术,2024,47(4):59-64. 被引量：1
6张健.智能网联汽车技术发展研究[J].汽车测试报告,2023(23):34-36.

1周晓磊,赵薛蛟,刘堂亮,宗子潇,王其乐,里剑桥.基于SVM-BiLSTM-CRF模型的财产纠纷命名实体识别方法[J].计算机系统应用,2019,28(1):245-250. 被引量：13
2曹渝昆,何健伟.基于RA-DNN的电力变压器故障分类方法[J].电气自动化,2019,41(2):98-101. 被引量：3
3秦子实.基于前馈神经网络的试验数据拟合实践[J].电脑知识与技术,2019,15(2):174-175. 被引量：3
4龙光鹏,涂燕青.直线与椭圆、双曲线相切的性质探究[J].中学数学研究,2019(5):26-28.
5李忠海,王崇瑶,宋智钦,徐蕾.基于增强CNN模型的手写字体图像识别[J].火力与指挥控制,2019,44(4):169-172. 被引量：2
6董祥辰,李永新,李冰莹.皮带秤用神经网络基本元件的FPGA实现方法研究[J].衡器,2019,0(2):13-18.
7杨柳,张德,王亚慧.一种新型的城市火灾检测方法[J].现代电子技术,2019,42(10):141-145. 被引量：2
8余润芝,赵文龙,程若发.四旋翼飞行器的神经网络PID控制算法研究[J].现代电子技术,2019,42(10):108-112. 被引量：9
9张向向,金立左.基于度量自编码器的表示学习研究[J].信息技术与信息化,2019(4):170-173.
10邢城祎.基于相似性的外卖——人群深层神经网络分类模型[J].数学大世界（中旬）,2019,0(1):87-88.

测控技术

2019年第4期

浏览历史

内容加载中请稍等...

一种新型激活函数:提高深层神经网络建模能力被引量：2

参考文献3

二级参考文献25

共引文献16

同被引文献36

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

一种新型激活函数:提高深层神经网络建模能力 被引量：2

参考文献3

二级参考文献25

共引文献16

同被引文献36

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

一种新型激活函数:提高深层神经网络建模能力被引量：2