人工神经网络中的一种Krylov子空间优化算法被引量：3

A Krylov Subspace Optimization Method in Artificial Neural Network

下载PDF

导出

摘要介绍了人工神经网络的二阶优化算法研究现状,对人工神经网络损失函数的KSD(Krylov Subspace Descent)优化算法进行改进。针对KSD算法中采用固定不变的Krylov子空间维数的方式,提出了Krylov子空间维数根据计算结果自适应改变的MKSD(Modified KSD)算法,并给出了利用MKSD、KSD以及SGD(Stochastic Gradient Descent)优化算法对不同问题的全连接神经网络进行训练的数值算例。计算结果说明MKSD的算法对比于其他算法具有一定的优势。 The development of algorithms for optimizing the loss function of artificial neural networks is introduced is this work.The KSD(Krylov Subspace Descent)algorithm is extended to MKSD(Modified KSD)algorithm which has adaptively variable subspace dimension instead of fixed dimension.Some numerical examples of optimizing the fully connected neural network problems by MKSD,KSD and SGD(Stochastic Gradient Descent)algorithms are given.The numerical results show that the MKSD method has certain advantages over other methods.

作者张振宇林沐阳 ZHANG Zhenyu;LIN Muyang(School of Mathematics,Shanghai University of Finance and Economics,Shanghai 200433;Shanghai University of Finance and Economics Zhejiang College,Jinhua 321013)

机构地区上海财经大学数学学院上海财经大学浙江学院

出处《工程数学学报》 CSCD 北大核心 2022年第5期681-694,共14页 Chinese Journal of Engineering Mathematics

基金国家自然科学基金(11671246)。

关键词人工神经网络 KRYLOV子空间优化算法 artificial neural network Krylov subspace optimization method

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1苏高利,邓芳萍.论基于MATLAB语言的BP神经网络的改进算法[J].科技通报,2003,19(2):130-135. 被引量：170

二级参考文献18

1Rumelhart D E, Hinton G E, Williams R J. Learninginternal repr esentatio ns by error propagation[A].Rumelhart D E James L.McClelland J L. Parallel di stributed processing: explorations in the microstructure of cognition[C], vol ume 1, Cambridge, MA:MIT Press, 1986.318～362.
2Neural Network Toolbox User's Guide .The Mathworks,inc. 1999.
3Fahlman S E. Faster-learning variations on back-propagation: an e mpirical study[A].Touretzky D,Hinton G,Sejnowski T. Proceedings of the 1988 C onnectionist Models Summer School[C].Carnegic Mellon University,1988,38～51.
4Jacobs R A. Increased rates of convergence through learning rate adaptation[J]. Neural Networks,1988,1:295～307.
5Shar S, Palmieri F. MEKA-a fast, local algorithm for training feedforwa rd neural networks[A]. Proceedings of the International Joint Conference on Ne ural Networks[C]. IEEE Press, New York, 1990.41～46.
6Watrous R L. Learning algorithms for connectionist network: appli ed gradie nt methods of nonlinear optimization[A]. Proceedings of IEEE International Con ference on Neural Networks[c]. IEEE Press, New York, 1987.619～627.
7Shar S,Palmieri F,Datum M.Optimal filtering algorithms f or fast l earning in feedforward neural networks[J]. Neural Networks,1992, 5(5):779～7 87.
8Martin R,Heinrich B. A Direct Adaptive Method for F aster Backpropagation Learning: The RPROP Algorithrm[A]. Ruspini H. Proceedi ngs of the IEEE Interna t ional Conference on Neural Networks (ICNN)[C]. IEEE Press, New York. 1993.58 6～591.
9Fletcher R,Reeves C M. Function minimization by conjugate gra dients[J]. Computer Journal ,1964,7:149～154.
10Powell MJD. Restart procedures for the conjugate gradient metho d[J]. Mathematical Programming, 1977, 12: 241～254.

共引文献169

1苗建杰,李德波,李慧君.基于人工神经网络的锅炉受热面积灰预测研究现状及展望[J].洁净煤技术,2021,27(S02):212-220. 被引量：6
2王雅静,宋丹.基于BP神经网络的女性服装款式分类技术研究[J].轻工科技,2020,36(4):107-109. 被引量：4
3杨勤,章杨.基于人工神经网络的船舶操纵运动仿真[J].航海教育研究,2007,24(z1):105-109.
4孙斌,周云龙,洪文鹏.几种改进BP算法在气液两相流流型识别中的比较[J].仪器仪表学报,2004,25(z1):623-624. 被引量：2
5张芳芳,贺娟,李明军.基于导数优化的BP学习算法的研究综述[J].计算机应用研究,2009,26(3):809-813. 被引量：7
6许尚杰,党发宁,高闯洲,党维维.吸力内摩擦角的确定方法研究[J].岩土力学,2009,30(S2):22-27. 被引量：3
7刘廷苍,莫春立,武晓娟.基于人工神经网络的SS400钢板力学性能预测[J].沈阳工业学院学报,2004,23(2):8-10. 被引量：2
8叶启亮,简敏,李欣欣,曹发海,房鼎业.甲苯与戊二烯催化合成戊烯基甲苯反应过程的建模及优化[J].计算机与应用化学,2004,21(6):873-877. 被引量：1
9李学军,张明玉.供应链中趋势序列的神经网络预测研究[J].山东电力高等专科学校学报,2004,7(3):25-28.
10王钰,郭其一,李维刚.基于改进BP神经网络的预测模型及其应用[J].计算机测量与控制,2005,13(1):39-42. 被引量：87

同被引文献28

1杨涵深,游振磊.义务教育“大班额”:现状、问题与消减对策[J].教育学术月刊,2019,0(12):57-64. 被引量：6
2李晓飞.从“凤凰男”到“学二代”:高等教育代际传递的城乡差异及其演变[J].现代大学教育,2019,0(1):98-103. 被引量：14
3李翰朋,宣兆龙,李天鹏,姚恺.弹载电池应用现状及发展方向[J].电源技术,2018,42(11):1761-1763. 被引量：8
4张思祥,胡雪迎,竭霞,李思鸣,王哲,赵子豪,周围.单体热电池装配缺陷的图像检测方法研究[J].电子测量与仪器学报,2019,31(2):132-139. 被引量：6
5任青山,方逵,朱幸辉.基于多元回归的BP神经网络生猪价格预测模型[J].江苏农业科学,2019,47(14):277-281. 被引量：34
6潘小东,张催,商宏杰,齐冀,李公平.锥束CT成像质量影响因素研究[J].原子核物理评论,2019,36(2):211-217. 被引量：7
7高炜欣,王思宇.X射线焊缝缺陷图像字典矩阵构建及求解算法[J].西安石油大学学报（自然科学版）,2020,35(1):115-120. 被引量：2
8赵涛,张思祥,徐文超,王哲,赵子豪,周围.热电池装配缺陷的灰度峰值坐标比对算法[J].电子测量与仪器学报,2020,32(7):133-140. 被引量：8
9韩冰,王光霞,陈令羽,王慧芳,张蓝天.一种基于迁移学习的栅格型图表自动分类方法[J].测绘科学技术学报,2021,38(1):75-82. 被引量：3
10赵春华,李谦,胡恒星,陈小甜,谭金铃.一种新联合损失函数优化的迁移学习神经网络磨粒识别研究[J].润滑与密封,2021,46(4):26-31. 被引量：3

引证文献3

1潘显民,黄俏,李佩林.基于BP神经网络的城乡教师智能推荐系统[J].湖南科技学院学报,2023,44(5):14-19. 被引量：1
2徐文超,张思祥,白芳,赵涛,伊纪禄.基于改进VGG网络的单体热电池X光图像无损检测方法研究[J].光电子．激光,2024,35(2):180-190.
3李丽霞,陈艳.基于D-DQN强化学习算法的双足机器人智能控制研究[J].计算机测量与控制,2024,32(3):181-187.

二级引证文献1

1赵自强,王法明,李秋伟,刘帅.基站油机油耗精细化管理应用研究[J].互联网周刊,2024(3):61-63.

1张维,张少勋,吴燕,时思远.一种面向时序数据的多品种小批量生产线性能预测模型研究[J].航空制造技术,2022,65(19):30-36. 被引量：2
2闵洁,彭国平,陈艳,林晶.经会阴三维盆底超声在女性压力性尿失禁诊断及病情程度评估中的应用[J].临床与病理杂志,2022,42(9):2159-2165. 被引量：15
3徐海文,史家财,汪腾.基于深度全连接神经网络的离港航班延误预测模型[J].计算机应用,2022,42(10):3283-3291. 被引量：3
4王楠,白雪莲.机场CCO/CDO飞行程序运行对比分析[J].民航学报,2022,6(5):56-58.
5Shaukat Hayat,Kun She,Muhammad Mateen,Parinya Suwansrikham,Muhammad Abdullah Ahmed Alghaili.Tuning-up Learning Parameters for Deep Convolutional Neural Network:A Case Study for Hand-Drawn Sketch Images[J].Journal of Electronic Science and Technology,2022,20(3):305-318.
6王璇,杜宇超,杜军,邹军.基于动态矩阵分解模型的电影推荐系统研究[J].电子器件,2022,45(2):483-489. 被引量：3
7Menghui XIONG,Baoyong ZHANG,Deming YUAN,Shengyuan XU.Distributed quantized mirror descent for strongly convex optimization over time-varying directed graph[J].Science China(Information Sciences),2022,65(10):192-206. 被引量：1
8孙泽洲,强晖萍,韩宇,白帆,张婷,雪霁.“天问一号”火星探测器UHF频段中继通信系统设计[J].南京航空航天大学学报,2022,54(5):817-826. 被引量：2
9Fan Yang,Xuan Zeng,Yangfeng Su,Dian Zhou.RLC Equivalent Circuit Synthesis Method for Structure-Preserved Reduced-Order Model of Interconnect in VLSI[J].Communications in Computational Physics,2008,3(2):376-396.
10张晓飞,曹阳,杨耀栋,翟子梅,马婵娟.天津蓟县系铁岭组叠层石中微体化石的发现及其意义[J].微体古生物学报,2022,39(3):201-212.

工程数学学报

2022年第5期

浏览历史

内容加载中请稍等...

人工神经网络中的一种Krylov子空间优化算法被引量：3

参考文献1

二级参考文献18

共引文献169

同被引文献28

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

人工神经网络中的一种Krylov子空间优化算法 被引量：3

参考文献1

二级参考文献18

共引文献169

同被引文献28

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

人工神经网络中的一种Krylov子空间优化算法被引量：3