基于BP网络的权值更新快速收敛算法被引量：6

Rapid convergence algorithms for weight values updating based on BP network

下载PDF

导出

摘要针对标准BP网络学习算法收敛慢的问题,提出了两种权值更新的快速收敛算法,即基于梯度变化率的快速传递算法和基于梯度方向的弹性传递算法,并在煤矿事故救援游戏式训练系统中进行仿真和比较,让游戏角色根据井下空气成分学习判断危险程度,以便受训人员或仿生机器人采取相应的措施。仿真结果表明,所提算法的收敛时间比标准算法有一定改善。 To solve the slow convergence of standard learning algorithm in BP network, two rapid convergence algorithms were suggested for weight values updating. One is rapid transmission algorithm based on gradient change rate. The other is flexible transmission algorithm based on gradient orientation. The two algorithms were simulated and compared in Game Style Training System for Mine Accident Rescuing. Here the algorithms would help game roles learn to estimate the danger degree according to ingredients of mine air, and then help trainees or biorobots take corresponding actions. The simulating results show that shorter convergence time is taken for the two algorithms than the standard algorithm.

作者周昌能余雪丽

机构地区太原理工大学计算机学院

出处《计算机应用》 CSCD 北大核心 2006年第8期1940-1942,共3页 journal of Computer Applications

基金山西省自然科学基金资助项目(20041043) 山西省留学回国人员科研资助项目(200336)

关键词快速收敛算法游戏式训练 BP人工神经网络 quick convergence algorithm game style training BP artificial neural network

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献9

1余雪丽,孙承意,冯秀芳,等.神经网络与学习实例[M].北京:中国铁道出版社,1996.
2[美]CHAMPANDARD AJ.Artificial Intelligence from Theory to Fun![EB/OL].http://AiGameDev.com/,2006.
3[美]ROLLINGS A,ADAMS E.游戏设计技术[M].金名,张长富,译.北京:北京希望电子出版社,2004.
4MADEIRA C,et al.Bootstrapping the Learning process for the semiautomated Design of a challenging Game AI[A].Proceeding of AAAI04[C].2004.
5MENDEZ G,HERRERO P,DE ANTONIO A.Intelligent virtual environments for training in nuclear power plants[A].Proceeding of the 6th International Conference on Enterprise Information Systems(ICES 2004)[C].Proto,Portugal,2004.
6MANTOVANI F,GIANLUCA C,GAGGIOLI A,et al.Virtual Reality Training for Health-Care Professionals[J].Cyberpsychology &Behavior,2003,6(4).
7YU XL.Studying on Granularity of Reinforcement Learning Agents[A].IFPS Proceeding of ICAMT/2002[C].2002.
8杨源杰,黄道.人工神经网络算法研究及应用[J].华东理工大学学报（自然科学版）,2002,28(5):551-554. 被引量：28
9徐昕,贺汉根.神经网络增强学习的梯度算法研究[J].计算机学报,2003,26(2):227-233. 被引量：21

二级参考文献21

1Mills P M, Zomaya A Y, Tade M O. Adapative model-based control using neural networks control[J]. 1994, 60:32-35.
2Frier A, Karlton P, Kocher P. The SSL 3.0 Protocol[M]. USA:Netscape, 1996.
3Rivest R. RFC 1321, The MD5 Message Digest Algorithm[S].
4George Apostolopoulos, Vincd Peris, Prashant Pradhan, et al. Securing electronic commerce reducing the SSL overhead[J]. IEEE Network, 2000,(7-8):8-16.
5Baird L C. Residual algorithms: Reinforcement learning with function approximation. In: Proceedings of the 12th International Conference on Machine Learning (ICML95), Tahoe City, California, USA, 1995. 30～37
6Rumelhart D E et al. Learning internal representations by error propagation. In: Rumelhart D E et al, eds. Parallel Distributed Processing: Explorations in the Microstructure of Cognition, Vol.1,Cambridge, MA: MIT Press,1986. 318～362
7Cybenko G. Approximation by superpositions of a sigmoidal function. Mathematics of Control, Signals, and Systems, 1989, 2: 303～314
8Baird L C, Moore A. Gradient descent for general reinforcement learning. In: Kearns M S, Solla S A, Cohn D A eds. Advances in Neural Information Processing Systems 11, Cambrige, MA: MIT Press, 1999. 968～974
9Bertsekas D P, Tsitsiklis J N. Gradient convergence in gradient methods with errors. SIAM Journal on Optimization, 2000, 10(3): 627～642
10Heger M. The loss from imperfect value functions in expectation-based and minimax-based tasks. Machine Learning, 1996, 22(1): 197～225

共引文献47

1黄晓亚.基于BP人工神经网络改进算法的数据挖掘技术应用研究[J].南通职业大学学报,2007,21(4):68-71. 被引量：1
2董沛武,刘微微,娄岩峰.基于遗传算法和神经网络的企业核心竞争力评价模型研究[J].兵工学报,2009,30(S1):114-118. 被引量：6
3张磊,胡春,钱锋.BP算法局部极小问题改进的研究进展[J].工业控制计算机,2004,17(9):33-34. 被引量：17
4王学宁,徐昕,吴涛,贺汉根.策略梯度强化学习中的最优回报基线[J].计算机学报,2005,28(6):1021-1026. 被引量：6
5郭江龙,张树芳,刘永刚,常澍平,冯卫强,陈海平.人工神经网络在火电厂煤耗在线计算中若干问题探讨[J].热力透平,2005,34(2):100-104. 被引量：2
6刘颖,刘丹.成都市城市生活垃圾综合整治规划研究[J].云南环境科学,2005,24(A01):43-45.
7王雪松,程玉虎,易建强,王炜强.基于Elman网络的非线性系统增强式学习控制[J].中国矿业大学学报,2006,35(5):653-657. 被引量：8
8王惠,符策,谢益武,许瑞雪,杨小佳.面向伙伴选择的模糊Markov博弈控制及仿真研究[J].系统仿真学报,2007,19(15):3572-3576. 被引量：1
9王俊丽,胡彧.基于神经网络学习机制的应急决策支持中间件模型[J].山西电子技术,2007(4):57-58.
10贾建军,王建华.神经网络在加工螺旋面中的应用研究[J].中国机械工程,2008,19(16):1935-1938. 被引量：3

同被引文献48

1陈华根,吴健生,王家林,陈冰.模拟退火算法机理研究[J].同济大学学报（自然科学版）,2004,32(6):802-805. 被引量：134
2苏小红,王亚东,马培军.基于反馈调控参数的BP学习算法研究[J].哈尔滨工业大学学报,2005,37(10):1311-1314. 被引量：5
3邹阿金,罗移祥.L egender神经网络建模及股票预测[J].计算机仿真,2005,22(11):241-242. 被引量：7
4张国栋,雷晓玲,彭宏.基于BP神经网络的环境质量评估[J].长沙理工大学学报（自然科学版）,2005,2(4):93-96. 被引量：6
5葛文军,邢贞相.改进的BP神经网络在洪水过程预报中的应用[J].水利科技与经济,2006,12(3):166-167. 被引量：6
6王淑玲,李振涛,邢棉.一种优化神经网络结构的遗传禁忌算法[J].计算机应用,2007,27(6):1426-1429. 被引量：10
7邹亮,徐建闽,朱玲湘,温惠英.基于浮动车移动检测与感应线圈融合技术的行程时间估计模型[J].公路交通科技,2007,24(6):114-117. 被引量：22
8IMRIE C E,DURUCAN S,KORNE A.River flow prediction using artificial networks:gerneralization beyong the calibratioin range[J].Journal of Hydrology,2000,233:138-153.
9KAO J.J neural net for determining DEM-based model drainage pattern[J].Journal of Irrigation and Drainage Engineering,1996,122(2):112-121.
10ZOU RUI,CARTER STEPHEN,SHOEMAKER LESLIE,et al.Integrated hydrodynamic and water quality modeling system to support nutrient total maximum daily load development for Wissahickon Creek,Pennsylvania[J].Journal of Environmental Engineering,2006(4):555-566.

引证文献6

1张雨浓,刘巍,易称福,李巍.Legendre正交基前向神经网络的权值直接确定法[J].大连海事大学学报,2008,34(1):32-36. 被引量：6
2华常春,高桂枝.京杭大运河扬州段水污染研究[J].安徽农业科学,2010,38(27):15197-15199. 被引量：1
3吕琼帅,王世卿.基于遗传模拟退火算法优化的BP神经网络[J].计算机与现代化,2011(6):91-94. 被引量：9
4陈宝远,陈光毅,林喜荣,李昌海,曹晓敏.改进遗传算法径向基函数的FIR数字滤波器研究[J].哈尔滨理工大学学报,2012,17(6):97-101. 被引量：2
5李嘉,刘春华,胡赛阳,王芳.基于交通数据融合技术的行程时间预测模型[J].湖南大学学报（自然科学版）,2014,41(1):33-38. 被引量：16
6吕琼帅,熊蜀峰.基于PCA和蜂群算法优化的BP神经网络[J].计算机应用与软件,2014,31(1):182-185. 被引量：7

二级引证文献41

1张雨浓,麦剑章,肖秀春,李展,易称福.二次型最小化所展现的BP与Hopfield类型神经网络的学习同质性[J].自动化技术与应用,2008,27(9):6-10.
2肖秀春,张雨浓,姜孝华,邹阿金.第二类Chebyshev前向神经网络权值直接确定及结构自适应确定[J].大连海事大学学报,2009,35(1):80-84. 被引量：7
3张雨浓,杨逸文.PID神经元网络之权值直接确定法研究[J].计算机工程与应用,2009,45(19):189-191. 被引量：6
4肖秀春,张雨浓,姜孝华.MISO多元广义多项式神经网络及其权值直接求解[J].中山大学学报（自然科学版）,2009,48(4):42-46. 被引量：7
5张雨浓,李克讷,谭宁.中心、方差及权值直接确定的RBF神经网络分类器[J].计算技术与自动化,2009,28(3):5-9. 被引量：13
6张雨浓,谭宁,李展,莫锦辉.求解线性不定方程组所展现的BP与Hopfield类型神经网络的学习同质性研究[J].中山大学学报（自然科学版）,2010,49(2):1-7. 被引量：4
7范万里,李刚,白宇君,高晓玲.基于模拟退火算法的机车齿轮箱故障诊断系统[J].石家庄铁道大学学报（自然科学版）,2013,26(3):70-73.
8邸斌,张旭,严汇莹.燃气轮机电机转子位置角计算及滤波器参数设计[J].哈尔滨理工大学学报,2014,19(4):122-126. 被引量：2
9李瑞敏,马玮.基于BP神经网络与D-S证据理论的路段平均速度融合方法[J].交通运输工程学报,2014,14(5):111-118. 被引量：15
10张景然,沈牧文,杨建国.基于模拟退火遗传算法优化BP网络的数控机床温度布点优化及热误差建模[J].机床与液压,2014,42(23):1-4. 被引量：8

1YU Xue-li,ZHOU Chang-neng,BAI Ling-fen,LI San-yan.Context-awareness approach in game style application[J].通讯和计算机（中英文版）,2008,5(12):61-65.
2周春光,梁艳春.一种快速收敛的遗传算法[J].软件学报,1996,7(A00):311-314. 被引量：1
3毕瑛炜,张岩.基于卡尔曼滤波的时变稀疏信号快速收敛重构算法[J].计算机应用,2014,34(A02):41-44. 被引量：2
4董玉杰,余雪丽,崔倩,胡凌子.煤矿事故救援游戏式训练系统中的玩家个性化建模研究[J].科技情报开发与经济,2008,18(10):151-153.
5王福文,王海云.前向神经网络训练的一种快速收敛算法[J].电子对抗,1995(1):25-31.
6焦虹,余雪丽.游戏剧本设计研究及在游戏式训练系统中的应用[J].电脑开发与应用,2009,22(5):53-55. 被引量：1
7赵奇修,朱新宇,赵俊修.密闭空间空气成分监控系统的实现[J].工业控制计算机,2010,23(8):83-84.
8王晓彬,余雪丽.游戏开发的脚本机制及在游戏式训练系统中的应用[J].电脑开发与应用,2009,22(4):5-6.
9田俊霞,匡镜明,王华.一种新的基于进化规划方法的盲CMA快速收敛算法[J].信号处理,2006,22(3):395-397. 被引量：3
10李金屏,李素昉,杨波.基于小生境算法和聚类分析的快速收敛遗传算法[J].小型微型计算机系统,2004,25(6):975-978. 被引量：7

计算机应用

2006年第8期

浏览历史

内容加载中请稍等...

基于BP网络的权值更新快速收敛算法被引量：6

参考文献9

二级参考文献21

共引文献47

同被引文献48

引证文献6

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

基于BP网络的权值更新快速收敛算法 被引量：6

参考文献9

二级参考文献21

共引文献47

同被引文献48

引证文献6

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

基于BP网络的权值更新快速收敛算法被引量：6