基于改进ADHDP算法的倒立摆学习控制

Pendulum learning control based on improved ADHDP algorithm

下载PDF

导出

摘要针对动态规划中的"模型灾"和"维数灾"问题,提出了不需要数学模型和最优控制的执行依赖启发式动态规划(Action-dependent Heuristic Dynamic Programming,ADHDP),而ADHDP执行网络和评价网络采用基于监督学习的误差反向传播(BP)算法,但BP算法收敛速度较慢.在此基础上建立了以径向基神经网络(RBFNN)为执行网络和评价网络,并以梯度下降算法为网络的在线学习算法,对ADHDP的控制算法进行改进.通过用倒立摆学习控制模型进行仿真,验证了改进的ADHDP算法具有良好的控制性能和鲁棒性. A method named ADHDP(Action-dependent Heuristic Dynamic Programming)was proposed against the problems of dynamic programming“model disaster”and“dimension disaster”.But,critic network and action network of ADHDP using Back Propagation,but BP algorithm converges slowly.On the basis of this,critic network and action network used Radial Basis Function Neural Network,gradient descent algorithm for network online learning algorithm to improved ADHDP control algorithm.The pendulum system model is simulated,the experimental results showed that the method is the effectiveness and robustness under different environmental conditions.

作者梁英波张利红 LIANG Yingbo;ZHANG Lihong(Dean’s office Zhoukou Normal University,Zhoukou 466001,China;Department of Physics and Telicomunication Engineering, Zhoukou Normal University, Zhoukou 466001,China)

机构地区周口师范学院教务处周口师范学院物理与电信工程学院

出处《周口师范学院学报》 CAS 2017年第5期46-49,共4页 Journal of Zhoukou Normal University

基金河南省高等学校重点科研项目(No.16B510009) 周口师范学院教育教学改革研究项目(No.J2016050)

关键词执行依赖启发式动态规划径向基神经网络梯度下降在线学习 ADHDP RBF gradient descent online leaning

分类号 TN911 [电子电信—通信与信息系统] TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献3

1张文广,徐宇茹,姜鹏,史贤俊.基于IGA算法优化的RBF神经网络应用[J].海军航空工程学院学报,2010,25(3):271-275. 被引量：6
2林嘉宇,刘荧.RBF神经网络的梯度下降训练方法中的学习步长优化[J].信号处理,2002,18(1):43-48. 被引量：20
3傅剑,陆世辉,李绘英,余愿.基于自适应动态规划的三容水箱液位控制[J].武汉理工大学学报（信息与管理工程版）,2011,33(4):576-580. 被引量：2

二级参考文献21

1韩光信,张桂芹,施云贵.三容系统H_∞控制[J].吉林化工学院学报,2004,21(4):37-39. 被引量：2
2邓志东,孙增圻.利用线性再励的自适应变步长快速BP算法[J].模式识别与人工智能,1993,6(4):319-323. 被引量：37
3李学军,徐俊山.三容模糊控制系统设计[J].长春大学学报,2004,14(6):8-10. 被引量：3
4赵科,王生铁,张计科.三容水箱的机理建模[J].控制工程,2006,13(6):521-524. 被引量：29
5朱海荣,杨奕,姜平,周根荣.三容系统的智能神经网络模糊控制研究[J].电气传动,2007,37(7):46-49. 被引量：2
6HONGMEI LIU, PINGECHAO OUYANG, SHAOPING WANG. Fault detection based on RBF neural network in a hydraulic position servo system[C]//The 6th World Congress on Control and Automation. Dalian, China, 2006:5708-5712.
7ZHIHONG QIE, XINMIAO WU, HITOSHI FURUTA, et al. The method of calculating hysteresis time of piezometrie tube for earth-rock dam based on GA-RBF[C]//The 6th World Congress on Control and Automation. Dalian, China, 2006:8523-8527.
8SRINIVAS M, PATNAIK L M. Adaptive probabilities of crossover and mutation in genetic algorithms[J]. IEEE Trans. On SMC, 1994,24(4):656-667.
9CHEN S, CHNG E S, ALKADHIMI K. Regularized orthogonal least squares algorithm for constructing radial basis function networks[J]. International Journal of Control, 1996,64(5):829-837.
10BELLMAN R, DREYFUS S. Applied dynamic programming princeton [ M ]. NJ : Princeton Univ Press, 1962 : 25 - 50.

共引文献25

1夏玉宝,何辅云,葛飞.基于多传感器数据融合的漏磁信号采集与处理[J].电子技术应用,2008,34(2):116-118. 被引量：3
2袁朝辉,石长海.基于RBF神经网络的电液伺服系统应用研究[J].机电一体化,2008,14(8):65-69. 被引量：1
3童菲,晁勤,袁铁江,李玉军.基于神经网络的双馈风电机组转速PID控制仿真[J].电力系统保护与控制,2009,37(19):14-18. 被引量：8
4王随平,胡杰,杜顺起.基于RBF神经网络自适应PID控制的回转窑温度控制[J].可编程控制器与工厂自动化（PLC FA）,2010(11):93-95.
5王剑,薛飞.一种RBF神经网络的自适应学习算法[J].现代电子技术,2011,34(3):141-143. 被引量：8
6史贤俊,张文广,张艳,张树团.PSO-RBF神经网络在舵机系统故障诊断中的应用[J].海军航空工程学院学报,2011,26(2):131-135. 被引量：8
7张昊,陈自力,齐晓慧.基于RBF神经网络PID的无人动力伞控制[J].计算机技术与发展,2012,22(2):206-208.
8瞿睿,李界家.基于RBF神经网络的PID控制在变风量空调系统中的应用[J].现代建筑电气,2012,3(2):10-13. 被引量：2
9王斌,杨旭玮,余茂全.无刷直流电机的RBF神经网络自适应控制研究[J].微型机与应用,2012,31(9):69-71. 被引量：1
10周玉龙,何永强,张维安.红外鱼眼系统下的多目标威胁评估研究[J].光学学报,2012,32(6):53-59. 被引量：3

1李琦,武旭丹.基于ADHDP的热源供热优化控制[J].信息与控制,2017,46(5):627-633. 被引量：1
2陈嘉文,程月华,姜斌,陆宁云,杨天社.面向任务约束的航天器姿控系统在轨重构算法[J].宇航学报,2017,38(9):989-997. 被引量：10
3王伯伊,廖志军.基于启发式动态规划的冷热源优化控制[J].电子制作,2017,25(19):23-25.
4葛汶鑫.PID控制技术平衡动态倒立摆的探索[J].信息通信,2017,30(5):17-18.
5易外军.浅谈如何提高农村小学数学教师教学能力[J].成功,2017(5):174-174.
6陈志刚,阮晓钢,李元,林佳,朱晓庆.一种双惯性轮空间倒立摆及其动力学建模和分析[J].计算机测量与控制,2017,25(11):257-261.
7于东平,逯相雪,王力锋.我国中小企业扶持性政策执行研究态势评析——基于共词分析法[J].科技和产业,2017,17(9):103-109. 被引量：1
8王志会,王壮,蒋李兵.基于线特征差分投影的空间目标姿态估计方法[J].信号处理,2017,33(10):1377-1384. 被引量：7
9黎景平,李亚宁,吴小平,刘松清,王学雷.基于RBFNN的焦化烟气脱硫脱硝过程建模[J].燃料与化工,2017,48(5):52-56. 被引量：1
10赵金刚,戈新生.基于动态规划的机器人运动规划最优控制[J].控制工程,2017,24(11):2374-2379. 被引量：2

周口师范学院学报

2017年第5期

浏览历史

内容加载中请稍等...

基于改进ADHDP算法的倒立摆学习控制

参考文献3

二级参考文献21

共引文献25

相关作者

相关机构

相关主题

浏览历史