基于梯度算法的跟踪最优控制器设计及仿真

Optimal Tracking Control Based on Gradient Estimation Algorithm

下载PDF

导出

摘要应用自适应梯度算法和自适应动态规划方法,在线求解非线性系统的最优跟踪控制。首先对所求非线性系统给定性能指标,其次根据系统和性能指标建立哈密尔顿函数,再用神经网络逼近性能指标,然后用另一个神经网络逼近近似最优控制,神经网络权重参数应用自适应梯度算法在线进行估计,最后基于所求结果以及所设计的稳态控制和鲁棒项,求得系统鲁棒最优跟踪控制,对参数收敛性和系统稳定性进行了详细分析。仿真结果表明了本文所提出方法的有效性。 Based on the gradient estimation algorithm and adaptive dynamic programming, this paper solved the optimal control problem online. At first, regarding to the nonlinear system, a performance index was proposed. Then a Hamiltonian（HJB） function was constructed and a neural network（NN） was used to approximate the performance index. Another neural network was proposed to approach the actor, and both critic and actor NN weights are estimated based on gradient estimation online and simultaneously. Furthermore, steady-state control and robust term were designed to obtain the robust optimal control. At last, simulation results proved the effectiveness of the proposed methods.

作者姚庆华和永军郭镇江伏冬孝

机构地区云南省交通科学研究院

出处《计算机与现代化》 2016年第12期34-37,共4页 Computer and Modernization

关键词自适应动态规划梯度估计跟踪控制最优控制 Adaptive Dynamic Program（ADP） gradient algorithm tracking control optimal control

分类号 TP813 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献3

1张化光,张欣,罗艳红,杨珺.自适应动态规划综述[J].自动化学报,2013,39(4):303-311. 被引量：77
2陈瑶,张刚.动态规划最优控制在非线性系统中的应用[J].计算技术与自动化,2015,34(4):15-18. 被引量：1
3任雯,闻霞,王维庆.基于线性二次型的单神经元PID最优控制器设计及仿真[J].计算机应用与软件,2008,25(5):123-124. 被引量：8

二级参考文献24

1周美娇,李相林.二次型单神经元PSD控制器及仿真(英文)[J].仪器仪表学报,2003,24(z2):553-555. 被引量：2
2陈之启.基于二次型优化空调PID-DDC系统控制器参数[J].控制工程,2005,12(2):112-115. 被引量：7
3陈宗海,文锋,王智灵.基于自适应评价的非线性系统神经网络控制[J].控制与决策,2007,22(7):765-768. 被引量：3
4B. R. E, Dynamic programming, Princeton: Princeton Uni versity Press, 1957.
5SUTTON R S,BARTO A G. Reinforcement learning: an introduction. Cambridge Univ Press, 1998.
6WERBOS P J. Approximate dynamic programming for real-- time control and neural modeling, Handbook of intelligent control: Neural[J]. fuzzy, and adaptive approaches, 1992, 15: 493--525.
7DREYFUS S E,LAW A M. Art and theory of dynamic pro- gramming[M]. New York: Academic Press, 1977,56.
8MURRAY J J,COX C J,LENDARIS G G, et al. Adaptive dynamic programming, Systems, Man, and Cybernetics, Part C= Applications and Reviews[J]. IEEE Transactions on, 2002, 32(2): 140-153.
9WERBOS P J. A menu of designs for reinforcement learning over time[J]. Neural networks for control, 1990 : 67-95.
10ABU-KHALAF M,LEWIS F L. Nearly optimal control laws for nonlinear systems with saturating actuators using a neural network HJB approach[J]. Automatiea, 2005, 41(5) : 779-- 791.

共引文献83

1刘富,安毅,董博,李元春.基于ADP的可重构机械臂能耗保代价分散最优控制[J].吉林大学学报（工学版）,2020,50(1):342-350. 被引量：4
2蓝雯飞,吴子莹,李强,强小利.动态规划算法的时间效率改进[J].中南民族大学学报（自然科学版）,2016,35(2):135-140. 被引量：6
3于蒙,邹志云,赵丹丹,郭宇晴.基于Delta学习规则的改进型单神经元自适应PID控制器设计[J].冶金自动化,2012,36(4):16-19. 被引量：3
4于蒙,邹志云,赵丹丹,刘兴红,桂新军.基于二次型优化的单神经元PID控制器及其pH过程控制应用[J].计算机与应用化学,2012,29(11):1335-1338. 被引量：3
5会国涛,张化光,汪刚,解相朋,吴振宁.模糊双曲正切模型研究综述[J].自动化学报,2013,39(11):1849-1857. 被引量：3
6刘德荣,李宏亮,王鼎.基于数据的自学习优化控制:研究进展与展望[J].自动化学报,2013,39(11):1858-1870. 被引量：22
7谭拂晓,刘德荣,关新平,罗斌.基于微分对策理论的非线性控制回顾与展望[J].自动化学报,2014,40(1):1-15. 被引量：12
8左姗,宋庆旺,王磊,宋永端.基于RBF神经网络的超导风力发电系统变速控制研究[J].系统科学与数学,2014,34(2):145-157.
9鄢吉多,黄仕雄,张贤信,张大斌.基于单神经元PID新型多能源烟草烤房控制系统的研究[J].现代机械,2014(3):75-78. 被引量：2
10张绍杰,吴雪,刘春生.执行器故障不确定非线性系统最优自适应输出跟踪控制[J].自动化学报,2018,44(12):2188-2197. 被引量：9

1缪应锋,姚庆华,李智雄,宋晓轩.基于梯度估计的非线性系统最优控制及仿真[J].计算机系统应用,2016,25(11):260-264. 被引量：1
2丁国锋,王孙安,林廷圻,史维祥.一种稳定的机器人神经网络控制器研究[J].控制与决策,1997,12(1):43-47.
3周艳杰,曹显兵,莫立坡.不确定二阶多智能体系统的鲁棒最优一致[J].数学的实践与认识,2012,42(21):183-189. 被引量：4
4顾建忠,赵连杰,杨洪勇.带有未知参数的多智能体系统的自适应分布控制[J].系统科学与数学,2015,35(3):342-353. 被引量：2
5马千里,徐华勋,岳凯,李思昆.基于GPU的非结构化网格数据体光照计算与实现方法[J].计算机工程与科学,2011,33(1):82-87. 被引量：1
6Hye-Rin Choi Rae-Hong Park Ji Won Lee.Gradient Estimation for Demosaicking in a Color Filter Array Image[J].通讯和计算机（中英文版）,2013,10(1):59-71.
7尚智强.采用状态反馈实现纯滞后系统的控制[J].自动化与仪器仪表,2002(3):1-3.
8杜琼,富月,李婧怡.具有外部干扰的连续时间线性系统鲁棒最优开环解耦控制[J].系统科学与数学,2016,36(7):1046-1054.
9陈立,陈文艺.GRADIENT ESTIMATES FOR POSITIVE SMOOTH f-HARMONIC FUNCTIONS[J].Acta Mathematica Scientia,2010,30(5):1614-1618. 被引量：3
10赵众,马楠楠,潘立登,徐宁,孙康.Direct Adaptive Control Based on Gradient Estimation[J].Chinese Journal of Chemical Engineering,2008,16(5):752-761.

计算机与现代化

2016年第12期

浏览历史

内容加载中请稍等...

基于梯度算法的跟踪最优控制器设计及仿真

参考文献3

二级参考文献24

共引文献83

相关作者

相关机构

相关主题

浏览历史