针对时变轨迹的非线性仿射系统的鲁棒近似最优跟踪控制被引量：5

Robust approximate optimal tracking control of time-varying trajectory for nonlinear affine systems

下载PDF

导出

摘要针对非线性连续系统难以跟踪时变轨迹的问题,本文首先通过系统变换引入新的状态变量从而将非线性系统的最优跟踪问题转化为一般非线性时不变系统的最优控制问题,并基于近似动态规划算法(ADP)获得近似最优值函数与最优控制策略.为有效地实现该算法,本文利用评价网与执行网来估计值函数及相应的控制策略,并且在线更新二者.为了消除神经网络近似过程中产生的误差,本文在设计控制器时增加一个鲁棒项;并且通过Lyapunov稳定性定理来证明本文提出的控制策略可保证系统跟踪误差渐近收敛到零,同时也验证在较小的误差范围内,该控制策略能够接近于最优控制策略.最后给出两个时变跟踪轨迹实例来证明该方法的可行性与有效性. For continuous time nonlinear systems, it is difficult to track their time-varying trajectory. To deal with this problem, we use a system transformation to introduce a new state variable for converting the optimal tracking problem of nonlinear systems into optimal control problem of general nonlinear time-invariant systems. For this system, we obtain the approximate optimal value function and the approximate optimal control policy based on approximate dynamic program- ming （ADP）. Then, we use the critic network and the actor network to estimate the value function and the corresponding control strategy, and update both of them online. Besides, a robust control term is added to the controller to eliminate the residual errors generated in the process of neural network approximation. By using the Lyapunov stability theorem, we prove that the proposed control strategy can guarantee the tracking error to converge asymptotically to zero, and the control strategy is close to the optimal control strategy when the error is in a small bound. Finally, simulations of two time-varying trajectory tracking examples show the feasibility and effectiveness of the proposed method.

作者屈秋霞罗艳红张化光

机构地区东北大学信息科学与工程学院

出处《控制理论与应用》 EI CAS CSCD 北大核心 2016年第1期77-84,共8页 Control Theory & Applications

基金国家自然科学基金项目(61273029 61273027) 辽宁省自然科学基金(2013020037) 高等学校博士学科点专项科研基金(20110042120032) 中央高校基本科研基金项目(N130504004 N140404004)资助~~

关键词非线性仿射系统时变轨迹最优控制跟踪问题渐近稳定 nonlinear affine systems time-varying trajectory optimal control tracking problem asymptotic stability

分类号 TP13 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献18

1HUANG Y,LIU D.Neural-network-based optimal tracking control scheme for a class of unknown discrete-time nonlinear systems using iterative ADP algorithm[J].Neurocomputing,2012,10(3):325-331.
2SONG R,XIAO W,SUN C.Optimal tracking control for a class of unknown discrete-time systems with actuator saturation via databased ADP algorithm[J].Neurocomputing,2010,39(9):1293-1302.
3ZHANG H,CUI L,ZHANG X,et al.Data-driven robust approximate optimal tracking control for unknown general nonlinear systems using adaptive dynamic programming method[J].IEEE Transactions on NeuralNetworks,2011,22(12):2226-2236.
4WANG D,LIU D,WEI Q.Finite-horizon neuro-optimal tracking control for a class of discrete-time nonlinear systems using adaptive dynamic programming approach[J].Neurocomputing,2012,78(1):14-22.
5LUO Y,LIANG M.Approximate optimal tracking control for a class of discrete-time non-affine systems based on GDHP algorithm[C]//The 4th International Workshop on Advanced Computational Intelligence.Wuhan:International Workshop on Advanced Computational Intelligence,2011:143-149.
6DIERKS T,JAGANNATHAN S.Optimal tracking control of affine nonlinear discrete-time systems with unknown internal dynamics[C]//Proceedings of the 48th IEEE Conference on Decision and Control.Shanghai:IEEE,2009:6750-6755.
7ZHANG H,WEI Q,LUO Y.A novel infinite-time optimal tracking control scheme for a class of discrete-time nonlinear systems via the greedy hdp iteration algorithm[J].IEEE Transactions on Systems,Man and Cybernetics,Part B,2008,38(4):937-942.
8WERBOS P J.Approximate dynamic programming for real time control and neural modeling[M]//Handbook of Intelligent Control.New York:Multiscience Press,1992.
9李晓理,刘德馨,贾超,丁大伟.基于自适应动态规划的多设定值跟踪控制方法[J].控制理论与应用,2013,30(6):709-716. 被引量：8
10林小峰,黄元君,宋春宁.带ε误差限的近似最优控制[J].控制理论与应用,2012,29(1):104-108. 被引量：2

二级参考文献31

1孙明轩,王郸维,陈彭年.有限区间非线性系统的重复学习控制[J].中国科学：信息科学,2010,40(3):433-444. 被引量：11
2席裕庚,王凡.非线性系统预测控制的多模型方法[J].自动化学报,1996,22(4):456-461. 被引量：60
3孙明轩,何熊熊,俞立.迭代学习控制器设计:一种有限时间死区方法[J].控制理论与应用,2007,24(3):349-355. 被引量：9
4LANDELIUS T. Reinforcement learning and distributed local model synthesis[D]. Linkoping, Sweden: Dissertation, Linkoping University, 1997.
5AL-TAMIMI A, LEWIS F L, ABU-KHALAF M. Discrete-time non- linear HJB solution using approximate dynamic programming: convergence proof[J]. 1EEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics, 2008, 38(4): 943 - 950.
6WANG F Y, JIN N, LIU D R, et al. Adaptive dynamic programming for finite-horizon optimal control of discrete-time system with epsilon-error bound[J]. IEEE Transactions on Neural Networks, 2011, 22(1): 24 - 36.
7WERBOS P J. Approximate dynamic programming for real-time control and neural modeling[M] //WHITE D A, SOFGE D A. In Handbook of Intelligent Control: Neural, Fuzzy, and Adaptive Approaches, New York: Van Nostrand Reinhold, 1992.
8ABU-KHALAF M, LEWIS F L. Nearly optimal control laws for non- linear systems with saturating actuators using a neural network HJB approach[J]. Automatica, 2005, 41(5): 779 - 791.
9Xinsheng Zhang,Xiaoping Jiang.J.Chromatography A,1994,671:23
10Sevenich G J,Fritz J S.Anal Chem,1983,55:12

共引文献27

1孙明轩,张伟博,严求真.非参数不确定系统约束迭代学习控制[J].控制理论与应用,2014,31(4):479-484. 被引量：14
2张华,陶洪峰,杨慧中.初态偏移非线性系统跟踪控制的迭代学习算法[J].江南大学学报（自然科学版）,2014,13(3):253-257.
3李向阳.基于有限时间跟踪微分器的迭代学习控制[J].自动化学报,2014,40(7):1366-1375. 被引量：8
4严求真,孙明轩.非参数不确定系统状态受限误差跟踪学习控制方法[J].控制理论与应用,2015,32(7):895-901. 被引量：9
5严求真,孙明轩.非线性不确定系统准最优学习控制[J].自动化学报,2015,41(9):1659-1668. 被引量：7
6严求真,孙明轩,李鹤.任意初值非线性不确定系统的迭代学习控制[J].自动化学报,2016,42(4):545-555. 被引量：13
7李相俊,张晶琼,何宇婷,惠东.基于自适应动态规划的储能系统优化控制方法[J].电网技术,2016,40(5):1355-1362. 被引量：31
8殷春武,侯明善,李明翔.姿态变化一致有界的姿态稳定控制器设计[J].控制与决策,2016,31(8):1493-1498. 被引量：3
9王丽梅,孙璐.直驱XY平台的改进鲁棒迭代学习控制[J].电机与控制学报,2016,20(9):1-8. 被引量：13
10孙景亮,刘春生.基于自适应动态规划的导弹制导律研究综述[J].自动化学报,2017,43(7):1101-1113. 被引量：24

同被引文献27

1梁学斌,吴立德.Hopfield型神经网络的全局指数稳定性及其应用[J].中国科学（A辑）,1995,25(5):523-532. 被引量：48
2季策,张化光.多时滞Hopfield神经网络的鲁棒稳定性及吸引域的估计[J].控制理论与应用,2005,22(4):538-542. 被引量：2
3关焕新,王占山,张化光.不确定双向联想记忆神经网络的稳定性分析[J].控制理论与应用,2008,25(3):421-426. 被引量：3
4李保坤,曹毅,黄真,张文祥.基于单位四元数的Stewart机构姿态工作空间研究[J].机器人,2008,30(4):353-358. 被引量：7
5孙胜,周荻.有限时间收敛变结构导引律[J].宇航学报,2008,29(4):1258-1262. 被引量：37
6丁世宏,李世华.有限时间控制问题综述[J].控制与决策,2011,26(2):161-169. 被引量：86
7程世利,吴洪涛,王超群,姚裕,朱剑英.平面平台型Stewart并联机构的奇异性分析[J].机械工程学报,2011,47(9):1-7. 被引量：22
8周洪波,裴海龙,贺跃帮,赵运基.基于滤波反步法的无人直升机轨迹跟踪控制[J].控制与决策,2012,27(4):613-617. 被引量：18
9孙秀云,方勇纯,孙宁.小型无人直升机的姿态与高度自适应反步控制[J].控制理论与应用,2012,29(3):381-388. 被引量：29
10张欣,会国涛,罗艳红.基于ADP方法求解未知非线性零和微分对策问题[J].东北大学学报（自然科学版）,2012,33(12):1673-1676. 被引量：1

引证文献5

1张欣,薄迎春,崔黎黎.离散非线性零和博弈的事件驱动最优控制方案[J].控制理论与应用,2018,35(5):619-626. 被引量：2
2安航,鲜斌.无人直升机的姿态增强学习控制设计与验证[J].控制理论与应用,2019,36(4):516-524. 被引量：9
3陈燕妮,刘春生,孙景亮.基于自适应最优控制的有限时间微分对策制导律[J].控制理论与应用,2019,36(6):877-884. 被引量：9
4刘丽缤,游星星,高小平.具有混合时滞的四元数神经网络全局同步性控制[J].控制理论与应用,2019,36(8):1360-1368. 被引量：4
5王丽,蔡锁宁.刚体空间定位问题的最优控制研究[J].机械制造与自动化,2020,49(3):198-201.

二级引证文献24

1梁思远,周金浛,高占宝,于劲松,宋悦,张健.机电系统健康状态预测和维修决策的双向优化方法[J].仪器仪表学报,2023,44(1):131-142. 被引量：2
2王雨琪,宁国栋,王晓峰,郝明瑞,王江华.基于微分对策的临近空间飞行器机动突防策略[J].航空学报,2020(S02):69-78. 被引量：13
3鲜斌,林嘉裕.基于强化学习的小型无人直升机有限时间收敛控制设计[J].控制与决策,2020,35(11):2646-2652. 被引量：2
4金辉,张子豪.基于自适应动态规划的HEV能量管理研究综述[J].汽车工程,2020,42(11):1490-1496. 被引量：18
5徐晓惠,杨继斌.具有可变延时的四元数神经网络的指数稳定性[J].西华大学学报（自然科学版）,2021,40(1):34-45. 被引量：2
6孙筵龙,何俊,邢琰.轮腿式火星探测机器人的多目标协同控制[J].航空学报,2021,42(1):320-332. 被引量：7
7毛柏源,李君龙,张锐,张鹏飞.拦截高速机动目标的捕获区及微分对策导引律[J].国防科技大学学报,2021,43(3):165-174. 被引量：5
8安思宇,陈明.具有输出受限的机械臂固定时间跟踪控制[J].控制工程,2021,28(8):1547-1552. 被引量：7
9侯捷,陈谋,刘楠.基于径向基函数神经网络与扩张状态观测器的无人直升机控制[J].控制理论与应用,2021,38(9):1361-1371. 被引量：7
10唐鹏,戴跃洪,李照阳.无人直升机姿态/垂向速率SDRE控制[J].电光与控制,2021,28(10):67-71.

1刘白雁,陈奎生.电液非线性系统自适应控制的非线性参考模型方法[J].机床与液压,2004,32(2):21-23. 被引量：7
2沈艳军,何统洲.基于动态神经网络非线性仿射系统H_∞控制(一)[J].郧阳师范高等专科学校学报,2005,25(3):18-20. 被引量：1
3沈艳军,何统洲.基于动态神经网络非线性仿射系统H_∞控制(二)[J].郧阳师范高等专科学校学报,2005,25(6):25-28.
4夏小华,高为炳.关于一类非线性仿射系统的开环解耦问题[J].北京航空航天大学学报,1989,15(4):109-113.
5刘若峰,曹大铸.一类非线性连续系统参数估计方法[J].自动化学报,1990,16(5):460-464. 被引量：4
6尹作友,张化光.基于模糊模型的非线性时滞系统的H∞鲁棒容错控制[J].系统仿真学报,2008,20(24):6783-6786. 被引量：1
7蒋沅,曾令武,赵文龙.一类非线性仿射系统的滑模降阶控制器设计[J].控制与决策,2013,28(3):476-480.
8何德峰,宋秀兰,俞立.约束不确定非线性系统的鲁棒优化镇定[J].控制理论与应用,2013,30(5):632-636. 被引量：2
9解学军,张大雷.基于径向基函数网络或模糊系统的非线性连续时间系统的自适应调节[J].系统工程理论与实践,2000,20(2):8-14. 被引量：2
10刘延年,忻欣,冯纯伯.基于神经网络的一类非线性连续系统的稳定自适应控制[J].控制理论与应用,1996,13(1):70-75. 被引量：9

控制理论与应用

2016年第1期

浏览历史

内容加载中请稍等...

针对时变轨迹的非线性仿射系统的鲁棒近似最优跟踪控制被引量：5

参考文献18

二级参考文献31

共引文献27

同被引文献27

引证文献5

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

针对时变轨迹的非线性仿射系统的鲁棒近似最优跟踪控制 被引量：5

参考文献18

二级参考文献31

共引文献27

同被引文献27

引证文献5

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

针对时变轨迹的非线性仿射系统的鲁棒近似最优跟踪控制被引量：5