基于ADP的状态约束互联非线性系统的分散镇定

Decentralized stabilization of state constrained interconnected nonlinear systems based on adaptive dynamic programming

下载PDF

导出

摘要针对一类含有常数型状态约束的互联非线性系统,提出一种基于自适应动态规划(adaptive dynamic programming,ADP)的分散镇定方法.引入边界函数对原系统进行坐标变换,将状态约束系统转化为无约束系统.对转化后的系统构造独立子系统和改进的代价函数,将鲁棒分散镇定问题转化为最优调节问题.构建局部评判神经网络并采用策略迭代算法求解哈密顿-雅可比-贝尔曼(Hamilton-Jacobi-Bellman,HJB)方程,进而得到近似最优镇定律.通过李雅普诺夫稳定性理论证明了本文所提方法可使闭环互联系统和局部评判神经网络估计误差动态最终一致有界.数值仿真结果验证了所提出分散镇定方法的有效性. tA decentralized stabilization method based on adaptive dynamic programming(ADP)is proposed for a class of interconnected nonlinear systems with constant-value state constraints.A barrier function is introduced so that the original system is converted into an unconstrained system by coordinate transformation.Auxiliary subsystems and improved cost functions enabled transformation of robust decentralized stabilization problem into an optimal regulation problem.The Hamilton-Jacobi-Bellman(HJB)equation is solved by policy iteration after constructing a local critic neural network for each auxiliary subsystem so that an approximate optimal stabilization control law is obtained.According to the Lyapunov stability theory,the proposed method can drive estimation errors of closed-loop interconnected system and local critic neural networks to be ultimately uniformly bounded dynamically.Numerical simulations validate the effectiveness of proposed decentralized stabilization method.

作者赵博杜文千袁郭玲孔杰 ZHAO Bo;DU Wenqian;YUAN Guoling;KONG Jie(School of Systems Science,Beijing Normal University,100875,Beijing,China)

机构地区北京师范大学系统科学学院

出处《北京师范大学学报（自然科学版）》 CAS CSCD 北大核心 2023年第5期749-757,共9页 Journal of Beijing Normal University(Natural Science)

基金国家自然科学基金资助项目(61973330) 北京市自然科学基金资助项目(4212038)。

关键词自适应动态规划强化学习状态约束互联非线性系统分散镇定最优控制 adaptive dynamic programming reinforcement learning state constraints interconnected nonlinear systems decentralized stabilization optimum control

分类号 TP13 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

1粟世玮,胡钰焓,王相,刘飞,熊炜.计及储能荷电状态约束的输配协同机组组合优化[J].智慧电力,2023,51(11):69-75. 被引量：3
2孙凝晖.计算:只有更快,没有最快[J].中国科技财富,2023(9):64-64.
3罗彪,欧阳志华,易昕宁,刘德荣.基于自适应动态规划的移动机器人视觉伺服跟踪控制[J].自动化学报,2023,49(11):2286-2296. 被引量：2
4唐毅雄.关于具有不可分离哈密顿量的平均场控制系统的策略迭代算法的研究[J].应用数学进展,2023,12(5):2364-2375.
5杨晓燕,谢寅波.依托项目化学习,立足单元整体,培养问题解决能力——以教科版《科学》五年级下册“船的研究”为例[J].教学月刊（小学版）（综合）,2023(11):21-25.
6孔祥晔,王如刚,周锋,郭乃宏.基于FPGA的自适应动态规划控制算法研究[J].仪表技术与传感器,2023(10):100-106.
7鄢俊杰.贝尔曼文学翻译批评思想探释[J].黑河学院学报,2023,14(10):136-137.
8苟晓峰.智能化在焦化厂生产系统中的应用[J].太钢科技,2023(3):42-44.
9宋晓程,黄书彦,陈鹏飞,薛文超,李陟.面向空间目标交汇的多拦截器最优部署算法[J].控制理论与应用,2023,40(10):1765-1773.
10张加伟,于金鹏,刘加朋,于海生.基于观测器的异步电动机指令滤波离散控制[J].控制工程,2023,30(10):1891-1899. 被引量：2

北京师范大学学报（自然科学版）

2023年第5期

浏览历史

内容加载中请稍等...

基于ADP的状态约束互联非线性系统的分散镇定

相关作者

相关机构

相关主题

浏览历史