期刊文献+

Adaptive Optimal Control of Space Tether System for Payload Capture via Policy Iteration 被引量:2

基于策略迭代的空间系绳载荷捕获自适应最优控制
下载PDF
导出
摘要 The libration control problem of space tether system(STS)for post-capture of payload is studied.The process of payload capture will cause tether swing and deviation from the nominal position,resulting in the failure of capture mission.Due to unknown inertial parameters after capturing the payload,an adaptive optimal control based on policy iteration is developed to stabilize the uncertain dynamic system in the post-capture phase.By introducing integral reinforcement learning(IRL)scheme,the algebraic Riccati equation(ARE)can be online solved without known dynamics.To avoid computational burden from iteration equations,the online implementation of policy iteration algorithm is provided by the least-squares solution method.Finally,the effectiveness of the algorithm is validated by numerical simulations. 研究了基于空间系绳系统载荷捕获后的摆振控制问题。载荷捕获会造成系绳的摆振并导致系绳偏离标称位置。由于捕获后系统存在未知的动力学参数,提出了基于策略迭代的自适应最优控制算法,应用于载荷捕获后系绳系统摆动的稳定控制。通过引入积分强化学习方法,在系统动力学未知情况下在线求解代数黎卡提方程。为了避免迭代方程求解的计算负担,采用最小二乘方法在线实施策略迭代算法。最后,通过数值仿真验证了算法的有效性。
作者 FENG Yiting ZHANG Ming GUO Wenhao WANG Changqing 冯毅庭;张鸣;郭闻昊;王长青(西北工业大学自动化学院,西安710129;北京宇航系统工程研究所,北京100076)
出处 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI CSCD 2021年第4期560-570,共11页 南京航空航天大学学报(英文版)
基金 supported by the National Natural Science Foundation of China(No.62111530051) the Fundamental Research Funds for the Central Universities(No.3102017JC06002) the Shaanxi Science and Technology Program,China(No.2017KW-ZD-04).
关键词 space tether system(STS) payload capture policy iteration integral reinforcement learning(IRL) state feedback 空间系绳系统 载荷捕获 策略迭代 积分强化学习 状态反馈
  • 相关文献

参考文献1

二级参考文献9

共引文献9

同被引文献13

引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部