Adaptive Optimal Control of Space Tether System for Payload Capture via Policy Iteration 被引量：2

基于策略迭代的空间系绳载荷捕获自适应最优控制

下载PDF

导出

摘要 The libration control problem of space tether system(STS)for post-capture of payload is studied.The process of payload capture will cause tether swing and deviation from the nominal position,resulting in the failure of capture mission.Due to unknown inertial parameters after capturing the payload,an adaptive optimal control based on policy iteration is developed to stabilize the uncertain dynamic system in the post-capture phase.By introducing integral reinforcement learning(IRL)scheme,the algebraic Riccati equation(ARE)can be online solved without known dynamics.To avoid computational burden from iteration equations,the online implementation of policy iteration algorithm is provided by the least-squares solution method.Finally,the effectiveness of the algorithm is validated by numerical simulations. 研究了基于空间系绳系统载荷捕获后的摆振控制问题。载荷捕获会造成系绳的摆振并导致系绳偏离标称位置。由于捕获后系统存在未知的动力学参数,提出了基于策略迭代的自适应最优控制算法,应用于载荷捕获后系绳系统摆动的稳定控制。通过引入积分强化学习方法,在系统动力学未知情况下在线求解代数黎卡提方程。为了避免迭代方程求解的计算负担,采用最小二乘方法在线实施策略迭代算法。最后,通过数值仿真验证了算法的有效性。

作者 FENG Yiting ZHANG Ming GUO Wenhao WANG Changqing 冯毅庭;张鸣;郭闻昊;王长青(西北工业大学自动化学院,西安710129;北京宇航系统工程研究所,北京100076)

机构地区 School of Automation Beijing Institute of Aerospace Systems Engineering

出处《Transactions of Nanjing University of Aeronautics and Astronautics》 EI CSCD 2021年第4期560-570,共11页 南京航空航天大学学报（英文版）

基金 supported by the National Natural Science Foundation of China(No.62111530051) the Fundamental Research Funds for the Central Universities(No.3102017JC06002) the Shaanxi Science and Technology Program,China(No.2017KW-ZD-04).

关键词 space tether system(STS) payload capture policy iteration integral reinforcement learning(IRL) state feedback 空间系绳系统载荷捕获策略迭代积分强化学习状态反馈

分类号 V448.2 [航空宇航科学与技术—飞行器设计]

引文网络
相关文献

参考文献1

1B.S.Yu,H.Wen,D.P.Jin.Review of deployment technology for tethered satellite systems[J].Acta Mechanica Sinica,2018,34(4):754-768. 被引量：10

二级参考文献9

1文浩,金栋平,胡海岩.基于微分包含的绳系卫星时间最优释放控制[J].力学学报,2008,40(1):135-140. 被引量：9
2刘莹莹,周军.近距离绳系卫星动力学与释放方法研究[J].系统仿真学报,2008,20(20):5642-5645. 被引量：9
3苟兴宇,马兴瑞,邵成勋,刘丽霞.绳系子卫星的展开[J].哈尔滨工业大学学报,1998,30(1):11-14. 被引量：3
4王维,李俊峰,宝音贺西.基于粒子群算法的绳系卫星展开与回收控制[J].空间控制技术与应用,2009,35(4):48-51. 被引量：8
5钟睿,徐世杰.可变绳长绳系卫星系统的一种简单张力控制策略[J].中国空间科学技术,2009,29(6):66-73. 被引量：5
6余本嵩,文浩,金栋平.时变自由度绳系卫星系统动力学[J].力学学报,2010,42(5):926-932. 被引量：8
7孔宪仁,徐大富,杨正贤,王本利.空间绳系系统自由展开建模与仿真[J].振动与冲击,2011,30(5):37-42. 被引量：5
8文浩,陈辉,金栋平,胡海岩.带可控臂绳系卫星释放及姿态控制[J].力学学报,2012,44(2):408-414. 被引量：8
9王长青,韦汉林,李爱军,扎伯罗特诺夫.尤里.空间系绳系统展开的滑模变结构控制[J].控制理论与应用,2016,33(1):70-76. 被引量：3

共引文献9

1陈书敏,王长青,扎伯罗特诺夫·尤里,李爱军.空间双体系绳系统展开阶段末端星姿态动力学分析[J].国防科技大学学报,2020,42(2):98-106. 被引量：1
2严冰,张进,罗亚中.面向编队卫星的空间系绳在轨服务[J].系统工程与电子技术,2021,43(3):806-813. 被引量：6
3赵俊淇,陈卫东,余本嵩.基于刚体卫星绳系编队系统的动力学建模及姿态控制[J].动力学与控制学报,2021,19(2):8-14. 被引量：4
4Weipeng Hu,Yulu Huai,Mengbo Xu,Zichen Deng.Coupling dynamic characteristics of simplified model for tethered satellite system[J].Acta Mechanica Sinica,2021,37(8):1245-1254. 被引量：3
5Yue Zhang,Xin Jiang,Zheng-feng Bai,Jia-wen Guo,Cheng Wei.Dynamics and rebound behavior analysis of flexible tethered satellite system in deployment and station-keeping phases[J].Defence Technology（防务技术）,2022,18(3):509-523. 被引量：1
6高怀旭,张晓敏,徐瑞.空间超长波天线绳系系统动力学建模与分析[J].航天控制,2022,40(4):84-90. 被引量：1
7朱彬羽,李海阳,陆林,李兴永,周晚萌.一种面向旋转空间站的绕月双曲交会导引控制方法[J].宇航学报,2023,44(5):774-784.
8许英杰,刘晓路,贺仁杰,左亚辉,宋彦杰.空间碎片主动移除任务规划研究综述[J].控制与决策,2024,39(2):371-380. 被引量：1
9Zhixiong Ji,Gefei Shi.Adaptive neural dynamic-based hybrid control strategy for stable retrieval of tethered satellite systems[J].Astrodynamics,2024,8(2):261-269.

同被引文献13

1李俊芳,李峰,吉月辉,高强.四旋翼无人机轨迹稳定跟踪控制[J].控制与决策,2020,35(2):349-356. 被引量：21
2沈智鹏,曹晓明.输入受限四旋翼飞行器的模糊自适应动态面轨迹跟踪控制[J].控制与决策,2019,34(7):1401-1408. 被引量：15
3梁文勇,吴大伟,谷山强,王海涛,严碧武,刘辉.输电线路多旋翼无人机精细化自主巡检航迹优化方法[J].高电压技术,2020,46(9):3054-3061. 被引量：37
4秦智慧,李宁,刘晓彤,刘秀磊,佟强,刘旭红.无模型强化学习研究综述[J].计算机科学,2021,48(3):180-187. 被引量：28
5朱志斌,王付永,尹艳辉,刘忠信,陈增强.基于Q-learning的离散时间多智能体系统一致性[J].控制理论与应用,2021,38(7):997-1005. 被引量：7
6王慧东,周来宏.四旋翼无人机反步积分自适应控制器设计[J].兵工学报,2021,42(6):1283-1289. 被引量：10
7袁兆麟,何润姿,姚超,李佳,班晓娟.基于强化学习的浓密机底流浓度在线控制算法[J].自动化学报,2021,47(7):1558-1571. 被引量：13
8罗傲,肖文彬,周琪,鲁仁全.基于强化学习的一类具有输入约束非线性系统最优控制[J].控制理论与应用,2022,39(1):154-164. 被引量：6
9司彦娜,普杰信,孙力帆.近似强化学习算法研究综述[J].计算机工程与应用,2022,58(8):33-44. 被引量：5
10修杨,邓宏彬,危怡然,李东方.基于参数估计的四旋翼无人机自适应鲁棒路径跟随控制器[J].兵工学报,2022,43(8):1926-1938. 被引量：5

引证文献2

1杨加秀,李新凯,张宏立,王昊.基于积分强化学习的四旋翼无人机鲁棒跟踪[J].兵工学报,2023,44(9):2802-2813.
2方欣,栾小丽,刘飞.窗口长度自适应调整的策略迭代最优控制[J].控制理论与应用,2024,41(4):745-750.

1郭亮.气体流量计在线校准的技术方法研究[J].中国新技术新产品,2021(10):73-75. 被引量：2
2李仲兴,宋鑫炎,刘晨来,薛红涛.轮毂电机驱动汽车半主动悬架自适应最优控制[J].重庆理工大学学报（自然科学）,2021,35(8):25-32. 被引量：3

Transactions of Nanjing University of Aeronautics and Astronautics

2021年第4期

浏览历史

内容加载中请稍等...