基于强化学习的航天器姿态控制器设计

Satellite Attitude Control Based on Reinforcement Learning Method

下载PDF

导出

摘要航天器在轨执行某些任务时,其质量参数会发生未知变化,传统控制方法在这种情况下控制效果不佳。本文提出基于强化学习的航天器姿态控制器设计方法,该方法在姿态控制器训练过程中不需要对航天器进行动力学建模,不依赖航天器的质量参数。当质量参数发生较大未知变化时,训练好的控制器仍然可以保持较好的控制效果。仿真测试表明:使用基于强化学习方法训练的控制器确实具有良好的鲁棒性。此外,回报函数的设计会明显影响姿态控制器的训练,因此对不同的回报函数设计进行了研究。 Owing to the growing complexity of space mission, classical control methods cannot meet the increasing high requirements for the robustness and adaptiveness of the satellite attitude control system. In this paper, a design method for the satellite attitude control system is proposed based on the reinforcement learning(RL) method.With the proposed method, it is not necessary to establish a dynamic model for the spacecraft in the training process of the attitude controller, and the satellite attitude control system is independent of the spacecraft mass parameters.Besides, when the mass parameters change, the trained controller can still maintain a good control effect. The test results show that the control system trained by the RL method has a stronger adaptive capability. In addition, since the design of the return function will significantly affect the training effect, different return function designs are also studied.

作者张瑞卿钟睿徐毅 ZHANG Ruiqing;ZHONG Rui;XU Yi(School of Astronautics,Beihang University,Beijing 102206,China;Shanghai Institute of Satellite Engineering,Shanghai 201109,China)

机构地区北京航空航天大学宇航学院上海卫星工程研究所

出处《上海航天（中英文）》 CSCD 2023年第1期80-85,共6页 Aerospace Shanghai（Chinese&English）

基金国家自然科学基金(11772023) 上海航天科技创新基金(SAST2019-040)。

关键词航天器姿态控制鲁棒性强化学习神经网络回报函数 attitude control robustness reinforcement learning neural network reward function

分类号 V448.223 [航空宇航科学与技术—飞行器设计]

引文网络
相关文献

参考文献3

1王金华,薄煜明,高旭东,尹海宁.FY-3(05)星主动对月定标控制技术研究[J].上海航天（中英文）,2021,38(2):37-44. 被引量：3
2刘峰,岳宝增,马伯乐,申云峰.燃料消耗下充液航天器等效动力学建模与分析[J].力学学报,2020,52(5):1454-1464. 被引量：10
3毛旭光,陈洲.航天器姿态控制算法研究综述[J].电脑与信息技术,2016,24(2):25-29. 被引量：1

二级参考文献32

1刘峰,岳宝增,唐勇.多充液贮腔航天器耦合动力学与姿态控制[J].宇航学报,2020,41(1):19-26. 被引量：7
2宋斌,马广富,李传江,吕建婷.基于偏航观测器的偏置动量卫星姿态控制[J].哈尔滨工程大学学报,2007,28(1):15-20. 被引量：4
3王曙光,张伟.偏置动量卫星偏航姿态估计与控制研究[J].上海航天,2006,23(6):18-21. 被引量：4
4周黎妮,唐国金,李海阳.航天器姿态机动的自抗扰控制器设计[J].系统工程与电子技术,2007,29(12):2122-2126. 被引量：23
5WERTZ J R. Spacecraft attitude determination and control [M]. Springer Science & Business Media, 2012.
6YANG C-C, LAI L-C, WU C-L Minimal energy maneuvering control of a rigid spacecraft with momentum transfer [J]. Journal of the Franklin Institute, 2007, 344(7): 991-1005.
7TEWARI A.Optimal nonlinear spacecraft attitude control through Hamilton-Jacobi formulation [J]. The Journal of the astronautical sciences, 2002, 50(1): 99-112.
8LIANG Y-W, XU S-D, CHU T-C, et al. Application of VSC reliabte design to spacecraft attitude tracking; proceedings of the American Control Conference, 2005 Proceedings of the 2005, F, 2005 [C]. IEEE.
9ZOU A-M, KUMAR K D, HOU Z-G. Quatemion-based adap- tive output feedback attitude control of spacecraft using Cheby- shev neural networks [J]. Neural Networks, IEEE Transactions on, 2010, 21(9): 1457-1471.
10GUAN P, LIU X-J, LIU J-Z. Adaptive fuzzy sliding mode con- trol for flexible satellite [J]. Engineering Applications of Artificial Intelligence, 2005, 18(4): 451-459.

共引文献11

1孔伟振,陈占魁,田强.基于ISPH-TLSPH的充液多柔体动力学建模与计算[J].中国科学：物理学、力学、天文学,2022,52(4):80-95. 被引量：2
2王佐,吴文军,姜丙超,高超南.球形贮箱内液体横向晃动问题的系统辨识与参数化等效建模[J].广西科技大学学报,2022,33(3):1-7. 被引量：2
3卢煜,岳宝增,马伯乐,郝柏隆,常园园,张薇.重力环境下液体大幅晃动运动脉动球模型及实验研究[J].力学学报,2022,54(9):2543-2551. 被引量：2
4王志亮,周炳红,孙志斌.充液椭球形Cassini贮箱刚-液耦合晃动特性试验研究[J].科学技术与工程,2023,23(12):5312-5321.
5茹煜,薛江坤,刘彬,方树平,胡晨明,周杰.直升机施药药箱药液阻尼防晃模拟及试验[J].农业工程学报,2023,39(9):55-63.
6乔辉,王妮丽,杨晓阳,郭强,蒯文林,徐国庆,张冬冬,李向阳.大气环境监测卫星宽幅成像仪高性能碲镉汞红外探测芯片[J].上海航天（中英文）,2023,40(3):99-110. 被引量：1
7林晓冬,张锐,刘芳,兰青.基于变分模态分解的复杂航天器姿态扰动分析[J].振动与冲击,2023,42(13):303-309. 被引量：2
8李迎杰,关欣,温渊,张苗苗,桂利佳,李云端.高光谱观测卫星对月定标模式设计[J].大气与环境光学学报,2023,18(4):281-294.
9聂国强,孟文俊,廖宣琳.基于光滑整形的钢包快速精准定位研究[J].起重运输机械,2023(15):33-39.
10吴涛涛,宋晓娟,吕书锋.充液挠性航天器姿态机动终端滑模控制[J].空间科学学报,2023,43(4):758-767.

1龚仁喜,顾佳宇.负荷虚拟同步机惯性与阻尼自适应控制策略[J].电测与仪表,2023,60(3):130-135. 被引量：2
2郁立勇,李宝玉,秦昌茂.飞行器自适应ESO姿态控制器设计[J].飞控与探测,2022,5(6):26-31. 被引量：1
3买华.基于电磁兼容设计的开关磁阻电机跟踪控制技术[J].电动工具,2023(1):11-16.
4杨子民.基于双层强化学习的热电联供型微网群经济调度[J].智能电网（汉斯）,2023,13(1):15-28.
5左一帆,方玉明,马柯德.深度学习时代图像融合技术进展[J].中国图象图形学报,2023,28(1):102-117. 被引量：4
6任书海,游华明.基于PID的直流电动机转速控制系统设计[J].信息记录材料,2023,24(1):39-41. 被引量：1
7孙益辉,易灵芝,夏云芝,田原.基于强化学习的物联网可信信息覆盖优化算法[J].华中科技大学学报（自然科学版）,2023,51(2):32-38.
8王潇,李永强,许雪冬,曲娜.基于强化学习的飞机发动机健康维护[J].沈阳航空航天大学学报,2022,39(6):80-86.
9李茂捷,徐国政,高翔,谭彩铭.基于元Q学习与DDPG的机械臂接近技能学习方法[J].南京邮电大学学报（自然科学版）,2023,43(1):96-103. 被引量：2
10任志刚,吴宗泽,谢胜利.基于控制参数化的注塑工业过程最优反馈控制方法[J].控制理论与应用,2022,39(11):2125-2136. 被引量：1

上海航天（中英文）

2023年第1期

浏览历史

内容加载中请稍等...

基于强化学习的航天器姿态控制器设计

参考文献3

二级参考文献32

共引文献11

相关作者

相关机构

相关主题

浏览历史