-
题名基于逆强化学习的航天器交会对接方法
- 1
-
-
作者
岳承磊
汪雪川
岳晓奎
宋婷
-
机构
西北工业大学航天飞行动力学技术国家级重点实验室
西北工业大学航天学院
上海航天控制技术研究所
上海市空间智能控制技术重点实验室
-
出处
《航空学报》
EI
CAS
CSCD
北大核心
2023年第19期252-263,共12页
-
基金
国家自然科学基金(U2013206,11972026)。
-
文摘
针对使用神经网络解决追踪航天器接近静止目标问题,提出一种使用模型预测控制提供数据集,基于生成对抗逆强化学习训练神经网络的方法。首先在考虑追踪航天器最大速度约束,控制输入饱和约束和空间锥约束下,建立追踪航天器接近静止目标的动力学,并通过模型预测控制驱动航天器到达指定位置。其次为标称轨迹添加扰动,通过前述方法计算从各起始位置到目标点的轨迹,收集各轨迹各控制时刻的状态与控制信息,形成包含状态与对应控制的训练集。最后通过设置网络结构与参数和训练超参数,在训练集驱动下,采用生成对抗逆强化学习方法进行网络训练。仿真结果表明生成对抗逆强化学习可模仿专家轨迹行为,并成功训练神经网络,驱动航天器从起始点向目标位置运动。
-
关键词
模型预测控制
生成对抗逆强化学习
模仿学习
网络训练
神经网络
-
Keywords
model predictive control
generative adversarial inverse reinforcement learning
imitation learning
networktraining
neural network
-
分类号
V448.234
[航空宇航科学与技术—飞行器设计]
-