基于双延迟深度确定性策略梯度的卫星远程变轨控制

Satellite remote orbit change control based on twin delayed deep deterministic policy gradient

下载PDF

导出

摘要在间断性点火与小脉冲作用下的卫星,实现椭圆轨道转移极具困难。因此引入深度强化学习双延迟深度确定性策略梯度算法(Twin Delayed Deep Deterministic policy gradient algorithm,TD3),实现了卫星的远程变轨控制。首先建立合理的卫星变轨模型;其次利用TD3算法来模拟卫星点火操作,同时通过设计多种奖励函数引导卫星不断学习,最终到达目标轨道附近;最后通过仿真实验验证了所提TD3算法能够有效控制卫星到达目标轨道附近。 It is very difficult to realize elliptic orbit transfer of satellites with intermittent ignition and small pulses.Therefore,Twin Delayed Deep Deterministic policy gradient algorithm(TD3)is introduced to realize remote orbit change control of satellites.Firstly,a reasonable satellite orbit change model is established.Then,the TD3 algorithm is used to simulate the satellite ignition operation,and various reward functions are designed to guide the satellite to keep learning and finally reach the target orbit.The simulation experiments verify that the proposed TD3 algorithm can effectively control the satellite to reach the target orbit.

作者邱鹏鹏张易诚曹海涛郑君铮 Qiu Pengpeng;Zhang Yicheng;Cao Haitao;Zheng Junzheng(School of Computer Science and Technology,Zhejiang Sci-tech University,Hangzhou,Zhejiang,310018,China;School of Information Science and Engineering,Zhejiang Sci-tech University)

机构地区浙江理工大学计算机科学与技术学院浙江理工大学信息科学与工程学院

出处《计算机时代》 2023年第11期90-93,共4页 Computer Era

关键词变轨控制相对运动目标轨道深度强化学习 orbit change control relative motion target orbit deep reinforcement learning

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1伍升钢,侯黎强,张智斌,谭炜,李恒年.交会对接远程导引轨道控制状态规划与优化算法[J].飞行器测控学报,2012,31(4):90-94. 被引量：1
2贺京九,袁长清,左晨熠.地球静止轨道混合推进三星库仑编队队形保持控制研究[J].空间控制技术与应用,2021,47(1):15-21. 被引量：1
3杨盛庆,叶文郁,何煜斌,万亚斌.基于势场法的卫星编队保持及其稳定性分析[J].系统仿真学报,2019,31(2):332-338. 被引量：3

二级参考文献9

1郭海林,曲广吉.航天器空间交会过程综合变轨策略研究[J].中国空间科学技术,2004,24(3):60-67. 被引量：13
2陈世明,方华京.大规模智能群体的建模及稳定性分析[J].控制与决策,2005,20(5):490-494. 被引量：18
3Fehse W. Automated Rendezvous and Docking of Spacecraft [M]. London: Cambridge University Press,2003.
4Gill P E. User's Guide For NPSOL: A Fortran Package for Nonliner Programming Systems Optimization Laboratory [M]. Stanford: Department of Operation Research, Stanford University, 1986.
5Jezewski D J. Optimal Rendezvous Trajectories Subject to Arbitrary Perturbations and Constraints[C]//AIAA paper, AIAA/AAS Astrodynamics Specilialist Conference, Hilton Head,S. C,1992.
6王为,马晓兵.地球交会对接任务发射时刻分析[J].载人航天,2010,16(4):37-41. 被引量：1
7孙炳磊,贺亮,韩飞,宋婷.静止轨道卫星高精度悬停编队最优滑模控制器设计[J].空间控制技术与应用,2016,42(6):9-13. 被引量：5
8孙云龙,袁长清,李政广.径向共线多星库仑编队飞行构型保持研究[J].空间控制技术与应用,2018,44(4):16-25. 被引量：2
9王婷.采用混合推进下的库仑卫星编队重构控制研究[J].航天控制,2017,35(2):20-24. 被引量：5

共引文献2

1王小龙,孙冲,方群,李琪,宋硕.基于干扰观测器的航天器编队抓捕控制方法[J].西北工业大学学报,2021,39(5):1012-1021.
2王宇,汪鹏,图布信.基于卫星编队的杆塔状态在线综合监测系统设计[J].计算技术与自动化,2022,41(1):7-11. 被引量：1

1贾雪明.深究天体运动助力“飞天”梦想——卫星的变轨与对接[J].中学生数理化（高考理化）,2023(9):41-42.
2朱莉,王猛,孟兆新,李博,乔际冰.基于强化学习的木工送料平台误差控制研究[J].林产工业,2023,60(11):38-45.
3李永迪,李彩虹,张耀玉,张国胜,周瑞红,梁振英.基于APF-LSTM-DDPG算法的移动机器人局部路径规划[J].山东理工大学学报（自然科学版）,2024,38(1):33-41. 被引量：1
4王健,刘星栋,支晶.火箭定姿定点入轨的最优制导方法[J].航天控制,2023,41(5):42-46.
5王义宇,罗宇航,徐田来,包为民,袁帅,张泽旭,李宸硕,胡志杰.一种离散轨道数据约束下的地月三体轨道脉冲转移算法[J].深空探测学报（中英文）,2023,10(5):481-493. 被引量：1
6陈帝伊,董文辉,袁艺晨,许贝贝.轻量级感知网络学习下风水互补发电系统调节性能分析[J].太阳能学报,2023,44(10):329-338. 被引量：2
7李健涛,王轲昕,刘凯,张天贤.基于深度强化学习的干扰资源分配方法[J].现代雷达,2023,45(10):44-51. 被引量：2
8Zida Liu,Diyuan Li,Quanqi Zhu,Chenxi Zhang,Jinyin Ma,Junjie Zhao.Intelligent method to experimentally identify the fracture mechanism of red sandstone[J].International Journal of Minerals,Metallurgy and Materials,2023,30(11):2134-2146.
9王睿智,彭邦发,姜楠,李杰,吴彦.毛细管共面介质阻挡放电等离子体特性[J].高电压技术,2023,49(10):4445-4457.

计算机时代

2023年第11期

浏览历史

内容加载中请稍等...

基于双延迟深度确定性策略梯度的卫星远程变轨控制

参考文献3

二级参考文献9

共引文献2

相关作者

相关机构

相关主题

浏览历史