基于DDQN的运载火箭姿态控制器参数设计被引量：6

Parameter Design of Rocket Attitude Controller Based on DDQN

下载PDF

导出

摘要探索了利用深度强化学习算法训练智能体,以代替人类工程师进行火箭姿态控制器参数的离线设计方案。建立了多特征秒的火箭频域分析模型,选定了设计参数。选择深度强化学习算法中的双深度Q学习(Double Deep Q Network,DDQN)算法,通过记忆回放和时间差分迭代的方式让智能体在与环境交互过程中不断学习。设计了对应的马尔科夫决策过程模型,进行了智能体的训练和前向测试。结果说明该方法对于运载火箭姿控设计具有一定参考价值。 In this paper,the off-line design scheme of rocket attitude controller parameters using deep reinforcement learning algorithm to train an agent instead of human engineers is studied. Firstly,a multicharacteristic-second rocket frequency domain analysis model is established and the design parameters are selected. Then,the double deep Q network( DDQN) algorithm is selected as the training algorithm. The agent is allowed to continuously learn during the interaction with the environment through memory playback and time differential iteration in this algorithm. Meanwhile,the Markov decision process of the problem is designed,and the agent training and testing are implemented. The results show that the method has certain reference value for the attitude control design of the rocket.

作者黄旭柳嘉润骆无意 Huang Xu;Liu Jiarun;Luo Wuyi(Beijing Aerospace Automatic Control Institution,Beijing 100854,China;National Key Laboratory of Science and Technology on Aerospace Intelligent Control,Beijing 100854,China)

机构地区北京航天自动控制研究所宇航智能控制技术国家级重点实验室

出处《航天控制》 CSCD 北大核心 2020年第4期3-8,共6页 Aerospace Control

关键词深度强化学习姿态控制器频域分析参数设计 Deep reinforcement learning Attitude controller Frequency-domain analysis Parameter design

分类号 V448.1 [航空宇航科学与技术—飞行器设计]

引文网络
相关文献

参考文献2

1孙杭,郑宇,李少阳.运载火箭晃动分析中知识模型的构建及应用[J].宇航学报,2019,40(3):277-285. 被引量：5
2马卫华,包为民,禹春梅,柳嘉润,李文婷,巩庆海,司文杰.关于“航天智能控制系统”的认识[J].航天控制,2019,37(5):3-8. 被引量：19

二级参考文献17

1侯捷.Java反射机制[J].程序员,2004(10):82-87. 被引量：10
2丁晟春,顾德访.Jena在实现基于Ontology的语义检索中的应用研究[J].现代图书情报技术,2005(10):5-9. 被引量：33
3王为,李俊峰,王天舒.航天器贮箱内液体晃动阻尼研究(一):理论分析[J].宇航学报,2005,26(6):687-692. 被引量：12
4王为,李俊峰,王天舒.航天器贮箱内液体晃动阻尼研究(二):数值计算[J].宇航学报,2006,27(2):177-180. 被引量：11
5韩韧,黄永忠,刘振林,刘晓楠.OWL本体构建方法的研究[J].计算机工程与设计,2008,29(6):1397-1400. 被引量：23
6严武军.基于Jena规则推理数字图书馆信息检索系统研究[J].电脑开发与应用,2010,23(2):40-42. 被引量：7
7任羿,曾声奎,王子寅,冯强.面向产品综合设计的故障知识本体研究[J].宇航学报,2010,31(2):615-620. 被引量：1
8谷剑.基于知识工程方法论的本体构建方法[J].情报探索,2010(3):26-28. 被引量：2
9李青,马兴瑞,王天舒.非轴对称贮箱液体晃动的等效力学模型[J].宇航学报,2011,32(2):242-249. 被引量：23
10杨旦旦,岳宝增.低重环境下旋转轴对称贮箱内液体晃动研究[J].宇航学报,2013,34(7):917-925. 被引量：8

共引文献22

1马卫华,禹春梅,路坤锋,柳嘉润,司文杰,李文婷.“会学习”运载火箭的制导控制技术[J].航天控制,2020,38(2):3-8. 被引量：15
2马卫华.导弹/火箭制导、导航与控制技术发展与展望[J].宇航学报,2020,41(7):860-867. 被引量：29
3吴建武,吴浩,张惠平.主动段姿态控制参数与稳定裕度映射关系研究[J].航天控制,2020,38(4):22-27. 被引量：2
4卢万杰,徐青,蓝朝桢,吕亮.空间目标态势行为与事件本体设计与构建[J].宇航学报,2020,41(8):1105-1114. 被引量：3
5唐强,张宁,李浩,雷志荣.无人机自主控制系统简述[J].测控技术,2020,39(10):114-123. 被引量：9
6马卫华,禹春梅,李文婷,郭康,韩翔宇.箭上云——一种新型的运载火箭综合电子系统[J].航天控制,2020,38(5):3-9. 被引量：1
7赵佳欢,杨海明,邱令存.融合注意力机制的战术意图智能识别模型研究[J].航天控制,2021,39(3):56-62. 被引量：3
8袁利.面向不确定环境的航天器智能自主控制技术[J].宇航学报,2021,42(7):839-849. 被引量：18
9包为民.航天智能控制技术让运载火箭“会学习”[J].航空学报,2021,42(11):1-10. 被引量：21
10黄民昌,蒋政,张南,褚衍超,胡勇.基于启发式学习的折叠舵展开安全优化控制[J].航天控制,2021,39(6):20-26. 被引量：2

同被引文献84

1叶松,陈曦,熊寸平.基于线性二次滚动时域法的运载火箭发动机推力故障诊断[J].宇航总体技术,2020(6):29-37. 被引量：4
2孙成志,闫晓东.基于神经网络和证据理论的火箭发动机故障诊断[J].宇航总体技术,2020(4):20-30. 被引量：11
3张荣升,吴燕生,秦旭东,张普卓.运载火箭推力下降故障下的在线弹道重构方法[J].南京航空航天大学学报,2021,53(S01):25-31. 被引量：6
4曹丹阳,杨炳儒,李晋宏,宋威.多维分析技术在铝电解生产中的应用研究[J].冶金自动化,2010,34(1):16-21. 被引量：5
5罗亚中,唐国金,梁彦刚.基于分解策略的SSO发射轨道遗传全局优化设计[J].航空学报,2004,25(5):443-446. 被引量：6
6符文星,朱苏朋,阎杰,陈士橹.参数估计法在运载火箭动力系统故障诊断中的应用[J].弹箭与制导学报,2007,27(1):181-183. 被引量：6
7曾水平,李晋宏,任必军.铝电解过程氟化铝添加量和出铝量的模糊决策[J].冶金自动化,2008,32(1):18-21. 被引量：11
8杨希祥,李晓斌,肖飞,张为华.智能优化算法及其在飞行器优化设计领域的应用综述[J].宇航学报,2009,30(6):2051-2061. 被引量：29
9黄强,吴建军.基于云-神经网络的液体火箭发动机故障检测方法[J].国防科技大学学报,2010,32(1):11-15. 被引量：18
10朱荣昌.未来战争中的高超音速飞行器[J].国际航空,1999(2):11-13. 被引量：2

引证文献6

1张晓,李晋宏.基于改进RMSProp-PPO算法的铝电解参数寻优模型[J].电子元器件与信息技术,2021,5(3):170-174. 被引量：1
2肖爱群,姜鸿翔.基于三维点云重建的助推器位姿估计[J].中国空间科学技术,2022,42(3):74-81.
3李爽,刘旭,叶松,林子瑞.运载火箭动力系统故障下制导控制技术研究进展[J].上海航天（中英文）,2022,39(4):76-93. 被引量：4
4白文艳,张家铭,黄万伟,张远.基于深度Q网络的飞行器增益调参技术研究[J].航天控制,2022,40(5):47-52. 被引量：1
5马少捷,惠俊鹏,王宇航,张旋.变形飞行器深度强化学习姿态控制方法研究[J].航天控制,2022,40(6):3-10. 被引量：1
6王健,刘星栋,支晶.火箭定姿定点入轨的最优制导方法[J].航天控制,2023,41(5):42-46.

二级引证文献7

1赵春红.基于人工智能算法的铝电解工艺优化求解[J].粘接,2022(6):186-190.
2刘育玮,程玉强,吴建军.航天推进系统中的智能控制方法研究进展[J].航空学报,2023,44(15):187-206. 被引量：2
3李惠峰,张冉,王嘉炜.液体火箭上升段制导方法的发展综述[J].航天控制,2023,41(4):3-12. 被引量：1
4张宇,杨虎军,黄聪,王辉,李依彤.基于ESO的动力系统故障在线估计与补偿控制方法[J].航天控制,2023,41(4):43-47.
5段成林,盛庆轩,段建锋,王浩宇,慎千慧,陈铭.梦天实验舱初始轨道快速计算策略与分析[J].上海航天（中英文）,2023,40(5):30-35.
6郑凯旋,龙云,汪彬,巩庆涛,吕高焕.海上垂直回收运载火箭发展现状与关键技术分析[J].上海航天（中英文）,2024,41(2):36-53. 被引量：1
7丁溶,曹承钰,李繁飙,谢启超,廖宇新.基于深度强化学习的变外形飞行器姿态控制[J].航天控制,2024,42(2):55-61.

1田国英,孙树磊,邓鹏毅,彭忆强,何灼馀,陆海英.考虑电机参振的电动汽车平顺性频域分析模型[J].西华大学学报（自然科学版）,2020,39(1):60-68. 被引量：1
2周钦悦,刘林芽,龚凯,秦佳良.扣件失效对高速列车−无砟轨道−桥梁系统垂向振动响应的影响[J].铁道科学与工程学报,2020,17(6):1337-1345. 被引量：7
3傅质馨,李潇逸,朱俊澎,袁越.基于马尔科夫决策过程的家庭能量管理智能优化策略[J].电力自动化设备,2020,40(7):141-148. 被引量：16
4张盛,张明华,任伟,杨燕.基于web的重磁网格数据处理系统设计及其实现[J].物探与化探,2020,44(4):914-918. 被引量：2
5杨林,和欣,顾红芳.高管团队经验、动态能力与企业战略突变:管理自主权的调节效应[J].管理世界,2020,36(6):168-188. 被引量：102

航天控制

2020年第4期

浏览历史

内容加载中请稍等...

基于DDQN的运载火箭姿态控制器参数设计被引量：6

参考文献2

二级参考文献17

共引文献22

同被引文献84

引证文献6

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于DDQN的运载火箭姿态控制器参数设计 被引量：6

参考文献2

二级参考文献17

共引文献22

同被引文献84

引证文献6

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于DDQN的运载火箭姿态控制器参数设计被引量：6