基于强化学习的固定翼飞机姿态控制方法被引量：1

Reinforcement learning based attitude controller design

导出

摘要研究基于强化学习的飞机姿态控制方法,控制器输入为飞机纵向和横向状态变量以及姿态误差,输出为升降舵和副翼偏转角度指令,实现不同初始条件下飞机姿态角快速响应,同时避免使用传统PID控制器和不同飞行状态下的参数调节.根据飞机姿态变换特性,通过设置分立的神经网络模型提高算法收敛效率.为贴近实际的固定翼飞机控制,仿真基于JSBSim的F-16飞机空气动力学模型,利用OpenAI gym搭建强化学习仿真环境,以任意角速度、角度和空速作为初始条件,对姿态控制器中的动作网络和评价网络进行训练.仿真结果表明,基于强化学习的姿态控制器响应速度快,动态误差小,并能避免大过载等边界条件. This article presents an attitude controller based on reinforcement learning(RL).The inputs of the actor network are states of attitude angle,angular rates etc,where the output is the angle control command of elevator and aileron,achieving the rapid response of the attitude angle with variable initial conditions,avoiding the application of the conventional PID controller and the parameter adjustment.According to the states transfer characteristics,by setting the splitting neural network model,the efficiency of algorithms is improved.In order to be close to the actual fixed-wing aircraft model,the simulation is based on the JSBSim F-16 aerodynamic model,using the OpenAI gym to build the simulation environment for reinforcement learning.With arbitrary angular speed,angle,and airspeed as initial conditions,the actor and critic networks are trained.The simulation results show that the RL based attitude controller has faster response and less dynamic error compared with the conventional PID controller.

作者付宇鹏邓向阳何明朱子强张立民 FU Yu-peng;DENG Xiang-yangy;HE Ming;ZHU Zi-qiang;ZHANG Li-min(School of Aviation Support,Naval Aeronautical University,Yantai 264001,China;Command and Control Engineering Colledge,People’s Liberation Army Engineering University,Nanjing 210007,China)

机构地区海军航空大学航空作战勤务学院陆军工程大学指挥控制工程学院

出处《控制与决策》 EI CSCD 北大核心 2023年第9期2505-2510,共6页 Control and Decision

基金泰山学者工程专项基金项目(ts201511020)。

关键词强化学习近端策略优化算法姿态控制固定翼 PID JSBSim reinforcement learning PPO attitude control fixed-wing PID JSBSim

分类号 TP273 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献2

1王嘉,高正红.飞机航路飞行的自动飞行仿真[J].飞行力学,2008,26(1):75-78. 被引量：8
2舒怀林.PID神经元网络对强耦合带时延多变量系统的解耦控制[J].控制理论与应用,1998,15(6):920-924. 被引量：56

二级参考文献8

1谭永红.基于BP神经网络的自适应控制[J].控制理论与应用,1994,11(1):84-88. 被引量：91
2王耀南,童调生,蔡自兴.基于神经元网络的智能PID控制及应用[J].信息与控制,1994,23(3):185-189. 被引量：44
3李世鹏,高正红.飞机空战仿真中机动指令生成器设计[J].西北工业大学学报,2005,23(4):448-451. 被引量：6
4刘艳,高正红,商重阳.战斗机综合设计仿真系统中的飞控系统模型[J].飞行力学,2006,24(4):22-25. 被引量：4
5Chen C L，IEE Proc Control Theory and Applications，1996年，143卷，2期，200页
6夏红，自动化仪表，1996年，11卷，4期，41页
7Jaakko Hoffren, Timo Sailarenta. Maneuver Autopilot for Realistic Performance Model Simulations [ R ]. AIAA- 2001-4376,2001.
8李卓,萧德云,河世忠.基于神经网络的模糊自适应PID控制方法[J].控制与决策,1996,11(3):340-345. 被引量：75

共引文献61

1徐继民.浅谈民用飞机自动飞行控制系统的发展问题[J].军民两用技术与产品,2018,0(4):41-42.
2罗毅,郑东升.基于神经元网络PID的含铬废水智能处理系统[J].仪器仪表学报,2006,27(z1):214-216. 被引量：2
3杨阳,赵建玉,王旭东.多通道协调加载控制方法[J].济南大学学报（自然科学版）,2013,27(2):136-139.
4杨青,党选举.基于神经网络2自由度PID的解耦控制实现[J].计算机工程与应用,2004,40(26):197-199. 被引量：4
5张春有,张化光,王晓暄,边春元,满永奎.一种基于BP神经网络的解耦控制方法及其在微型燃机控制中应用的研究[J].信息与控制,2005,34(2):214-218. 被引量：16
6吴大方,李永亭,宋昊,彭铁欣.神经网络解耦控制方法在协调加载中的应用研究[J].计测技术,2005,25(3):1-3.
7吴星刚,姜长洪,姜楠.基于双隐层DRNN的自整定PID解耦控制[J].计算机仿真,2005,22(6):112-114. 被引量：1
8舒华,余群,舒怀林.基于MCGS组态软件的PID神经网络控制系统仿真[J].日用电器,2006(2):49-53. 被引量：1
9舒华,舒怀林.基于PID神经网络的多变量非线性动态系统辨识[J].计算机工程与应用,2006,42(12):47-49. 被引量：5
10李迪阳,周明顺,何文雪.一种基于单神经元的模糊自整定PID控制器[J].青岛大学学报（工程技术版）,2006,21(1):54-58. 被引量：5

同被引文献4

1贾振宇,刘子龙.一种通过强化学习的四旋翼姿态控制算法[J].小型微型计算机系统,2021,42(10):2074-2078. 被引量：4
2裴培,何绍溟,王江,林德福.一种深度强化学习制导控制一体化算法[J].宇航学报,2021,42(10):1293-1304. 被引量：27
3WAN Kaifang,LI Bo,GAO Xiaoguang,HU Zijian,YANG Zhipeng.A learning-based flexible autonomous motion control method for UAV in dynamic unknown environments[J].Journal of Systems Engineering and Electronics,2021,32(6):1490-1508. 被引量：3
4章胜,周攀,何扬,黄江涛,刘刚,唐骥罡,贾怀智,杜昕.基于深度强化学习的空战机动决策试验[J].航空学报,2023,44(10):117-130. 被引量：7

引证文献1

1李彦铃,罗飞舟,葛致磊.基于鲁棒观测器的深度强化学习垂直起降运载器姿态稳定研究[J].系统工程与电子技术,2024,46(3):1038-1047.

1付宇鹏,邓向阳,朱子强,高阳,张立民.基于生成对抗近端策略优化的机动策略优化算法[J].海军航空大学学报,2023,38(3):257-261.
2Haotong Qin,Ge-Peng Ji,Salman Khan,Deng-Ping Fan,Fahad Shahbaz Khan,Luc Van Gool.How Good is Google Bard's Visual Understanding? An Empirical Study on Open Challenges[J].Machine Intelligence Research,2023,20(5):605-613.
3苏嘉红,杨伟鹏.Unlocking the Power of ChatGPT:A Framework for Applying Generative AI in Education[J].ECNU Review of Education,2023,6(3):355-366. 被引量：10
4刘柱,董琴,杨国宇,陈朝峰.基于改进YOLOv5的铝型材瑕疵检测算法[J].计算机技术与发展,2023,33(10):183-188.
5阿科斯·菲米特,米莉·科斯蒂根,丹妮尔·迈尔斯,尼尔·尼克松,王正(翻译).环球[J].现代物业,2023(9):8-9.
6钱鸿生.ChatGPT技术架构及我国人工智能发展策略的研究(下)[J].邮电经济,2023(3):31-40.
7王志成.发力物联网大模型是运营商的必然选择[J].通信企业管理,2023(9):10-13.
8傅勇.ChatGPT时代对计算机专业人才培养的影响分析[J].无线互联科技,2023,20(15):135-138. 被引量：6
9艾丽格玛.OpenAI将破产?ChatGPT何去何从[J].中国战略新兴产业,2023(10):90-93.
10贠武超.基于鲸鱼粒子群融合算法的MPPT研究[J].电源技术,2023,47(10):1351-1354. 被引量：2

控制与决策

2023年第9期

浏览历史

内容加载中请稍等...

基于强化学习的固定翼飞机姿态控制方法被引量：1

参考文献2

二级参考文献8

共引文献61

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习的固定翼飞机姿态控制方法 被引量：1

参考文献2

二级参考文献8

共引文献61

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习的固定翼飞机姿态控制方法被引量：1