深度强化学习方法在飞行器控制中的应用研究被引量：3

Research on Application of Deep Reinforcement LearningMethod in Aircraft Control

导出

摘要随着深度强化学习技术的快速发展,将其应用于飞行器控制领域成为研究热点。针对深度强化学习方法在飞行器控制中的应用问题,概述了深度强化学习的演变历史和发展现状,介绍了深度强化学习的典型应用场景和基本原理。进一步介绍了两种面向飞行控制的算法训练平台,明确了不同网络结构的控制特性及由飞行状态构建控制网络输入数据的方法。分析了将深度强化学习方法应用于飞行器控制中存在的问题,提出了相应的解决方案,并对其未来发展方向进行了展望。 With the rapid development of deep reinforcement learning technology,its application in the field of aircraft control has become a research hotspot.In view of the application of deep reinforcement learning methods in aircraft control,the evolution history and development status of deep reinforcement learning are summarized,and the typical application scenarios and basic principles of deep reinforcement learning are introduced.It further introduces two flight control-oriented algorithm training platforms,and clarifies the control characteristics of different network structures and the method of constructing control network input data from flight status.The problems in applying deep reinforcement learning methods to aircraft control are analyzed,corresponding solutions are proposed,and the future development direction is prospected.

作者甄岩袁健全池庆玺郝明瑞 Zhen Yan;Yuan Jianquan;Chi Qingxi;Hao Mingrui(Science and Technology on Complex System Control and Intelligent Agent Cooperation Laboratory,Beijing 100074,China)

机构地区复杂系统控制与智能协同技术重点实验室

出处《战术导弹技术》北大核心 2020年第4期112-118,共7页 Tactical Missile Technology

关键词飞行器控制深度强化学习值函数策略梯度训练平台 aircraft control deep reinforcement learning value function strategy gradient training platform

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献11

1常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312. 被引量：429
2杨树元,张春芳.“机器学习”的研究步骤——简述科学研究的一般过程[J].石家庄职业技术学院学报,2002,14(2):13-14. 被引量：2
3张友安,马国欣,刘京茂,孙玉梅.固定翼无人机强化学习控制建模与算法设计[J].飞行力学,2019,0(4):88-91. 被引量：3
4徐松林.深度强化学习概述[J].电脑知识与技术,2019,15(1X):193-194. 被引量：2
5邱宇宸.基于Actor-Critic强化学习的倒立摆智能控制方法[J].武汉冶金管理干部学院学报,2018,28(4):88-90. 被引量：4
6丁军,徐用懋.单神经元自适应PID控制器及其应用[J].控制工程,2004,11(1):27-30. 被引量：103
7郝钏钏,方舟,李平.基于参考模型的输出反馈强化学习控制[J].浙江大学学报（工学版）,2013,47(3):409-414. 被引量：1
8宿敬亚,樊鹏辉,蔡开元.四旋翼飞行器的非线性PID姿态控制[J].北京航空航天大学学报,2011,37(9):1054-1058. 被引量：92
9多南讯,吕强,林辉灿,卫恒.迈进高维连续空间:深度强化学习在机器人领域中的应用[J].机器人,2019,41(2):276-288. 被引量：24
10夏伟,李慧云.基于深度强化学习的自动驾驶策略学习方法[J].集成技术,2017,6(3):29-40. 被引量：19

二级参考文献64

1康健,孙鹏远,解小华,赵连友.基于观测器的直流伺服电机速度控制[J].控制工程,2004,11(4):381-384. 被引量：6
2郭红霞,吴捷,王春茹.基于强化学习的模型参考自适应控制[J].控制理论与应用,2005,22(2):291-294. 被引量：6
3钱善华,葛世荣,王永胜,王勇,柳昌庆.救灾机器人的研究现状与煤矿救灾的应用[J].机器人,2006,28(3):350-354. 被引量：105
4王学宁,陈伟,张锰,徐昕,贺汉根.增强学习中的直接策略搜索方法综述[J].智能系统学报,2007,2(1):16-24. 被引量：8
5Erginer Bora, Altug Erdinc. Modeling and PD control of a quadrotor VTOL vehicle [ C ]// Proceedings of the 2007 1EEE Intelligent Vehicles Symposium. Istanbul, Turkey : IEEE, 2007 : 894 - 899.
6Voos Holger. Nonlinear state-dependent Riccati equation control of a quadrotor UAV [ C ]// Proceedings of the 2006 IEEE Inter- national Conference on Control Applicatioins. Munich: IEEE, 2006:2547 - 2552.
7Tayebi Abdelhamid, McGilvray Stephen. Attitude stabilization of a VTOL quadrotor aircraft [ J ]. IEEE Transactions on Control Systems Technology,2006,14 ( 3 ) : 562 - 571.
8Bouabdallah Samlr,Siegwart Roland. Full control of a quadrotor [ C ]//Proceedings of the 2007 IEEE/RSJ international Confer- ence on Intelligent Robots and Systems. San Diego, CA, USA: 1EEE ,2007 : 153 - 158.
9Bouadballah Samir,Noth Andr ,Siegwart Roland. P1D vs LQ con- trol techniques applied to an indoor micro quadrotor[ C ]//Proceedings of the 2004 1EEE/RSJ International Conference on In- telligent Robots and Systems. Sendal, Japan : IEEE ,2004 :2451 - 2436.
10Sanyal K Amit,Chaturvedi A Nalin. Almost global robust track- ing control of spacecraft gravity[ C ]//AIAA Guidance, Naviga- tion and Control Conference and Exhibit. Honolulu, Hawaii: AIAA ,2008 : AIAA2008-6979.

共引文献766

1陈梦,王晓青.全卷积神经网络在建筑物震害遥感提取中的应用研究[J].震灾防御技术,2019,14(4):810-820. 被引量：6
2陈妮亚,阮佳阳,黄金苗,杨伟.结合深度学习与生物特征识别在冷链拣选中的算法研究[J].智能科学与技术学报,2019,0(1):88-95. 被引量：1
3王雷,闫红蕾,张自力.收益率曲面预测及其在信用债投资组合管理中的应用[J].统计研究,2021(4):145-160. 被引量：3
4王维波,徐西龙,盛立,高明.卷积神经网络微地震事件检测[J].石油地球物理勘探,2020(5):939-949. 被引量：12
5赵毅力,李禹成,陈皓.云南野生鸟类图像自动识别系统[J].计算机应用研究,2020,37(S01):423-425. 被引量：5
6华夏,王新晴,马昭烨,王东,邵发明.基于递归神经网络的视频多目标检测技术[J].计算机应用研究,2020,37(2):615-620. 被引量：8
7蒋梦莹,林小竹,柯岩,魏战红.基于权值分布的多模型分类算法研究[J].计算机应用研究,2020,37(1):313-316. 被引量：3
8赵译文,刘云鹏.基于子空间流形的图像集识别方法[J].计算机应用,2023,43(S01):207-211.
9陈嘉昊.人工智能支持下的新增建设用地监测图斑提取研究[J].江西测绘,2022(2):10-12. 被引量：1
10Haotian YANG,Bin ZHOU,Qi WEI,Xiong WANG,Xiaobin XU,Rong ZHANG.Accurate attitude estimation of HB2 standard model based on QNCF in hypersonic wind tunnel test[J].Chinese Journal of Aeronautics,2020,33(1):64-72. 被引量：5

同被引文献64

1杜特专,黄仁芳,王畅.跨介质航行器弹性舵翼空化流固耦合仿真分析[J].宇航总体技术,2020,4(3):28-33. 被引量：3
2吴有生,司马灿,朱忠,李龙,倪天.海洋装备技术的重点发展方向[J].前瞻科技,2022(2):20-35. 被引量：18
3杨锐,马英杰,程世婧.海洋观测探测平台关键材料发展与展望[J].中国科学院院刊,2022,37(7):881-887. 被引量：7
4刘相知,崔维成.潜空两栖航行器的综述与分析[J].中国舰船研究,2019,14(S02):1-14. 被引量：9
5邵冬.跨介质飞航器动力分析[J].航空动力,2020,0(1):12-15. 被引量：4
6汪顺亭,汪湛清.水下运载体导航技术[J].导航与控制,2020(4):1-14. 被引量：5
7闫冬,陈盛,彭国政,谈元鹏,张玉天,吴凯.基于层次深度强化学习的带电作业机械臂控制技术[J].高电压技术,2020,46(2):459-471. 被引量：17
8谭骏怡,胡俊华,马宗成,陈国明,冯金富.水空跨介质航行器俯冲过程航迹角控制研究[J].飞行力学,2019,37(1):34-38. 被引量：4
9史鹏飞,郭杰,唐胜景,王肖.基于预测控制的大迎角控制器设计[J].飞行力学,2019,37(1):50-54. 被引量：4
10于玖成,何昆鹏,王晓雪.SINS/DVL组合导航系统的标定[J].智能系统学报,2015,10(1):143-148. 被引量：17

引证文献3

1唐胜景,张宝超,岳彩红,桑晨,郭杰.跨介质飞行器关键技术及飞行动力学研究趋势分析[J].飞航导弹,2021(6):7-13. 被引量：8
2张震.基于深度强化学习的自动驾驶仪控制软件设计[J].自动化与仪器仪表,2021(10):53-56.
3王权达,徐博,张涛.AUV导航系统故障诊断与容错技术研究综述[J].战术导弹技术,2023(4):26-36.

二级引证文献8

1裴志博,杨秀峰,王晓亮.SPH模拟研究细长体入水问题[J].无人系统技术,2022,5(3):40-49. 被引量：1
2刘喜燕,罗凯,袁绪龙,任伟.扩张尾裙对跨介质航行器高速入水转平弹道特性影响[J].力学学报,2023,55(2):343-354. 被引量：5
3赵一峰,胡志强,杨翊,耿令波.涵道推进器近水面垂推工况推力损失机理研究[J].舰船科学技术,2023,45(20):67-73.
4王琛,惠倩倩,张帆.水空跨域多模态共轴无人机设计[J].航空学报,2023,44(21):328-340. 被引量：1
5赵子懿,赵长见,马奥家.跨介质飞行器发展现状与未来展望[J].导弹与航天运载技术（中英文）,2024(2):17-24.
6李存健,刘福朝,刘宁,赵辉,周浩.跨域飞行器惯导装置设计及抗冲击测量方法[J].电子测量技术,2024,47(5):167-172.
7王聪,许海雨,马贵辉,孙龙泉.跨介质航行器动力学前沿技术研究进展[J].水下无人系统学报,2024,32(3):384-395.
8刘影,雷鸣宇,徐弘达,刘涛涛,田北晨.结构参数对跨介质飞行器近水面滑跳运动特性影响分析[J].北京理工大学学报,2024,44(9):937-946.

1鲁雯波.基因工程的应用历史和发展现状[J].农村科学实验,2020(12):121-122.
2朱国政,张茂光,何舒平.基于策略迭代算法的连续时间线性Markov跳变系统非零和微分反馈Nash控制[J].控制理论与应用,2020,37(8):1749-1756. 被引量：1
3施有志,洪娇莉,林树枝,徐建宁.基于物联网和GIS的综合管廊通风除湿智能控制研究[J].隧道建设（中英文）,2020,40(8):1133-1139. 被引量：2

战术导弹技术

2020年第4期

浏览历史

内容加载中请稍等...

深度强化学习方法在飞行器控制中的应用研究被引量：3

参考文献11

二级参考文献64

共引文献766

同被引文献64

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

深度强化学习方法在飞行器控制中的应用研究 被引量：3

参考文献11

二级参考文献64

共引文献766

同被引文献64

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

深度强化学习方法在飞行器控制中的应用研究被引量：3