一种无人机路径规划强化学习算法

A reinforcement learning algorithm for combat UAV path planning

下载PDF

导出

摘要为了让无人机不易遭到地面埋伏的单兵防空武器打击,提出了一种新的强化学习算法,用于无人机(UAV)执行规避导弹、最短路径飞行和编队飞行任务.该算法结合自我模仿学习和随机网络提炼算法,以放大探索的模仿效应(AIE).实验结果表明,所提出的算法在寻找UAV最短飞行路径的同时避开敌方导弹方面非常有效;在收敛速度和学习稳定性方面都优于现有算法.这为UAV躲避导弹被击中的事件提供了一定的参考. In order to make it uneasy for unmanned aerial vehicles(UAVs)to be attacked by the ground ambush of individual anti-aircraft weapons,this paper proposes a new reinforcement learning algorithm used for combat UAVs to perform the mission of missile avoidance,shortest path flight and formation flight.The algorithm combines self-imitation learning and stochastic network refining algorithm to enhance exploration through amplification of imitation effect(AIE).Experimental results show that the proposed algorithm is very effective in finding the shortest flight path for the combat UAV while avoiding enemy missiles,and is also superior to the existing algorithm in terms of convergence speed and learning stability.This provides a certain reference for the UAVs to avoid being hit by missiles.

作者陈孝如潘正党陈立军 CHEN Xiaoru;PAN Zhengdang;CHEN Lijun(Software Engineering Department,Software Engineering Institute of Guangzhou,Guangzhou 510990,China;Zhengyang County Vocational School,Zhumadian,Henan 463699,China)

机构地区广州软件学院软件工程系正阳县职业中等专业学校

出处《空天预警研究学报》 CSCD 2024年第2期122-127,137,共7页 JOURNAL OF AIR & SPACE EARLY WARNING RESEARCH

关键词无人机强化学习自主飞行管理路径规划 UAV reinforcement learning autonomous flight management path planning

分类号 U463.6 [机械工程—车辆工程] TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1邵彦昊,朱荣刚,贺建良,孔繁峨.中远程空空雷达导弹的新机动规避方式的探索[J].弹箭与制导学报,2020,40(4):75-78. 被引量：5
2宋宏川,詹浩,夏露,李向阳,刘艳.基于深度确定性策略梯度算法的战机规避中距空空导弹研究[J].航空工程进展,2021,12(3):85-94. 被引量：3
3周娴玮,包明豪,叶鑫,余松森.带Q网络过滤的两阶段TD3深度强化学习方法[J].计算机技术与发展,2023,33(10):101-108. 被引量：3
4Peiran Dong,Zhaolong Ning,Rong Ma,Xiaojie Wang,Xiping Hu,Bin Hu.NOMA-Based Energy-Efficient Task Scheduling in Vehicular Edge Computing Networks: A Self-Imitation Learning-Based Approach[J].China Communications,2020,17(11):1-11. 被引量：8
5邓伟伟,段朝阳.人工智能在导弹控制系统中的应用[J].航空科学技术,2020,31(10):30-35. 被引量：8

二级参考文献32

1秦莉,杨明,郭庆.遗传算法在质量矩导弹姿态控制中的应用[J].北京航空航天大学学报,2007,33(7):769-772. 被引量：7
2张堃,周德云.空战目标机规避仿真设计研究[J].计算机仿真,2008,25(11):98-100. 被引量：6
3王斯财,南英,刘经纬.导弹迎击时飞机的最佳逃逸策略研究[J].航空兵器,2009,16(4):28-32. 被引量：17
4许哲,许化龙.基于T-S模糊模型的导弹网络化控制系统建模与控制[J].上海航天,2010,27(2):49-55. 被引量：2
5高晨,马文涛,张庆振.基于模糊PID的直/气复合再入控制方法研究[J].系统仿真学报,2010,22(A01):146-148. 被引量：6
6连春红,马建伟,刘忠.神经网络PID在空空导弹自动驾驶仪中的应用[J].火力与指挥控制,2010,35(5):145-148. 被引量：2
7刘刚,杜涛,王园园,高树青.基于模糊神经网络的BTT导弹自适应控制[J].弹箭与制导学报,2011,31(1):26-28. 被引量：1
8周小志,彭明焱,李友年.基于遗传算法优化LQR复合控制导弹控制器设计[J].计算机测量与控制,2014,22(4):1157-1159. 被引量：4
9冯德龙,杨锁昌,田再克,姚运志.一种改进的扩展比例导引律及其仿真[J].火力与指挥控制,2014,39(5):161-163. 被引量：4
10方群,王祥.基于在线RBF神经网络的BTT导弹控制器设计[J].西北工业大学学报,2014,32(3):446-450. 被引量：7

共引文献19

1杜剑波,薛哪哪,孙艳,姜静,李树磊,卢光跃.基于NOMA 的车辆边缘计算网络优化策略[J].物联网学报,2021,5(1):19-26. 被引量：3
2宋宏川,詹浩,夏露,李向阳,刘艳.基于深度确定性策略梯度算法的战机规避中距空空导弹研究[J].航空工程进展,2021,12(3):85-94. 被引量：3
3雒艳.面向非正交多址接入的资源分配方法研究[J].软件,2021,42(4):135-137. 被引量：1
4Wenwei Yue,Changle Li,Guoqiang Mao,Nan Cheng,Di Zhou.Evolution of Road Traffic Congestion Control:A Survey from Perspective of Sensing,Communication,and Computation[J].China Communications,2021,18(12):151-177.
5赵曙光,孙娟芬,杜佳原,刘凤琪.反坦克导弹软件系统指标体系研究[J].航空兵器,2021,28(6):104-110. 被引量：1
6王佳,曾庆华.RLV再入段模糊NLPID抗干扰控制器设计[J].航天控制,2021,39(6):42-48.
7王小东,周春桂,王志军,王利锋,张凯奇.基于自适应模糊PID的导弹控制系统[J].探测与控制学报,2021,43(6):50-54. 被引量：8
8陈善学,吴生金,谷博文.基于时间反演的上行NOMA系统能效优化算法[J].系统工程与电子技术,2022,44(3):1007-1013.
9施立瑞,王帅帅,肖昊.面向航空目标检测的神经网络加速器设计[J].航空科学技术,2022,33(5):89-96. 被引量：6
10郭强,何胜杰,程家林,王兴虎,孙亘,郭菲.一种无人机自主规避导弹的威胁度评估方法[J].航空科学技术,2022,33(7):8-14. 被引量：1

1王里付.《无人驾驶航空器飞行管理暂行条例》解读[J].中国安防,2024(5):23-26.
2郭岱乔.浅析无人驾驶航空器动力控制及安全活动[J].内燃机与配件,2024(9):99-101.
3王柏雄,宗思光,张鑫.舰载激光武器打击无人机蜂群毁伤特性研究[J].激光与红外,2024,54(2):256-261.
4航空运输[J].国际航空,2024(4):6-6.
5刘向东.建筑施工图设计中的问题探究[J].中文科技期刊数据库（全文版）工程技术,2019(5):24-24.
6江清明.埋伏[J].小说月刊,2023(12):55-56.
7卢芳云.“毁伤快速算法与仿真技术”专题出版前言[J].爆炸与冲击,2024,44(3):1-1.
8张楠.胶东饽饽[J].海燕,2023(3):89-92.
9赵敏,陈亚洲,周星,聂亚宁,李慧娟.无人机机载天线高功率微波耦合响应研究[J].强激光与粒子束,2024,36(3):31-40.
10刘幸川,陈丹鹤,徐根,廖文和.卫星编队脉冲机动维持控制与策略[J].系统工程与电子技术,2023,45(8):2533-2545.

空天预警研究学报

2024年第2期

浏览历史

内容加载中请稍等...

一种无人机路径规划强化学习算法

参考文献5

二级参考文献32

共引文献19

相关作者

相关机构

相关主题

浏览历史