基于深度强化学习的无人机航路规划算法研究

Research on UAV Path Planning Method Based on Deep Reinforcement Learning

下载PDF

导出

摘要航路规划是无人机在复杂战场环境中完成作战任务的关键技术之一。本文提出了一种基于PER-D3QN的无人机航路规划算法,通过网络模型设计、状态空间设计、动作空间设计和收益函数设计实现无人机在战场环境下的航路规划。PER-D3QN算法将目标网络模型、竞争网络模型和优先级经验重现策略进行结合,有效地解决了深度强化学习方法存在的过拟合问题和网络优化不稳定问题。最后,通过仿真试验验证了所提算法相较于Double DQN和DQN算法具有更好的收敛性、稳定性和适用性,相较于A*算法具有较好的实时性,可高效实现无人机在复杂战场环境下的航路规划,有效帮助无人机遂行作战任务。 Path planning is one of the key technologies for UAVs to accomplish operation missions in complex battlefield environments.In this paper,we propose a UAV path planning method based on PER-D3QN,which realizes the path planning for UAVs in the battlefield environment through network model design,state space design,action space design and reward function design.The PER-D3QN algorithm combines the target network,dueling network and prioritized experience replay,which effectively solves the overfitting problem and unstable problem in deep reinforcement learning.In the end,it is verified through simulation experiments that the proposed method achieved better convergence,stability and applicability compared with double DQN and DQN algorithms,and better real-time performance compared with A*algorithm,which can efficiently realize the path planning of UAVs in the complex battlefield environment,and effectively help the UAVs to attempt the operational mission.

作者毕文豪段晓波 Bi Wenhao;Duan Xiaobo(Northwestern Polytechnical University,Xi’an 710072,China)

机构地区西北工业大学

出处《航空科学技术》 2023年第12期118-124,共7页 Aeronautical Science & Technology

基金航空科学基金(201905053001) 国家自然科学基金(62073267,61903305)。

关键词无人机航路规划深度强化学习战场环境建模 PER-D3QN UAV path planning deep reinforcement learning battlefield environment modeling PER-D3QN

分类号 V249.3 [航空宇航科学与技术—飞行器设计]

引文网络
相关文献

参考文献9

1张腾腾.1∶10000DEM精细化处理方法及其应用效果分析[J].北京测绘,2021,35(2):212-216. 被引量：1
2Zijian HU,Xiaoguang GAO,Kaifang WAN,Yiwei ZHAI,Qianglong WANG.Relevant experience learning:A deep reinforcement learning method for UAV autonomous motion planning in complex unknown environments[J].Chinese Journal of Aeronautics,2021,34(12):187-204. 被引量：14
3吴坤,池沛,王英勋,侯琳.基于混沌灰狼优化的多无人机协同航路规划[J].航空科学技术,2022,33(10):82-95. 被引量：2
4胡美富,宁芊,陈炳才,雷印杰.RWPSO与马尔科夫链的无人机航路规划[J].哈尔滨工业大学学报,2019,51(11):75-81. 被引量：4
5杨咪,张安,毕文豪,王嘉隆.基于改进遗传算法的多弹协同攻击航路规划[J].兵工自动化,2020,39(2):28-32. 被引量：4
6梁宵,王宏伦,孟光磊,陈侠.三维真实地形环境下无人机救援航路规划方法[J].北京航空航天大学学报,2015,41(7):1183-1187. 被引量：6
7王庆禄,吴冯国,郑成辰,李辉.基于优化人工势场法的无人机航迹规划[J].系统工程与电子技术,2023,45(5):1461-1468. 被引量：5
8李海,郭水林,周晔.融合动态风险图和改进A*算法的动态改航规划[J].航空科学技术,2021,32(5):61-71. 被引量：4
9Zhang An,Li Chong,Bi Wenhao.Rectangle expansion A* pathfinding for grid maps[J].Chinese Journal of Aeronautics,2016,29(5):1385-1396. 被引量：10

二级参考文献67

1李宪强,马戎,张伸,侯砚泽,裴毅飞.蚁群算法的改进设计及在航迹规划中的应用[J].航空学报,2020(S02):213-219. 被引量：31
2吴坤,谭劭昌.基于改进鲸鱼优化算法的无人机航路规划[J].航空学报,2020(S02):107-114. 被引量：23
3Zhang X Y,Wu M, Peng J, et al. A rescue robot path planning based on ant colony optimization algorithm [ C ] //International Conference on Information Technology and Computer Science 2009.Piscataway, N J: IEEE Press ,2009 : 180-183.
4Khanmohammadi S,Zarrin R S. intelligent path planning for res- cue robot[ J]. World Academy of Science, Engineering and Tech- nology,2011,5 ( 7 ) :607-612.
5Norouzi M, Bruijn F D, Miro J V. Planning stable paths for urban search and rescue robots [ J ]. Computer Science, 2012,7416 : 90-101.
6Pang T,Ruan X G, Wang E S, et al. Search and rescue robot path planning in unknown environment [ J ]. Applied Mechanics and Materials ,2013,241 : 1682-1687.
7Pang T,Ruan X G,Wang E S,et al. Based on A * and Q-learn- ing search and rescue robot navigation [ J ]. Telkomnika- Indone- sian Journal of Electrical Engineering, 2012,10 ( 7 ) : 1889-1896.
8Sun H L, Yue L Y, Yao S Y. Study on selection of emergency rescue based on GIS [ J ]. Advanced Materials Research, 2014, 864 : 2804-2807.
9Sullivan T A, Van J D. Multi-objective, multi-domain genetic op- timization of a hydraulic rescue spreader [ J ]. Mechanism and Machine Theory,2014,80:35-51.
10Liu T L,Wu C D, Li B, et al. The adaptive path planning re-search for a shape-shifting robot using particle swarm optimiza- tion [ C ] // International Conference on Natural Computation 2009. Piscataway, NJ : IEEE Press ,2009:324-328.

共引文献41

1王德镇,刘阳,黄卓,贺磊,刘英,郁毛林,缑斌丽.精细钢丝绳绕线工字轮自动搬运生产线的设计[J].林业机械与木工设备,2018,46(9):34-38. 被引量：1
2王生印,龙腾,王祝,蔡祺生.基于即时修复式稀疏A~*算法的动态航迹规划[J].系统工程与电子技术,2018,40(12):2714-2721. 被引量：17
3彭玲.消费型无人机航测技术三维重构方法研究[J].矿山测量,2019,47(6):30-33. 被引量：3
4吴健发,王宏伦,刘一恒,姚鹏.无人机避障航路规划方法研究综述[J].无人系统技术,2020,3(1):1-10. 被引量：12
5徐瑞,李军.无人驾驶汽车局部路径规划研究综述[J].汽车科技,2020(5):84-89. 被引量：6
6梁同乐,王珊珊.基于改进遗传算法的大数据中心资源分配方法[J].长江信息通信,2021(3):68-70. 被引量：2
7李晓露,熊禾根,陶永,李公法.基于改进A^(*)算法的移动机器人全局最优路径规划[J].高技术通讯,2021,31(3):306-314. 被引量：12
8胥芳,沈旭明,谭大鹏.基于TSA*算法的双机械臂协同避障规划方法[J].高技术通讯,2021,31(5):516-526. 被引量：1
9刘钢,老松杨,汤俊,周智超,李武.反舰导弹智能协同航路规划研究进展[J].指挥与控制学报,2021,7(4):342-349. 被引量：2
10高敬鹏,胡欣瑜,江志烨.改进DDPG无人机航迹规划算法[J].计算机工程与应用,2022,58(8):264-272. 被引量：7

1郑会吉,邱鑫源,余思聪,崔翛龙.一种面向战术边缘的智能云服务模型[J].火力与指挥控制,2023,48(6):7-13.
2李论,高广渊,陈贺连.无人作战平台路径规划问题研究综述[J].中国科技纵横,2023(3):35-37.
3龙腾,徐广通,曹严,周健,王祝,孙景亮.智能弹群协同任务规划技术进展与展望[J].前瞻科技,2022(4):18-39.
4李宏伟,向新.“星链”何以加快美空军新型作战样式形成[J].中国空军,2022(4):60-63.
5陈瑞霖,覃梓瀚,周轩羽,冯威,孙冠超,刘奎,张洁琼.空军标准化伤病员数据库信息化建设及展望[J].空军航空医学,2023,40(6):561-563.
6皇甫小峰,邹光明,刘源泂,刘乐.基于分段插补的焊接轨迹规划研究[J].农业装备与车辆工程,2024,62(1):134-138.
7梅礼坤,陈智利,牛恒.基于改进YOLOv5的坦克目标检测算法[J].激光杂志,2024,45(1):92-98. 被引量：1
8天一(制图).052D型驱逐舰的出口前景[J].舰载武器,2024(1).
9杨宇翔,杜婷婷,王朝宇,林佳,于芳,何宇帆.平面测量多项式扫描路径规划算法[J].电子工业专用设备,2023,52(6):26-32.
10何文志.无人机地面控制站通用化研究[J].现代电子技术,2024,47(1):14-19.

航空科学技术

2023年第12期

浏览历史

内容加载中请稍等...

基于深度强化学习的无人机航路规划算法研究

参考文献9

二级参考文献67

共引文献41

相关作者

相关机构

相关主题

浏览历史