期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

深度强化学习在无人机编队路径规划中的应用

Application of Deep Reinforcement Learning in Path Planning of UAV Formation

下载PDF

导出

摘要基于深度强化学习(DRL)对无人机编队路径规划问题进行研究。针对强化学习算法模型在编队控制问题中存在收敛速度慢、奖励稀疏等不足,将人工势场法引入深度强化学习,建立了无人机编队路径规划网络训练框架。同时,根据编队控制目标设计了编队切换奖励函数进行训练。基于AirSim和UE4仿真器,搭建了无人机强化学习编队路径规划仿真训练环境,实现在威胁区域环境中的无人机编队路径规划控制。通过对比实验验证了本文算法在编队稳定性以及碰撞率等方面相较于基线算法具有更优越的性能以及更快的收敛速度。 Based on Deep Reinforcement Leaming(DRL),the path planning of UAV formation is studied.Aiming at the shortcomings of slow convergence speed and sparse rewards of reinforcement leaming algorithmmodels in the formation control problem,artificial potential field method is introduced into the deep reinforcemenileaming,and the UAV fommation path planning,network training framework is established.Meanwhile,according tothe formation control gpal,the foration switching reward funetion is desigped for taining.Based on AirSim and UE4 simulator,a UAV reinforcement leaming,formation path planning simulation training environment is built to realize the UAV formation path planning control in the threatened environment.Through comparativeexperiments,it is verified that the proposed algorithm has superior performance and faster convergence speedin terms of formation stability and collision rate compared with the baseline algorithm.

作者周从航李建兴石宇静林致睿林航航 ZHOU Conghang;LI Jianxing;SHI Yujing;LIN Zhirui;LIN Hanghang(School of Electronic,Electrical Engineering and Physics,Fujian University of Technology,Fuzhou 350000,China;Technical Development Base of Industrial Integration Automation of Fujian Province,Fuzhou 350000,China)

机构地区福建理工大学电子电气与物理学院福建省工业集成自动化行业技术开发基地

出处《电光与控制》 CSCD 北大核心 2024年第10期27-33,共7页 Electronics Optics & Control

基金福建省自然科学基金(2020J01876) 福建工程学院科研启动基金(GY-Z21215,GY-Z21216)。

关键词多无人机深度强化学习编队控制路径规划 AirSim multiple UAVs deep reinforcement leaming formation control path planning AirSim

分类号 V279 [航空宇航科学与技术—飞行器设计]

引文网络
相关文献

参考文献10

1李波,越凯强,甘志刚,高佩忻.基于MADDPG的多无人机协同任务决策[J].宇航学报,2021,42(6):757-765. 被引量：25
2石志刚,梅松,邵毅帆,万如,宋志禹,谢铭露,李燕.基于人工势场法的移动机器人路径规划研究现状与展望[J].中国农机化学报,2021,42(12):182-188. 被引量：18
3赵启,甄子洋,龚华军,曹红波,李荣,刘继承.基于D3QN的无人机编队控制技术[J].北京航空航天大学学报,2023,49(8):2137-2146. 被引量：1
4张荣霞,武长旭,孙同超,赵增顺.深度强化学习及在路径规划中的研究进展[J].计算机工程与应用,2021,57(19):44-56. 被引量：24
5张梦钰,豆亚杰,陈子夷,姜江,杨克巍,葛冰峰.深度强化学习及其在军事领域中的应用综述[J].系统工程与电子技术,2024,46(4):1297-1308. 被引量：4
6李正平,鲜斌.基于虚拟结构法的分布式多无人机鲁棒编队控制[J].控制理论与应用,2020,37(11):2423-2431. 被引量：46
7赵超轮,戴邵武,赵国荣,高超,刘帅.基于分布式模型预测控制的无人机编队控制[J].控制与决策,2022,37(7):1763-1771. 被引量：18
8马子玉,何明,刘祖均,顾凌枫,刘锦涛.无人机协同控制研究综述[J].计算机应用,2021,41(5):1477-1483. 被引量：17
9杨阳,罗婷,唐伟革,张加雄,王鹤飞.多旋翼无人机在医学救援领域的应用研究[J].医疗卫生装备,2018,39(6):91-95. 被引量：25
10刘君兰,张文博,姬红兵,朱明哲.无人机集群路径规划算法研究综述[J].航天电子对抗,2022,38(1):9-12. 被引量：13

二级参考文献120

1刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：43
2贾永楠,田似营,李擎.无人机集群研究进展综述[J].航空学报,2020(S01):4-14. 被引量：88
3张哲,吴剑,何诚,穆忠伟.复杂环境下多目标多无人机协同任务规划[J].兵器装备工程学报,2020,0(2):123-128. 被引量：13
4黄炳强,曹广益.基于人工势场法的移动机器人路径规划研究[J].计算机工程与应用,2006,42(27):26-28. 被引量：38
5苏菲,彭辉,沈林成.基于协进化多子群蚁群算法的多无人作战飞机协同航迹规划研究[J].兵工学报,2009,30(11):1562-1568. 被引量：20
6于振中,闫继宏,赵杰,陈志峰,朱延河.改进人工势场法的移动机器人路径规划[J].哈尔滨工业大学学报,2011,43(1):50-55. 被引量：120
7杨艳萍,叶锡庆,张明安,陈厚武.战场网络战基本模型研究[J].系统仿真学报,2011,23(5):1015-1020. 被引量：6
8杨柳,张洪,高忠国.基于人工势场法的移动机器人路径规划研究[J].机床与液压,2011,39(9):68-70. 被引量：11
9孙建彬,邢立宁.基于遗传算法的武器系统组合优化方法[J].价值工程,2011,30(29):9-11. 被引量：3
10邓婉,王新民,王晓燕,肖亚辉.无人机编队队形保持变换控制器设计[J].计算机仿真,2011,28(10):73-77. 被引量：30

共引文献178

1郝文康,包素艳,陈琪锋.基于端口哈密顿系统的无人机编队分布式控制[J].航空学报,2023,44(S02):479-490.
2王振威,刘凯,郭健,刘晓鹏.一种基于领导-跟随策略的多无人机-多无人艇编队协同机制[J].航空学报,2023,44(S02):453-468.
3杨明月,寿莹鑫,唐勇,刘畅,许斌.多四旋翼无人机编队保持与避碰控制[J].航空学报,2022,43(S01):89-99. 被引量：11
4胡锦帆.基于虚拟领航者的无人机一致性编队控制[J].电子测量技术,2023,46(22):70-77. 被引量：1
5邓修朋,崔建明,李敏,张小军,宋戈.深度强化学习在机器人路径规划中的应用[J].电子测量技术,2023,46(6):1-8. 被引量：2
6卢姗姗,王伟.无人机在海上救援行动中的应用现状及发展展望[J].医疗卫生装备,2019,40(2):94-98. 被引量：17
7赵晓明,桑延青.海洋搜救无人机造型设计分析[J].工业设计,2019,0(4):144-145. 被引量：1
8冯逸飞,刘旭,戴志鑫,赵方捷,张鹭鹭.基于无人机的海上遇险人员搜救系统设计[J].医疗卫生装备,2019,40(7):11-14. 被引量：10
9杨阳,罗婷,王鹤飞,张加雄,谢建福.2005型远程医疗会诊车与大疆无人机融合应用研究[J].西南国防医药,2019,29(8):883-885. 被引量：2
10孙永生,金伟,唐宇超.无人系统在新冠肺炎疫情防控中的应用实践[J].科技导报,2020,38(4):39-49. 被引量：16

1杜智勇,周源利,肜鑫.基于信干噪比的无人机集群分布式编队控制算法[J].电讯技术,2024,64(6):920-927.
2张浩彬,张宁,徐利伟,王金湘,殷国栋.考虑执行器时滞不确定的车辆编队网联巡航鲁棒模型预测控制[J].同济大学学报（自然科学版）,2022,50(S01):140-144.
3刘伟民,张少宁,郑爱云,刘晋,郑直.基于机器视觉的高铁碳滑板图像分割算法研究[J].现代制造工程,2024(9):127-135.
4姜海涛,邱保志,李向丽.基于特征表达和模型预测的主动学习[J].计算机工程与设计,2024,45(9):2757-2763.
5李俊仪,李向阳,龙朝勋,李海燕,李红松,余鹏飞.基于多级区域选择与跨层特征融合的野生菌分类[J].计算机工程,2024,50(9):179-188.
6谢赤,李兆东,王纲金,祝由,曾志坚.重大事件作用下的产业系统结构和韧性:一个基于投入产出-整数规划网络的实证研究[J].计量经济学报,2024,4(4):981-1008.
7陈玥.基于深度强化学习的图书分拣车的路径规划[J].现代电子技术,2024,47(19):161-168.
8曹宏涛,耿令波,张少泽,胡志强.UUV协同目标分配与轨迹规划技术研究[J].舰船科学技术,2024,46(17):121-126.
9石俊豪,王欣,邹杰军,方宇,蒋星.基于Motif的图采样算法[J].南京大学学报（自然科学版）,2024,60(4):552-565.
10姚昌华,万中妨,张建照,李家强,陈金立.基于动态联盟的无人机集群协同干扰方法[J].电讯技术,2024,64(9):1353-1360.

电光与控制

2024年第10期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部