基于强化学习的无人机智能任务分配方法被引量：3

Reinforcement Learning-based Intelligent Task Assignment Method for Unmanned Aerial Vehicles

下载PDF

导出

摘要针对无人机群目标打击任务分配问题,提出一种基于强化学习的无人机智能任务分配方法。该方法提出一种任务分层框架,将多个无人机视为一个联盟并对目标进行分类,形成任务簇,并映射到无人机联盟中,通过多智能体强化学习算法(MADDPG)将任务簇内的目标与无人机联盟内的小无人机进行合理配对并对目标实施打击,得到MADDPG算法的回报值和飞行轨迹,并与DDPG算法、DQN算法的回报值和飞行轨迹进行对比。仿真结果表明,在小样本任务分配中,与不分层方法相比,该方法可以提高目标任务打击完成度,提升目标打击的效率;在分层框架下,相比于其他两种算法,收敛速度更快,收敛过程更加稳定。 Aiming at the task assignment problem of UAV swarm target strike, this paper proposes an intelligent UAV task assignment method based on reinforcement learning. This strategy proposes a task layering framework, which treats multiple UAVs as an alliance and classifies the targets to form task clusters, maps each task cluster to the UAV alliance. Through multi-agent reinforcement learning algorithm(MADDPG), the targets in the task cluster are reasonably paired with the small UAVs in the UAV alliance, then the targets are hit. The return value and flight path of MADDPG algorithm are obtained, and compared with the return value and flight path of DDPG algorithm and DQN algorithm. The experimental results show that in the task assignment of small samples, compared with the non-hierarchical method, this method can improve the completion degree of target task strike and improve the efficiency of target strike;under the hierarchical framework, compared with the other two algorithms, the convergence speed is faster, the convergence process is more stable.

作者费陈郑晗赵亮 FEI Chen;ZHENG Han;ZHAO Liang(Basic Department,Armed Police Officer School,Hangzhou 311400,China)

机构地区武警士官学校基础部

出处《弹箭与制导学报》北大核心 2022年第6期61-67,共7页 Journal of Projectiles,Rockets,Missiles and Guidance

关键词任务分层框架多智能体强化学习无人机联盟任务分配目标打击 task hierarchy framework multi-agent reinforcement learning UAV alliance task assignment target strike

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献16

1武帅,蔡春伟,陈轶,柴文萍,杨世彦.多旋翼无人机无线充电技术研究进展与发展趋势[J].电工技术学报,2022,37(3):555-565. 被引量：9
2陈新颖,盛敏,李博,赵楠.面向6G的无人机通信综述[J].电子与信息学报,2022,44(3):781-789. 被引量：57
3盛碧琦,孙盛智,侯妍.美国无人机在局部作战行动中的运用及发展趋势[J].飞航导弹,2020(2):51-54. 被引量：3
4刘晨.一种侦察打击一体化无人机地面站软件的设计与实现[J].传感器世界,2018,24(7):31-37. 被引量：1
5费思远,鲜斌,王岭.基于群集行为的分布式多无人机编队动态避障控制[J].控制理论与应用,2022,39(1):1-11. 被引量：16
6朱献文,王端.带有时延的多无人机编队同步控制的策略研究[J].组合机床与自动化加工技术,2017(4):78-81. 被引量：2
7贾高伟,王建峰.无人机集群任务规划方法研究综述[J].系统工程与电子技术,2021,43(1):99-111. 被引量：64
8刘畅,谢文俊,张鹏,郭庆.多目标群多基地多无人机协同任务规划[J].弹箭与制导学报,2019,39(1):119-124. 被引量：12
9胡大伟,陈海妹,梁一为,王宁.车辆与无人机混合编队的路径优化问题模型构建[J].长安大学学报（自然科学版）,2021,41(1):78-89. 被引量：7
10蒋硕,袁小平.改进PSO算法在多无人机协同任务分配中的应用[J].计算机应用研究,2019,36(11):3344-3347. 被引量：14

二级参考文献159

1贾永楠,田似营,李擎.无人机集群研究进展综述[J].航空学报,2020(S01):4-14. 被引量：80
2张哲,吴剑,何诚,穆忠伟.复杂环境下多目标多无人机协同任务规划[J].兵器装备工程学报,2020,0(2):123-128. 被引量：13
3叶媛媛,闵春平,朱华勇,沈林成.基于整数规划的多UCAV任务分配问题研究[J].信息与控制,2005,34(5):548-552. 被引量：21
4冯琦,周德云.应用单亲遗传算法进行大规模UCAVs任务分配[J].火力与指挥控制,2006,31(5):18-21. 被引量：4
5NIGAM N. The multiple unmanned air vehicle persistent surveillance problem: a review [J]. Machines, 2014, 2(1): 13 -72.
6Office of the Secretary of Defense. Unmanned systems integrated roadmap FY2013-2038 [R]. Washington D.C.: Department of De- fense, 2013.
7United Stated Air Force. RPA vector." vision and enabling concepts 2013-2038 [R]. Washington D,C.: Department of Defense, 2014.
8HU J W, XIE L H, XU J, et al. Multi-agent cooperative target search [J]. Sensors, 2014, 14(6): 9408 - 9428.
9MAZA I, OLLERO A. Multiple UAV cooperative searching opera- tion using polygon area decomposition and efficient coverage algo- rithms [C]//ALAMI R, CHATILA R, ASAMA H. Distributed Au- tonomous Robotic Systems 6. Tokyo, Japan: Springer, 2007:221 - 230.
10ALTSHULER Y, YANOVSKY V, WAGNER I, et al. Efficient coop- erative search of smart targets using UAV swarms [J]. Robotica, 2008, 26(4): 551 - 557.

共引文献220

1任晓旭,仇超,邓辉,戴子明,刘泽军,王晓飞.边缘智能融合区块链:研究现状、应用及挑战[J].信息与控制,2024,53(1):1-16.
2王正义,陈邓安.美无人机系统当前和今后担负的任务及其发展趋势[J].中国电子科学研究院学报,2023,18(2):195-202.
3王雪鉴,文永明,石晓荣,张宁宁,刘洁玺.多智能体多耦合任务混合式智能决策架构设计[J].航空学报,2023,44(S02):418-425.
4刘闯,鱼小军,张婷,朱豪坤.无人集群装备仿真试验关键技术现状及趋势[J].航空学报,2022,43(S01):21-33. 被引量：5
5王润升,罗屹洁,马增起,胡宏达,王嘉琦,周浩.对抗条件下无人机和智能反射面协同传输技术研究[J].电声技术,2023,47(1):133-137.
6陆璐,孟云鹤,杜兴瑞.利用旋翼无人机群平台的探潜技术研究综述[J].智能安全,2022,1(1):75-88.
7韩统,周欢,李霞,翁兴伟,罗寰.针对非合作型动态障碍的无人机自主防碰撞[J].电光与控制,2017,24(2):6-12. 被引量：2
8韩旭,盛怀洁,陈明建.基于D-S证据理论的反辐射无人机群协同搜索[J].探测与控制学报,2018,40(1):80-87. 被引量：3
9韩旭,盛怀洁.多无人机协同搜索研究综述[J].飞航导弹,2018(3):40-45. 被引量：7
10严浙平,何靓文,李娟.多域限界内多AUV巡逻航路规划方法[J].水下无人系统学报,2017,25(4):237-242. 被引量：3

同被引文献63

1蔡建红,闫世强.基于无线局域网的雷达机动指挥自动化系统分析[J].航天控制,2007,25(4):77-81. 被引量：1
2薛丽香,邱保志.基于密度可达的多密度聚类算法[J].计算机工程,2009,35(17):66-68. 被引量：7
3钱鹏江,王士同,邓赵红.大数据集快速均值漂移谱聚类算法[J].控制与决策,2010,25(9):1307-1312. 被引量：5
4杨柳,吕英华.基于云模型的网络风险评估技术研究[J].计算机仿真,2010,27(10):95-98. 被引量：17
5陈根忠,刘湘伟,熊杰.基于随机规划的雷达对抗装备配置优化方法[J].现代防御技术,2010,38(5):102-106. 被引量：1
6程恺,车先明,张宏军,张睿,单黎黎.基于支持向量机的部队作战效能评估[J].系统工程与电子技术,2011,33(5):1055-1058. 被引量：24
7沙兆军,刘富书,钱林方.多用途子母弹对集群目标毁伤效率评估模型[J].火力与指挥控制,2012,37(1):125-126. 被引量：1
8林炜,屈洋,刘洪坤.基于SD的两栖坦克连水上火力支援行动分析[J].火力与指挥控制,2012,37(2):6-8. 被引量：4
9吴青坡,周绍磊,刘伟,尹高扬.基于集散式模型预测控制的多无人机协同分区搜索[J].控制理论与应用,2015,32(10):1414-1421. 被引量：16
10闫雪飞,李新明,刘东.武器装备体系评估技术与研究[J].火力与指挥控制,2016,41(1):7-10. 被引量：11

引证文献3

1费陈,郑晗,赵亮.无人机集群控制技术研究[J].弹箭与制导学报,2023,43(3):45-55.
2郭荣化,季滨滨.无人机极限边界性能突变模型和评估方法[J].国防科技,2023,44(4):118-124.
3李伟光,陈栋.基于深度强化学习算法的火力-目标分配方法[J].指挥控制与仿真,2024,46(3):62-69.

1陈博,孙鹏浩,兰巨龙,王雨薇,崔鹏帅,申涓.基于多智能体强化学习的域间多链路路由优化[J].信息工程大学学报,2022,23(6):641-647.
2赵国宏.基于作战场景的时间敏感目标杀伤网设计[J].指挥与控制学报,2022,8(4):414-421. 被引量：8
3于萌萌.论推进企业政工工作与企业经营管理的共同发展[J].中文科技期刊数据库（全文版）社会科学,2022(5):220-223.
4易凯,张修社,胡小全,李烁.基于传感器信息反馈的火力资源规划模型[J].现代导航,2023,14(1):55-60.
5樊平,杨鹏.土地资源信息管理中的土地规划利用探索[J].中文科技期刊数据库（引文版）工程技术,2022(4):302-305.
6胡淑珂,庞留勇,周向前.带时间惩罚的有向串并联图任务分配问题[J].赤峰学院学报（自然科学版）,2023,39(2):14-19.
7付斌.激光雷达在气象和大气环境监测中的应用[J].中文科技期刊数据库（全文版）自然科学,2022(4):163-165.
8余温和,林自豪.建筑施工企业实施全面预算管理探讨[J].中文科技期刊数据库（全文版）工程技术,2022(4):121-124.
9马会娟.基于思维导图背景下小学语文阅读教学模式的探讨[J].中文科技期刊数据库（引文版）教育科学,2022(7):19-22.
10陶小兵,彭燕.针对应用型人才培养的工商管理教学改革研究[J].大学（教学与教育）,2023(1):181-184.

弹箭与制导学报

2022年第6期

浏览历史

内容加载中请稍等...

基于强化学习的无人机智能任务分配方法被引量：3

参考文献16

二级参考文献159

共引文献220

同被引文献63

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于强化学习的无人机智能任务分配方法 被引量：3

参考文献16

二级参考文献159

共引文献220

同被引文献63

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于强化学习的无人机智能任务分配方法被引量：3