基于强化学习的通信受限环境多无人机协同策略被引量：3

Cooperative Strategy of Multiple Unmanned Aerial Vehicles in Limited Communication Environment Based on Reinforcement Learning

原文传递

导出

摘要随着人工智能技术的发展,空域无人作战正由“单平台遥控”向“多平台协同”转变。多无人机协同作战任务具有非完全信息、通信受限、高实时、强动态等特点,给协同决策生成带来巨大挑战。针对通信受限环境中的多无人机协同决策问题,提出一种基于动态层级网络通信架构的通信强化学习协同策略,该策略能够显著减少无人机集群间的通信次数,同时准确传递其决策需要的信息,从而得到较优协同策略。针对多无人机协同围捕的典型任务场景,基于OpenAI平台对所提出的算法进行了仿真验证。结果表明,与传统强化学习算法相比,提出的通信强化学习策略可以显著减少无人机间的通信次数,同时在一定程度上避免潜在的信息欺骗问题。完成任务需要的平均通信次数相比于传统两两通信结构减少约77%,为实现通信受限环境中的多无人机协同任务提供技术支撑。 With the development of artificial intelligence technology,airspace unmanned combat is changing from"single-platform remote control"to"multi-platform cooperation".Multi-UAV cooperative task has the characteristics of incomplete information,limited communication,high real-time,strong dynamic,etc.,which brings great challenges to the collaborative decision-making generation.This paper proposes a communication reinforcement learning cooperation strategy based on dynamic hierarchical network communication architecture for multi-UAV cooperative decision-making in communication constrained environment.This strategy can significantly reduce the communication times between UAVs,while accurately transmitting the information needed for decision-making,so as to obtain a better cooperation strategy.In this paper,the proposed algorithm is simulated based on OpenAI platform for typical task scenarios of multi-UAV cooperative capture.The results show that compared with the traditional reinforcement learning algorithm,the communication reinforcement learning strategy proposed in this paper can significantly reduce the communication times between UAVs,and avoid the potential information deception problem to some extent.The average communication times required to complete the task are reduced by about 77%compared with the traditional two-way communication structure.It provides technical support for the realization of multi-UAV cooperative task in communication limited environment.

作者程进胡寒栋江业帆张一博丁季时雨 CHENG Jin;HU Handong;JIANG Yefan;ZHANG Yibo;DING Jishiyu(Intelligent Science&Technology Academy Limited of CASIC,Beijing 100144,China;Key Lab of Aerospace Defense Intelligent System and Technology,Beijing 100144,China;The Second Academy of CASIC,Beijing 100854,China)

机构地区航天科工集团智能科技研究院有限公司航天防务智能系统与技术科研重点实验室中国航天科工集团第二研究院

出处《无人系统技术》 2022年第5期12-20,共9页 Unmanned Systems Technology

基金基础科研项目(JCKY2020603B010) 国家自然科学基金(62103386,52202452)。

关键词强化学习通信受限无人系统集群多智能体协同人工智能 Reinforcement Learning Limited Communication Unmanned System Cluster Multi-agent Coop-eration Artificial Intelligence

分类号 V279 [航空宇航科学与技术—飞行器设计]

引文网络
相关文献

参考文献3

1李风雷,卢昊,宋闯,郝明瑞.智能化战争与无人系统技术的发展[J].无人系统技术,2018,1(2):14-23. 被引量：75
2马云红,刘云昊,杨誉乔,王鼎涵,张健.基于一致性群组算法的多无人机自主协同任务分配[J].无人系统技术,2021,4(4):51-58. 被引量：7
3曹雷.基于深度强化学习的智能博弈对抗关键技术[J].指挥信息系统与技术,2019,10(5):1-7. 被引量：44

二级参考文献12

1朱光亚.工程技术发展与新军事革命[J].中国图象图形学报（A辑）,1997,2(1):55-57. 被引量：4
2蒋琪,申超,张冬青.认知/动态与分布式作战对导弹武器装备发展影响研究[J].战术导弹技术,2016(3):1-6. 被引量：28
3胡晓峰,郭圣明,贺筱媛.指挥信息系统的智能化挑战——“深绿”计划及AlphaGo带来的启示与思考[J].指挥信息系统与技术,2016,7(3):1-7. 被引量：52
4赵振平,路瑞敏,王锦程,李强,秦绪国.智能无人飞行器技术发展与展望[J].战术导弹技术,2017(3):1-7. 被引量：16
5袁亚,张木,李翔,赵晓宁,杨帆.国外水下预置无人作战装备研究[J].战术导弹技术,2018(1):51-55. 被引量：17
6王文豪,姚振兴,李志鹏,庞海龙,张言.无人作战体系在登陆场景中的运用[J].飞航导弹,2018(3):33-35. 被引量：7
7庞强伟,胡永江,李文广,赵月飞,褚丽娜.多无人机协同侦察任务规划方法研究综述[J].电讯技术,2019,59(6):741-748. 被引量：27
8于晓强,郑红星.基于拓展CBBA算法的在轨装配航天器任务分配技术研究[J].无人系统技术,2019,2(4):46-53. 被引量：7
9徐哲,蒋进,郑祥明.基于多种群遗传算法的无人机集群并行任务分配[J].江苏航空,2019,0(3):10-13. 被引量：2
10常松,贾子彦.基于改进合同网算法的多无人机任务分配[J].物联网技术,2020,10(5):98-100. 被引量：5

共引文献123

1陈晓楠,胡建敏,陈爱玲.人工智能领域“民转军”案例研究与可行性分析——基于军民融合视角[J].理论观察,2020(12):77-80.
2朱云冲,梁彦刚,黎克波,刘远贺.基于PSO和RRT的智能弹群任务分配算法[J].航空学报,2023,44(S01):20-29. 被引量：1
3刘宁波,王春龙,牟芹芹.3D打印技术在集装箱式野战宿营装备的应用前景展望[J].工业建筑,2023,53(S02):262-264. 被引量：1
4杨永利,胡晓峰,荣明,殷小静,王文祥.基于机器学习的作战体系能力特征指标挖掘[J].系统仿真学报,2019,31(6):1048-1054. 被引量：5
5张海,陈小龙,张财生,黄勇.人工智能时代智能化海战模式[J].科技导报,2019,37(12):86-91. 被引量：14
6李磊,金元明.美国分布式作战通信组网实现途径浅析[J].飞航导弹,2019(6):52-58. 被引量：11
7程进,卢昊,宋闯.精确打击武器集群作战技术发展研究[J].导航定位与授时,2019,6(5):10-17. 被引量：1
8宋闯,张航,郝明瑞.基于CDKF的快速协方差交叉融合跟踪算法研究[J].导航定位与授时,2019,6(5):38-42. 被引量：1
9李磊,蒋琪.美自主集群弹性战术网络项目发展分析[J].飞航导弹,2019,0(9):6-9. 被引量：1
10韩洪祥,傅军.MIMU高精度快速转停标定方法[J].传感技术学报,2019,32(9):1359-1365. 被引量：4

同被引文献25

1贾永楠,田似营,李擎.无人机集群研究进展综述[J].航空学报,2020(S01):4-14. 被引量：90
2高颖,陈东岳,张立明.一种带有实时视觉特征学习的自主发育机器人探索[J].复旦学报（自然科学版）,2005,44(6):964-970. 被引量：6
3杨建军,赵保军,陈士涛.空中“分布式作战”概念解析[J].军事文摘,2019,0(2):11-15. 被引量：8
4曾毅,刘成林,谭铁牛.类脑智能研究的回顾与展望[J].计算机学报,2016,39(1):212-222. 被引量：121
5徐波,刘成林,曾毅.类脑智能研究现状与发展思考[J].中国科学院院刊,2016,31(7):793-802. 被引量：26
6陶建华,陈云霁.类脑计算芯片与类脑智能机器人发展现状与思考[J].中国科学院院刊,2016,31(7):803-811. 被引量：23
7彭军,郭晨阳,张勇,张赟,杨欣毅.基于深度学习的航空发动机部件故障诊断[J].系统仿真技术,2018,14(1):20-24. 被引量：17
8赵欣怡,宗群,张睿隆,田栢苓,张秀云,冯聪.类脑智能技术在无人系统上的应用[J].控制理论与应用,2019,36(1):1-12. 被引量：20
9魏瑞轩,张启瑞,许卓凡,周凯,赵晓林.类脑发育无人机防碰撞控制[J].控制理论与应用,2019,36(2):175-182. 被引量：13
10孙旸,曹春杰,赖俊晓,于天娇.基于LSTM-KF模型的无人机抗GPS欺骗方法[J].网络与信息安全学报,2020,6(5):80-88. 被引量：3

引证文献3

1吴仕豪,潘泉,李扬,吕洋.无人机“数据链路”信息安全综述[J].无人系统技术,2023,6(2):1-12. 被引量：3
2张融恺,闫镔.基于类脑智能的无人集群设计初探及关键技术浅析[J].无人系统技术,2023,6(6):59-69.
3邓丽敏,陈蓓蓓,刘慧.基于强化学习的通信受限环境多无人机协同策略[J].数字通信世界,2023(12):42-44.

二级引证文献3

1李国涛,姬少培,刘彦鸿,查成超.无人机系统安全防护研究[J].中国宽带,2023,19(7):141-143.
2王贤明,杨超群,邵晋梁,龚成龙,张恒.基于智能反射面辅助的无人机主动监听优化方法[J].无人系统技术,2024,7(1):106-114. 被引量：1
3马莉,林宝玉.无人机数据隐私和安全保障策略探究[J].现代工程科技,2024,3(7):25-28.

1戢泽民,徐野,哈乐.面向强化学习的虚拟链路智能体仿真环境研究[J].科技资讯,2022,20(19):29-32.
2王耀南,安果维,王传成,莫洋,缪志强,曾凯.智能无人系统技术应用与发展趋势[J].中国舰船研究,2022,17(5):9-26. 被引量：21
3棉棉.我们都会爱上自己的机器人[J].上海文学,2022(6):70-74.
4阿尔迈拉·奥斯曼诺维奇·通斯特伦,阿金(翻译),魏潇(审校).当AI成为论文作者[J].环球科学,2022(19):56-59.
5闫晓东,常天庆,郭理彬.越野战场环境下无人车路径规划研究[J].兵器装备工程学报,2022,43(10):288-293. 被引量：2
6罗海龙,赵得智,王皓.面向服务的跨域协同作战任务效费分析[J].军事运筹与评估,2022,37(3):57-63. 被引量：3
7张胜,胡学峰,刘畅,李娟.基于单体视觉投影的集群控制策略[J].无人系统技术,2022,5(5):81-89.
8王博,贾婷.共享住宿平台中的质量信号会影响产品定价吗?——基于价值共创行为的研究视角[J].产业经济评论（山东）,2022(1):58-74.
9冯相昭,杨儒浦,李媛媛.关于碳排放“双控”制度建设的若干思考[J].可持续发展经济导刊,2022(11):49-51. 被引量：5
10黄美根,王维平,王涛,李小波,何华,杨松.基于EC2的无人化作战体系云流化指控架构设计方法[J].系统工程与电子技术,2022,44(11):3413-3422. 被引量：1

无人系统技术

2022年第5期

浏览历史

内容加载中请稍等...

基于强化学习的通信受限环境多无人机协同策略被引量：3

参考文献3

二级参考文献12

共引文献123

同被引文献25

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于强化学习的通信受限环境多无人机协同策略 被引量：3

参考文献3

二级参考文献12

共引文献123

同被引文献25

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于强化学习的通信受限环境多无人机协同策略被引量：3