协同空战与多智能体强化学习下的关键问题

Key Problems in Coordinated Air Combat and Multi-agent Reinforcement Learning

导出

摘要自从协同作战的概念提出后,各军事强国在协同空战领域均取得了重大进展,协同成为提升作战能力的倍增器。近数十年来,作为解决序列问题的现代智能方法,强化学习在各领域高速发展。然而,面对高维变量问题时,传统的单智能体强化学习往往表现不佳,多智能体强化学习算法为解决复杂多维问题提出新的可能。通过对多智能体强化学习算法原理、训练范式与协同空战的适应性进行分析,提出了协同空战与多智能体强化学习的未来发展方向,为更好地把多智能体强化学习应用于协同空战提供思路。 Since the concept of cooperative operation was put forward, all military powers have made great progress in the field of cooperative air combat, and coordination has become a multiplier to enhance combat capability.In recent decades, as a modern intelligent method to solve sequence problems, reinforcement learning has developed rapidly in various fields.However, in the face of high-dimensional variable problems, the traditional single-agent reinforcement learning often performs poorly.Multi-agent reinforcement learning algorithms provide new possibilities for solving complex multi-dimensional problems.By analyzing the adaptability of multi-agent reinforcement learning algorithm principle, training paradigm and cooperative air combat, the future development direction of cooperative air combat and multi-agent reinforcement learning is proposed, which provides ideas for better application of multi-agent reinforcement learning in cooperative air combat.

作者谢育星陆屹管聪纪德东 XIE Yuxing;LU Yi;GUAN Cong;JI Dedong(Shenyang Aircraft Design&Research Institute,Shenyang 110035,China)

机构地区沈阳飞机设计研究所

出处《飞机设计》 2023年第1期6-10,共5页 Aircraft Design

关键词协同空战多智能体强化学习训练范式集中式训练分布式执行(CTDE) coordinated air combat multi-agent reinforcement learning training schemes centralized training decentralized execution(CTDE)

分类号 V11 [航空宇航科学与技术—人机与环境工程]

引文网络
相关文献

参考文献9

1石静.美军典型协同交战项目发展及启示[J].指挥控制与仿真,2021,43(3):135-140. 被引量：7
2王璐菲.DARPA战略技术办公室提出“马赛克战”概念[J].防务视点,2017,0(11):52-53. 被引量：3
3李磊,王彤,蒋琪.美国CODE项目推进分布式协同作战发展[J].无人系统技术,2018,1(3):59-66. 被引量：37
4华卿,石静,郭勇,王吉心,罗浩.美国海军一体化火力控制-制空能力解析[J].国防科技,2016,37(2):50-53. 被引量：7
5郭文涛,徐冬翔.从Skyborg项目看美国空军的智能化升级路线[J].国际航空,2020(9):30-32. 被引量：1
6薛羽,庄毅,张友益,倪思如,赵学健.基于启发式自适应离散差分进化算法的多UCAV协同干扰空战决策[J].航空学报,2013,34(2):343-351. 被引量：21
7孙智孝,杨晟琦,朴海音,白成超,葛俊.未来智能空战发展综述[J].航空学报,2021,42(8):28-42. 被引量：29
8杜威,丁世飞.多智能体强化学习综述[J].计算机科学,2019,46(8):1-8. 被引量：45
9孙聪.从空战制胜机理演变看未来战斗机发展趋势[J].航空学报,2021,42(8):1-13. 被引量：17

二级参考文献55

1张曙光,高浩.X-31A飞机的设计特点和试飞情况[J].飞行力学,1996,14(3):9-13. 被引量：3
2罗德林,段海滨,吴顺详,李茂青.基于启发式蚁群算法的协同多目标攻击空战决策研究[J].航空学报,2006,27(6):1166-1170. 被引量：48
3田菁,沈林成.多基地多无人机协同侦察问题研究[J].航空学报,2007,28(4):913-921. 被引量：35
4李高春,沈伟.E-2D“先进鹰眼”及其复合式雷达[J].国际航空,2007(7):24-24. 被引量：5
5Lloyd S P,Witsenhausen H S. Weapons allocation is NP-complete[A].1986.
6Saaty T L. The seven pillars of the analytic hierarchy process[J].Multiple Criteria Decision Making in the New Millennium,2001,(09):15-37.
7Pan Q K,Wang L,Gao L. An effective hybrid discrete differential evolution algorithm for the flow shop scheduling with intermediate buffers[J].Information Sciences,2011,(03):668-685.
8Wang L,Pan Q K,Suganthan P N. A novel hybrid discrete differential evolution algorithm for blocking flow shop scheduling problems[J].Computers and Operations Research,2010,(03):509-520.
9Pan Q K,Tasgetiren M F,Liang Y C. A discrete differential evolution algorithm for the permutation flowshop scheduling problem[J].Computers & Industrial Engineering,2008,(04):795-816.
10Fogel D B. An introduction to simulated evolutionary optimization[J].IEEE Transactions on Neural Networks,1994,(01):3-14.doi:10.1109/72.265956.

共引文献152

1李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：35
2苗昊春,刘重,王根.协同制导控制技术发展现状及展望[J].前瞻科技,2022(4):40-54. 被引量：1
3龙腾,徐广通,曹严,周健,王祝,孙景亮.智能弹群协同任务规划技术进展与展望[J].前瞻科技,2022(4):18-39.
4付宇鹏,闫文君,凌青,朱子强.人工智能学科人才培养中人机信任关系的重要性[J].科教导刊,2023(6):78-80.
5庞金锋,李毅.海上编队协同电子对抗技术研究与实现[J].舰船电子工程,2023,43(1):70-75.
6刘雷,刘大卫,王晓光,陈俊男,刘东兴.无人机集群与反无人机集群发展现状及展望[J].航空学报,2022,43(S01):4-20. 被引量：19
7李明敏,李世秋,范真真,王小辰,蔡斐.独立作者约稿助力中文科技期刊高质量发展[J].编辑学报,2023,35(2):210-213. 被引量：2
8王万富,王琢,刘佳鑫,韩亚辉,李春波.基于Qt/Embedded的农林智能装备导航定位算法研究及软件设计[J].国外电子测量技术,2022,41(3):63-68. 被引量：3
9薛羽,庄毅,朱浩,张友益.求解协同干扰问题的高效免疫遗传算法[J].电子科技大学学报,2013,42(3):453-458. 被引量：8
10李银钊,倪天权,薛羽.基于层次分析法的协同干扰资源调度模型[J].舰船电子对抗,2013,36(3):88-91. 被引量：3

1周思羽,范庚.动态协同空战攻击决策问题研究[J].火力与指挥控制,2023,48(4):135-140.
2夏家伟,朱旭芳,张建强,罗亚松,刘忠.基于多智能体强化学习的无人艇协同围捕方法[J].控制与决策,2023,38(5):1438-1447. 被引量：4
3王子豪,张严心,黄志清,殷辰堃.部分可观测下基于RGMAAC算法的多智能体协同[J].控制与决策,2023,38(5):1267-1277.
4肖越扬.N-Back训练任务及其对行为和大脑的影响[J].社会科学前沿,2023,12(4):1587-1593.
5程红.浅议初中数学数形结合思想的应用[J].中文科技期刊数据库（全文版）教育科学,2021(8):0206-0206.
6孟光磊,张慧敏,朴海音,周铭哲.非完备信息下的超视距空战双机协同战术识别[J].北京航空航天大学学报,2023,49(2):284-294. 被引量：2
7闫承鹏.建筑电气设计及节能措施分析[J].中国住宅设施,2023(4):7-9. 被引量：1
8刘天义,吴祖煊,陈静静,姜育刚.面向视觉语言理解与生成的多模态预训练方法[J].软件学报,2023,34(5):2024-2034. 被引量：1
9张翔.智能制造环境下的机械设计技术和应用[J].中国科技期刊数据库工业A,2023(6):0166-0169.
10韩晨晨.正当防卫的构成要件问题[J].法制博览（名家讲坛、经典杂文）,2022(27):139-141.

飞机设计

2023年第1期

浏览历史

内容加载中请稍等...

协同空战与多智能体强化学习下的关键问题

参考文献9

二级参考文献55

共引文献152

相关作者

相关机构

相关主题

浏览历史