基于分配策略优化算法的智能防空任务分配

Intelligent Air Defense Task Assignment Based on Assignment Strategy Optimization Algorithm

下载PDF

导出

摘要针对分配策略最优算法在大规模场景中求解速度不足的问题,基于马尔可夫决策过程,将深度强化学习与其相结合,将大规模防空任务分配问题进行智能化求解。根据大规模防空作战特点,利用马尔可夫决策过程对智能体进行建模,构建数字战场仿真环境;设计防空任务分配智能体,通过近端策略优化算法,在数字战场仿真环境中进行训练。以大规模防空对抗任务为例,验证了该方法的可行性和优越性。 Aiming at the insufficient solving speed of assignment strategy optimization algorithm in largescale scenarios,deep reinforcement learning is combined with Markov decision process to carry out the intelligent large-scale air defense task assignment.According to the characteristics of large-scale air defense operations,Markov decision process is used to model the agent and a digital battlefield simulation environment is built.Air defense task assignment agent is designed and trained in digital battlefield simulation environment through proximal policy optimization algorithm.The feasibility and advantage of the method are verified by taking a large-scale ground-to-air countermeasure mission as an example.

作者刘家义王刚付强郭相科王思远 Liu Jiayi;Wang Gang;Fu Qiang;Guo Xiangke;Wang Siyuan(Air and Missile Defense College,Air Force Engineering University,Xi'an 710051,China;Graduate College,Air Force Engineering University,Xi'an 710051,China)

机构地区空军工程大学防空反导学院空军工程大学研究生院

出处《系统仿真学报》 CAS CSCD 北大核心 2023年第8期1705-1716,共12页 Journal of System Simulation

基金国家自然科学基金(62106283)。

关键词分配策略优化算法任务分配马尔可夫决策过程深度强化学习智能体 assignment strategy optimization algorithm task assignment Markov decision process deep reinforcement learning agent

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1王幸运,田野,强晓明,钱俊.基于协同效能的反导作战任务分配模型[J].空军工程大学学报（自然科学版）,2013,14(4):27-31. 被引量：11
2姜欢,陈万春.防空作战动静态武器目标分配初步研究[J].飞行力学,2007,25(4):90-93. 被引量：6
3韩松臣,秦俊奇,韩品尧,邵成勋.马尔可夫决策过程在目标分配中的应用[J].哈尔滨工业大学学报,1996,28(2):32-36. 被引量：12
4杨进帅,李进,王毅.武器-目标分配问题研究[J].火力与指挥控制,2019,44(5):6-11. 被引量：23
5刘传波,邱志明,吴玲,王航宇.动态武器目标分配问题的研究现状与展望[J].电光与控制,2010,17(11):43-48. 被引量：46
6陈英武,蔡怀平,邢立宁.动态武器目标分配问题中策略优化的改进算法[J].系统工程理论与实践,2007,27(7):160-165. 被引量：14
7何鹏,周德云,王谦.多UCAV任务分配有限阶段MDP方法和算法[J].火力与指挥控制,2012,37(10):99-101. 被引量：2
8韦刚,高嘉乐,孙文.多目标-多武器系统目标分配模型与算法研究[J].飞航导弹,2016(5):77-82. 被引量：9
9Yang Yang,Li Juntao,Peng Lingling.Multi-robot path planning based on a deep reinforcement learning DQN algorithm[J].CAAI Transactions on Intelligence Technology,2020,5(3):177-183. 被引量：36
10杨晨,张少卿,孟光磊.多无人机协同任务规划研究[J].指挥与控制学报,2018,4(3):234-248. 被引量：42

二级参考文献164

1李进军,丛蓉,熊吉光.舰艇编队防空动态目标武器分配优化模型[J].火力与指挥控制,2005,30(S1):72-75. 被引量：18
2叶媛媛,闵春平,沈林成,常文森.基于VORONOI图的无人机空域任务规划方法研究[J].系统仿真学报,2005,17(6):1353-1355. 被引量：45
3韩冰,张秋菊,徐世录.无人战斗机的现状与发展趋势[J].飞航导弹,2005(10):45-49. 被引量：16
4韩松臣,秦俊奇,韩品尧,邵成勋.马尔可夫决策过程在目标分配中的应用[J].哈尔滨工业大学学报,1996,28(2):32-36. 被引量：12
5冯琦,周德云.应用单亲遗传算法进行大规模UCAVs任务分配[J].火力与指挥控制,2006,31(5):18-21. 被引量：4
6姜华,贾春雨,程海全.动态规划法在防空群火力分配中的应用[J].兵工自动化,2006,25(5):19-20. 被引量：5
7蔡怀平,刘靖旭,陈英武.动态武器目标分配问题的马尔可夫性[J].国防科技大学学报,2006,28(3):124-127. 被引量：22
8Cai Huaiping Liu Jingxu Chen Yingwu Wang Hao.Survey of the research on dynamic weapon-target assignment problem[J].Journal of Systems Engineering and Electronics,2006,17(3):559-565. 被引量：48
9蔡怀平,陈英武,邢立宁.SVNTS算法的动态武器目标分配问题研究[J].计算机工程与应用,2006,42(31):7-10. 被引量：23
10蔡怀平,陈英武.武器-目标分配(WTA)问题研究进展[J].火力与指挥控制,2006,31(12):11-15. 被引量：68

共引文献172

1郭健,柴华,王磊,许庆.装甲车载探测装备协同调度问题[J].装甲兵学报,2023(2):57-64.
2刘敬蜀,吴嘉琪,刘旭波.基于聚类和强化学习的多无人机协同侦察任务规划[J].中国电子科学研究院学报,2023,18(1):21-25.
3胡阳修,赵长春,贾成龙,钱洲元,胡涛.基于ROS的集群无人机同步路径编队控制[J].航空学报,2022,43(S01):100-109. 被引量：4
4韩苗,薛秀谦,周圣武,康建林.股票投资的马尔可夫决策规划模型[J].中国矿业大学学报,2005,34(2):261-264. 被引量：2
5姜华平,陈海泳.城市公交客运量的预测模型研究[J].统计与决策,2005,21(06X):30-32. 被引量：5
6曹雷,陈希亮.作战智能体分队攻击目标分配模型研究[J].计算机技术与发展,2009,19(12):150-153. 被引量：1
7刘传波,邱志明,吴玲,王航宇.动态武器目标分配问题的研究现状与展望[J].电光与控制,2010,17(11):43-48. 被引量：46
8杨雪,李英杰,车延文.防空导弹武器系统目标分配建模研究[J].舰船电子工程,2010,30(11):21-23. 被引量：3
9马飞,曹泽阳,刘晖.基于纳什均衡的动态目标分配策略研究[J].现代防御技术,2010,38(6):81-84. 被引量：5
10胡国镇,周德云.基于目标子集划分的攻击编队配系方法研究[J].现代电子技术,2011,34(12):47-50. 被引量：1

1齐向东.全国政协委员、中国互联网协会副理事长、奇安信科技集团董事长齐向东:筑牢数字“战场”安全防线[J].互联网天地,2023(3):16-16.
2翟红波.国内城市人防工程系统现状及建设问题分析[J].中文科技期刊数据库（全文版）工程技术,2022(3):28-31.
3金源,许吉斌,展勇忠,郭慧平.无人机蜂群作战及反制策略研究[J].战术导弹技术,2023(3):149-157. 被引量：8
4陈亦超,王静怡.人民空军的“第一” (3)[J].中国空军,2022(3):47-47.
5陈健,陈志.警惕美国对华“综合威慑”:从数字冷战到数字热战[J].科技中国,2023(3):52-56. 被引量：3
6李祯静,张小军,郝志超.美国防部《零信任战略》解读[J].信息安全与通信保密,2023(1):10-15. 被引量：5
7宋泽滨,董鸿波.毛泽东决策建立启用地空导弹部队防卫首都述略(下)[J].军事史林,2023(2):38-46.
8卢锐,彭鹏菲.基于深度强化学习的海上编队防空任务分配[J].火力与指挥控制,2023,48(6):35-41. 被引量：1
9李昌玺,孙玉彪,范泽昊,赵玲,崔海鹏.无人作战平台发展现状及趋势[J].中国电子科学研究院学报,2023,18(3):274-279. 被引量：3
10宋泽滨,董鸿波.毛泽东决策建立启用地空导弹部队防卫首都述略(上)[J].军事史林,2023(1):50-61.

系统仿真学报

2023年第8期

浏览历史

内容加载中请稍等...

基于分配策略优化算法的智能防空任务分配

参考文献10

二级参考文献164

共引文献172

相关作者

相关机构

相关主题

浏览历史