摘要
针对动态场景条件下要地武器目标分配中目标数量、武器数量可变特点,提出了一种基于深度强化学习的建模方法。通过在状态建模中引入最大目标数量与目标存活状态两个新变量,在模型训练中引入可变武器数量样本,较好实现了模型收敛。实验表明,相较于粒子群算法和遗传算法,所提方法计算的要地完好率分别提高了14%和10%,平均计算用时分别为基于粒子群算法和基于遗传算法的10‰和7‰,具有一定的优势。所提方法对于解决动态场景条件下的要地武器目标分配问题具有一定的参考与实用价值。
作者
林雕
朱燕
汤奋
LIN Diao;ZHU Yan;TANG Fen
出处
《军事运筹与评估》
2024年第3期68-73,共6页
Military Operations Research and Assessments