-
题名基于奖励塑造强化学习的智能导弹突防策略规划方法
- 1
-
-
作者
罗俊仁
刘果
苏炯铭
张万鹏
陈璟
-
机构
国防科技大学智能科学学院
-
出处
《智能科学与技术学报》
CSCD
2024年第2期189-200,共12页
-
基金
国家自然科学基金项目(No.61806212)
湖南省研究生创新项目(No.CX20210011)。
-
文摘
面向未来海上分布式作战需求,以对抗环境下分布式作战场景中智能导弹齐射突防水面舰艇为背景,首先,分析了导弹突防策略规划问题;其次,设计了基于奖励塑造强化学习的智能导弹突防策略规划方法;然后,在墨子联合作战推演系统上构建导弹突防舰艇的作战想定,实验结果表明本文方法的智能导弹突防打击成功率为79%,验证了基于奖励塑造强化学习方法的有效性;最后,经过复盘发现,奖励塑造实验涌现出智能导弹的4类对舰打击突防策略:集中迂回攻击、分散突防多向攻击、分组延时攻击、巡弋探测指引攻击。
-
关键词
穿透性反舰
智能导弹
齐射突防
任务规划
兵棋推演
-
Keywords
penetrating anti-ship
intelligent missile
salvo penetration
task planning
wargaming
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-