-
题名基于代价损失函数的空中目标决策划分方法
- 1
-
-
作者
陈恰
黄炎焱
秦湖程
-
机构
南京理工大学自动化学院
-
出处
《火力与指挥控制》
CSCD
北大核心
2024年第8期68-79,共12页
-
文摘
面向为空中威胁目标提供威胁等级划分并提供辅助打击决策,基于改进的VIKOR法和三支决策中损失函数与阈值之间的关系,对威胁估计和决策划分问题方法进行研究。对评估属性进行分析建模,并利用AHP法计算权重。建立三支模型,利用改进的VIKOR法计算目标条件概率完成目标威胁排序。通过结合三支决策模型中的代价损失函数和阈值参数之间的关系,将求阈值与代价损失函数的方法转化为最优化问题,并利用PSO算法解决问题。最后,结合所得阈值,对论域内目标进行威胁等级与决策划分。实例分析表明,该方法在一定范围内保证最小的威胁等级和决策划分代价的同时考虑了决策者的心理,达到预期的目标威胁评估结果。
-
关键词
空中目标
威胁估计
三支模型
改进的VIKOR法
代价损失最小化
PSO算法
决策划分
-
Keywords
air target
threat assessment
three-way model
improved VIKOR method
minimize cost losses
pso algorithm
decision-making division
-
分类号
TP15
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于PPO算法的集群多目标火力规划方法
- 2
-
-
作者
秦湖程
黄炎焱
陈天德
张寒
-
机构
南京理工大学自动化学院
-
出处
《系统工程与电子技术》
EI
2024年第11期3764-3773,共10页
-
基金
中船创新基金(KJB2023012)资助课题。
-
文摘
针对高动态战场态势下防御作战场景中的多目标火力规划问题,提出一种基于近端策略优化算法的火力规划方法,以最大化作战效能为目标,从弹药消耗、作战效果、作战成本及作战时间4个方面设计强化学习奖励函数。考虑历史决策序列对当前规划的影响,以长短期记忆网络(long short-term memory,LSTM)为核心,基于Actor-Critic框架设计神经网络,使用近端策略优化算法训练网络,利用训练好的强化学习智能体进行序贯决策,根据多个决策阶段的态势实时生成一系列连贯火力规划方案。仿真结果表明,智能体能够实现高动态态势下多目标火力规划,其计算效率相对于其他算法具有更明显的优势。
-
关键词
多目标火力规划
近端策略优化算法
长短期记忆网络
序贯决策
-
Keywords
multi-target firepower planning
proximal strategy optimization algorithm
long short-term memory network(LSTM)
sequential decision-making
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-