期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的干扰资源分配方法
1
作者 李健涛 王轲昕 +1 位作者 刘凯 张天贤 《现代雷达》 CSCD 北大核心 2023年第10期44-51,共8页
针对干扰机群掩护目标突防组网雷达场景下的干扰资源分配的问题,提出了一种基于深度强化学习的干扰资源分配方法。该文将干扰资源分配模型描述为一个马尔可夫决策过程,并提出了一种基于动作密钥编码的双延迟深度确定性策略梯度(AKE-TD3... 针对干扰机群掩护目标突防组网雷达场景下的干扰资源分配的问题,提出了一种基于深度强化学习的干扰资源分配方法。该文将干扰资源分配模型描述为一个马尔可夫决策过程,并提出了一种基于动作密钥编码的双延迟深度确定性策略梯度(AKE-TD3)网络训练算法,将混合整数优化问题转化为连续变量优化问题,解决了算法难以收敛的问题。仿真结果表明,文中所设计的干扰资源分配方法对组网雷达有更好的干扰效果,且稳定性更高,有效地提升了干扰机群的作战性能。 展开更多
关键词 组网雷达系统 干扰资源分配 马尔科夫决策过程 深度强化学习 动作密钥编码
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部