期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度强化学习的干扰资源分配方法
1
作者
李健涛
王轲昕
+1 位作者
刘凯
张天贤
《现代雷达》
CSCD
北大核心
2023年第10期44-51,共8页
针对干扰机群掩护目标突防组网雷达场景下的干扰资源分配的问题,提出了一种基于深度强化学习的干扰资源分配方法。该文将干扰资源分配模型描述为一个马尔可夫决策过程,并提出了一种基于动作密钥编码的双延迟深度确定性策略梯度(AKE-TD3...
针对干扰机群掩护目标突防组网雷达场景下的干扰资源分配的问题,提出了一种基于深度强化学习的干扰资源分配方法。该文将干扰资源分配模型描述为一个马尔可夫决策过程,并提出了一种基于动作密钥编码的双延迟深度确定性策略梯度(AKE-TD3)网络训练算法,将混合整数优化问题转化为连续变量优化问题,解决了算法难以收敛的问题。仿真结果表明,文中所设计的干扰资源分配方法对组网雷达有更好的干扰效果,且稳定性更高,有效地提升了干扰机群的作战性能。
展开更多
关键词
组网雷达系统
干扰资源分配
马尔科夫决策过程
深度强化学习
动作密钥编码
下载PDF
职称材料
题名
基于深度强化学习的干扰资源分配方法
1
作者
李健涛
王轲昕
刘凯
张天贤
机构
电子科技大学信息与通信工程学院
出处
《现代雷达》
CSCD
北大核心
2023年第10期44-51,共8页
基金
国家自然科学基金资助面上项目(61971109)
国防科技创新特区支持项目(重点项目)
中央高校其本科研业务费资助项目(ZYGX2018J009)。
文摘
针对干扰机群掩护目标突防组网雷达场景下的干扰资源分配的问题,提出了一种基于深度强化学习的干扰资源分配方法。该文将干扰资源分配模型描述为一个马尔可夫决策过程,并提出了一种基于动作密钥编码的双延迟深度确定性策略梯度(AKE-TD3)网络训练算法,将混合整数优化问题转化为连续变量优化问题,解决了算法难以收敛的问题。仿真结果表明,文中所设计的干扰资源分配方法对组网雷达有更好的干扰效果,且稳定性更高,有效地提升了干扰机群的作战性能。
关键词
组网雷达系统
干扰资源分配
马尔科夫决策过程
深度强化学习
动作密钥编码
Keywords
netted radar system
jamming resource allocation
Markov decision process
deep reinforcement learning
action key encoding
分类号
TN972 [电子电信—信号与信息处理]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度强化学习的干扰资源分配方法
李健涛
王轲昕
刘凯
张天贤
《现代雷达》
CSCD
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部