-
题名一种基于深度强化学习的协同通信干扰决策算法
被引量:3
- 1
-
-
作者
宋佰霖
许华
齐子森
饶宁
彭翔
-
机构
空军工程大学信息与导航学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2022年第6期1301-1309,共9页
-
基金
国家自然科学基金青年基金(No.6190656)。
-
文摘
针对协同电子战中跳频通信干扰协同决策难题,通过构建“整体优化、逐站决策”的协同决策模型,基于深度强化学习技术,设计了在Actor-Critic算法架构下融合优势函数的决策算法,并在奖励函数中嵌入专家激励机制以提高算法的探索能力,采用集中式训练方法优化决策网络,使算法能够输出资源利用率最高的干扰方案,并大幅提高决策效率.仿真结果表明,相比于现有智能决策算法,本文算法给出的干扰方案能够节约8%干扰资源,决策效率提高50%以上,具有较大实用价值.
-
关键词
深度强化学习
通信干扰决策
干扰资源分配
优势函数
专家激励
-
Keywords
deep reinforcement learning
communication jamming decision-making
jamming resource allocation
advantage function
expert incentive
-
分类号
TN975
[电子电信—信号与信息处理]
-