-
题名资源受限下基于改进Q学习的干扰自适应采样
- 1
-
-
作者
高科婕
朱勇刚
张凯
周展阳
-
机构
南京信息工程大学电子与信息工程学院
国防科技大学第六十三研究所
-
出处
《电子信息对抗技术》
2024年第6期26-34,共9页
-
文摘
资源受限条件下的干扰采样是限制干扰认知性能提升的瓶颈之一。将资源受限条件下的干扰采样问题建模为采样资源分配问题,提出了一种基于改进Q学习的干扰自适应采样方法。将多种典型干扰表示成Markov模型,并将资源受限条件下的采样子带选择过程建模为马尔科夫决策过程(Markov Decision Process,MDP)。针对干扰自适应采样应用需要同时具备较快收敛速率和较低稳态误差的需求,提出了一种温度参数动态调整的Q学习算法,并针对干扰时变的应用场景,在Q学习算法中嵌入干扰切换检测功能模块,改善了Q学习在干扰样式发生切换重新学习时探索不足的问题。仿真结果表明,与现有周期性采样方法相比,所提算法能显著提升多种典型干扰的有效采样效率,且能适应时变干扰的采样。
-
关键词
采样资源受限
干扰自适应采样
马尔科夫决策过程
Q学习
-
Keywords
limited sampling resources
jamming adaptive sampling
Markov decision processes
Q-learning
-
分类号
TN975
[电子电信—信号与信息处理]
-