针对无线网络中潜在的物理层欺骗攻击威胁,提出一种基于深度强化学习的物理层欺骗检测方法,可以实现检测阈值的动态连续选择且对于动态未知环境具有自适应性。首先,提取收发双方之间信号的信道频率响应(Channel Frequency Response,CFR...针对无线网络中潜在的物理层欺骗攻击威胁,提出一种基于深度强化学习的物理层欺骗检测方法,可以实现检测阈值的动态连续选择且对于动态未知环境具有自适应性。首先,提取收发双方之间信号的信道频率响应(Channel Frequency Response,CFR)表征物理层指纹特征,建立假设检验模型;然后,以动态的物理层指纹特征构建状态值,以检测阈值数值选择构建行为值,以贝叶斯风险函数作为瞬时效益函数,建立状态-行为-效益三元组;最后,基于深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)框架,提出检测阈值动态选择算法,可在动态未知环境下自适应选择检测阈值,对物理层欺骗攻击进行检测。仿真结果表明:提出的算法可以有效地检测物理层欺骗攻击,检测概率达到97%以上,检测性能优于优化的固定检测阈值方法。展开更多