基于复数域深度强化学习的多干扰场景雷达抗干扰方法

A Radar Anti-jamming Method under Multi-jamming Scenarios Based on Deep Reinforcement Learning in Complex Domains

下载PDF

导出

摘要在现代电子战中,雷达面临的干扰环境比以前更加复杂,机载干扰机会根据突袭任务与突袭阶段的不同而改变其干扰方式。近年来,基于强化学习的雷达抗干扰方法在单一干扰对抗场景下取得了一定进展,但在实际复杂多干扰场景下的研究仍有不足。为了解决该问题,本文提出了一种基于复数域深度强化学习的多干扰场景雷达抗干扰方法以优化频率捷变雷达的抗干扰策略。首先,针对突袭任务的阶段性特点建立了噪声瞄准干扰、距离假目标欺骗干扰与密集假目标转发干扰3种干扰模型,并设计了3种干扰顺序策略来模拟实际干扰场景。其次,针对多干扰场景模型,构建了一种融合信干噪比与目标航迹完整性的强化学习奖励函数,并针对干扰信号的复数域特征,提出了一种基于复数域深度强化学习的多干扰场景雷达抗干扰方法。最后,基于3种干扰顺序策略设计了雷达抗干扰仿真实验,结果表明,所提方法能够有效解决雷达面临的时序条件下复杂多干扰场景的主瓣干扰问题,与两种经典深度强化学习算法相比该方法抗干扰决策性能大幅提高,平均决策时间降低至405.3 ms。 In modern electronic warfare,the jamming environment of radar is more complex than ever.The airborne jammer adapts its jamming method based on diverse raid missions and stages.Recently,the reinforcement learning–based radar anti-jamming method has made some progress in the confrontation scenario of single jamming;however,the gap with respect to actual complex multi-jamming scenarios is large.To address this issue,this paper proposes a multi-jamming scenario radar anti-jamming method based on deep reinforcement learning in the complex domain to optimize the anti-jamming strategy of frequency agile radar.First,according to the stage characteristics of the raid mission,noise spot jamming,range deception jamming,and dense false target forwarding jamming models are established.The three jamming sequence strategies were designed to simulate actual jamming scenarios.Second,a reinforcement learning reward function that integrates the signal-to-noise ratio and target trajectory integrity is constructed for the multi-jamming scenario model.Thus,a multi-jamming scenario radar anti-jamming method based on deep reinforcement learning in a complex domain is proposed,which is based on the complex domain characteristics of the jamming signal.Finally,radar anti-jamming simulation experiments are performed based on the three jamming sequence strategies.The results show that the proposed method can effectively deal with the main-lobe jamming problem of complex multi-jamming scenarios under time-sequence conditions.Moreover,the average decision-making accuracy was improved,and the average decision-making time was reduced to 405.3 ms compared with the two classical reinforcement learning algorithms.

作者解烽刘环宇胡锡坤钟平李君宝 XIE Feng;LIU Huanyu;HU Xikun;ZHONG Ping;LI Junbao(Information Countermeasure Technique Institute,Faculty of Computing,Harbin Institute of Technology,Harbin 150080,China;College of Electronic Science and Technology,National University of Defense Technology,Changsha 410073,China)

机构地区哈尔滨工业大学计算学部信息对抗技术研究所国防科技大学电子科学学院

出处《雷达学报（中英文）》 EI CSCD 北大核心 2023年第6期1290-1304,共15页 Journal of Radars

基金国家自然科学基金(62271166) 哈尔滨工业大学医工理交叉基金(IR2021104)。

关键词复数域深度强化学习主瓣干扰序贯干扰频率捷变雷达 Complex domain Deep Reinforcement Learning(DRL) Main-lobe jamming Sequential jamming Frequency agile radar

分类号 TN974 [电子电信—信号与信息处理]

引文网络
相关文献

参考文献11

1张昭建,谢军伟,杨春晓,盛川.掩护脉冲信号抗转发式欺骗干扰性能分析[J].弹箭与制导学报,2016,36(4):149-152. 被引量：8
2崔国龙,余显祥,魏文强,熊奎,孔昱凯,孔令讲.认知智能雷达抗干扰技术综述与展望[J].雷达学报（中英文）,2022,11(6):974-1002. 被引量：14
3汪浩,王峰.强化学习算法在雷达智能抗干扰中的应用[J].现代雷达,2020,42(3):40-44. 被引量：11
4刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：35
5刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：431
6李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(9):2508-2515. 被引量：538
7刘智星,杜思予,吴耀君,沙明辉,邢孟道,全英汇.脉间-脉内捷变频雷达抗间歇采样干扰方法[J].雷达学报（中英文）,2022,11(2):301-312. 被引量：11
8施龙飞,任博,马佳智,李永祯.雷达极化抗干扰技术进展[J].现代雷达,2016,38(4):1-7. 被引量：31
9董淑仙,吴耀君,方文,全英汇.频率捷变雷达联合模糊C均值抗间歇采样干扰[J].雷达学报（中英文）,2022,11(2):289-300. 被引量：5
10杜思予,刘智星,吴耀君,沙明辉,全英汇.基于SVM的捷变频雷达密集转发干扰智能抑制方法[J].雷达学报（中英文）,2023,12(1):173-185. 被引量：3

二级参考文献217

1施龙飞,王雪松,肖顺平.转发式假目标干扰的极化鉴别[J].中国科学（F辑:信息科学）,2009,39(4):468-475. 被引量：18
2徐振海,王雪松,肖顺平,庄钊文.极化敏感阵列滤波性能分析:完全极化情形[J].电子学报,2004,32(8):1310-1313. 被引量：31
3李永祯,王雪松,肖顺平,庄钊文.基于IPPV的真假目标极化鉴别算法[J].现代雷达,2004,26(9):38-42. 被引量：26
4邓巍,文必洋,周浩.基于特征分解的高频地波雷达抗射频干扰研究[J].电波科学学报,2004,19(5):565-568. 被引量：14
5徐振海,王雪松,肖顺平,庄钊文.极化敏感阵列滤波性能分析:相关干扰情形[J].通信学报,2004,25(10):8-15. 被引量：15
6黄高明,杨绿溪,何振亚.一种基于盲源分离的雷达抗干扰技术[J].电路与系统学报,2004,9(6):94-99. 被引量：14
7沈允春,谢俊好,刘庆普.识别箔条云新方案[J].系统工程与电子技术,1995,17(4):60-63. 被引量：6
8魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19
9杨运甫,陶然,王越.基于极化椭圆参数的零导数正交搜索最优极化方法[J].电子学报,2005,33(10):1812-1816. 被引量：3
10施龙飞,王雪松,肖顺平,徐振海.干扰背景下雷达最佳极化的分步估计方法[J].自然科学进展,2005,15(11):1324-1329. 被引量：13

共引文献1061

1傅汇乔,唐开强,邓归洲,王鑫鹏,陈春林.基于深度强化学习的六足机器人运动规划[J].智能科学与技术学报,2020(4):361-371. 被引量：2
2刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：35
3韩志豪,汪益兵,张宇,郝永志.基于深度强化学习的船舶航线自动规划[J].中国航海,2021,44(1):100-105. 被引量：9
4李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：35
5侯帅鹏,石英,华逸伦,苏涛.基于改进SSD的行人检测模型[J].武汉理工大学学报,2019,41(7):95-102. 被引量：1
6苟玉晓,江永全,杨燕,周冠禄,林凯.基于全卷积神经网络的公交专用道识别[J].计算机应用研究,2020,37(S01):406-407.
7周瑶瑶,李烨.基于排序优先经验回放的竞争深度Q网络学习[J].计算机应用研究,2020,37(2):486-488. 被引量：3
8李逊,李俊超,邓林忠,康旭云,欧启捷,劳恒辉.人工智能优化技术在钢筋混凝土结构的应用[J].建筑结构,2023,53(S02):1425-1430.
9刘洋,李建军.深度确定性策略梯度算法优化[J].辽宁工程技术大学学报（自然科学版）,2020(6):545-549. 被引量：1
10曹家华,李晨正.电子对抗技术发展综述[J].飞机设计,2023,43(5):59-63.

1张磊,罗迎,张群.雷达组网系统对抗有源干扰方法综述[J].信息对抗技术,2023,2(6):1-16.
2刘子徐.对末制导雷达有源干扰方法研究[J].长江信息通信,2023,36(4):101-103.
3Hui Huang,王虎(译).基于自适应特征构造和卷积神经网络的低截获概率波形识别[J].电子工程信息,2023(4):19-26.
4易明疆,李晋徽,温志津.无人机卫星导航欺骗式干扰技术的发展现状[J].舰船电子对抗,2023,46(6):44-51.
5邹宝玲,陈宇丹.乡村振兴研究的跨学科特性与机理[J].贵州大学学报(社会科学版),2023,41(6):57-66.
6戴金洲,杜磊,沙硕,姚瑶.环境感知毫米波雷达抗干扰算法研究[J].电子测量与仪器学报,2023,37(9):126-132.
7李超,周凯,肖本龙,杨茂松.基于多层子带匹配滤波的抗间歇采样转发干扰目标检测算法[J].电子与信息学报,2023,45(11):3906-3917.
8李悰,张建明,韩喆.基于非平衡双臂马赫-曾德尔干涉仪的瞬时测频[J].激光与光电子学进展,2023,60(17):173-177.
9李志汇,唐波,周青松,师俊朋,张剑云.新体制机载雷达波形优化设计研究综述[J].系统工程与电子技术,2023,45(12):3852-3865.
10陈晓,李琳,张伯阳.考虑管道阴极保护的直流接地极对管道干扰及防腐措施研究[J].电镀与涂饰,2023,42(22):48-56.

雷达学报（中英文）

2023年第6期

浏览历史

内容加载中请稍等...

基于复数域深度强化学习的多干扰场景雷达抗干扰方法

参考文献11

二级参考文献217

共引文献1061

相关作者

相关机构

相关主题

浏览历史