基于双Q学习算法的干扰资源分配策略被引量：7

The Allocation of Jamming Resources Based on Double Q-learning Algorithm

下载PDF

导出

摘要在现代战争中雷达发展趋于多功能化,甚至多个雷达一起探测目标,使得雷达的抗干扰能力增强。而传统的干扰系统仍遵循着固定的干扰策略,面临需要干扰的雷达数目多时决策的实时性较差,故亟需对认知干扰进行研究。阐述了强化学习的概念并比较了Q学习算法和双Q学习算法的差异,利用强化学习算法在认知电子战的基础上建立模型来实现雷达干扰策略的分配。通过对决策方法进行仿真验证了两种强化学习算法都能完成干扰策略分配任务,并且双Q学习算法在多雷达环境下效果更好。表明了强化学习算法可以进行自主学习,完成对干扰资源分配的认知决策。 In modern warfare,the multifunctional trend of radars,even multiple radars detecting targets together,enhances the anti-jamming capability of radars.However,the traditional jamming system still follows a fixed jamming strategy,and the real-time performance of decision-making facing large numbers of radars is poor.And the cognitive jamming study is urgent.The concept of reinforcement learning is explained and the difference between Q learning algorithm and double Q learning algorithm is compared.The reinforcement learning algorithm is used to establish a model based on cognitive electronic warfare to realize the allocation of radar jamming strategies.The simulation of the decision-making method shows that the two reinforcement learning algorithms can accomplish the task of jamming strategy allocation,and the double-Q learning algorithm works better in a multi-radar environment.It shows that the reinforcement learning algorithm can perform autonomous learning and complete the cognitive decision-making for the allocation of interference resources.

作者黄星源李岩屹 Huang Xingyuan;Li Yanyi(College of Information and Communication Engineering,Harbin Engineering University,Harbin 150001,China)

机构地区哈尔滨工程大学信息与通信工程学院

出处《系统仿真学报》 CAS CSCD 北大核心 2021年第8期1801-1808,共8页 Journal of System Simulation

关键词多功能雷达自适应干扰双Q学习干扰决策 multifunctional radar adaptive interference double Q-learning jamming decision-making

分类号 TN974 [电子电信—信号与信息处理] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1兰俊杰,陈蓓,王冰切,王钦泽.对组网雷达的分布式干扰效能评估[J].火力与指挥控制,2011,36(9):195-198. 被引量：7
2李云杰,朱云鹏,高梅国.基于Q-学习算法的认知雷达对抗过程设计[J].北京理工大学学报,2015,35(11):1194-1199. 被引量：31
3邢强,贾鑫,朱卫纲.基于Q-学习的智能雷达对抗[J].系统工程与电子技术,2018,40(5):1031-1035. 被引量：28
4张柏开,朱卫纲.对多功能雷达的DQN认知干扰决策方法[J].系统工程与电子技术,2020,42(4):819-825. 被引量：14

二级参考文献28

1孙宏伟,童宁宁,孙富君.基于D-S证据理论的电子干扰模式选择[J].弹箭与制导学报,2003,23(S2):218-220. 被引量：9
2叶云,屈洋,罗顺武,郭铭.基于多层次灰色理论的信息化部队作战效能评估[J].军事运筹与系统工程,2004,18(1):46-50. 被引量：18
3姚富强,都基焱.通信系统的灰关联分析[J].电子学报,1994,22(7):61-67. 被引量：10
4杜春侠,高云,张文.多智能体系统中具有先验知识的Q学习算法[J].清华大学学报（自然科学版）,2005,45(7):981-984. 被引量：21
5蔡小勇,蒋兴舟,贾兴江,王建武.分布式电子干扰系统干扰效能分析与仿真[J].海军工程大学学报,2006,18(3):47-51. 被引量：22
6高彬,郭庆丰.BP神经网络在电子战效能评估中的应用[J].电光与控制,2007,14(1):69-71. 被引量：21
7王世进,孙晟,周炳海,奚立峰.基于Q-学习的动态单机调度[J].上海交通大学学报,2007,41(8):1227-1232. 被引量：11
8邓聚龙.灰色系统基本方法[M].武汉:华中科技大学出版社,2005.
9National Institutes of Health, National Institute of Mental Health (NIMH). Definition of cognition[EB/OL].[2015-05-06].http://science-education.nih.gov/supplements/nih5/Mental/other/glossary.htm.
10Li Husheng, Han Zhu. Dogfight in spectrum:combating primary user emulation attacks in cognitive radio systems-part ii:unknown channel statistics[J]. IEEE Transactions on Wireless Communications, 2011,10(1):274-283.

共引文献50

1任仲友,王素玉,王家素,唐启雪,朱敏,江河.多块YBaCuO高温超导体在永磁轨道上的悬浮力[J].低温与超导,2000,28(2):17-21. 被引量：10
2孙经蛟,于家傲,彭世蕤,刘欣.干扰无人机编队对组网雷达干扰效果[J].电子信息对抗技术,2016,31(3):47-50. 被引量：8
3肖振民,代培龙,沈伟,邢文革.基于AHP的分布式雷达抗干扰效能评估方法[J].现代雷达,2017,39(1):77-83. 被引量：16
4王枭,董豪豪,李健.探索性作战仿真实验因子筛选方法[J].电子信息对抗技术,2017,32(4):10-15. 被引量：4
5刘东青,王振华,彭赛阳,唐汇禹.作战雷达发射假目标干扰信号优化匹配仿真[J].计算机仿真,2018,35(1):18-22. 被引量：1
6刘东青,王振华,徐鹏,唐汇禹,常春贺.一种对LFM雷达的延时变脉宽干扰方法[J].雷达科学与技术,2017,15(6):656-660. 被引量：1
7孟祥航,杨巍,邢强.基于SVM的干扰样式选择[J].航天电子对抗,2018,34(5):49-54. 被引量：3
8蔡天一,李丹,赵源.从美国电子战反导技术新动向看导引头抗干扰技术发展趋势[J].飞航导弹,2018(10):79-84. 被引量：2
9杨鸿杰,张君毅.基于强化学习的智能干扰算法研究[J].电子测量技术,2018,41(20):49-54. 被引量：15
10张柏开,朱卫纲.对多功能相控阵雷达干扰决策方法综述[J].兵器装备工程学报,2019,0(9):178-183. 被引量：7

同被引文献73

1曹向海,刘宏伟,吴顺君.多极化多特征融合的雷达目标识别研究[J].系统工程与电子技术,2008,30(2):261-264. 被引量：14
2郭小一,袁卫卫,黄金才.雷达干扰资源一对多分配方法[J].火力与指挥控制,2008,33(12):22-25. 被引量：10
3王国良,申绪涧,汪连栋,王国玉.基于秩K融合规则的组网雷达系统干扰效果评估[J].系统仿真学报,2009,21(23):7678-7680. 被引量：12
4陈淦涛,许稼,高效,刘明录,屈军亮,聂明新.有源压制干扰下雷达探测距离分析与计算[J].雷达科学与技术,2011,9(1):13-17. 被引量：12
5罗敏.多功能相控阵雷达发展现状及趋势[J].现代雷达,2011,33(9):14-18. 被引量：38
6潘泉,王增福,梁彦,杨峰,刘准钆.信息融合理论的基本方法与进展(Ⅱ)[J].控制理论与应用,2012,29(10):1233-1244. 被引量：92
7黄代政,龚仁喜,阎昌国,曾虎森,马献花.免疫约束多目标算法在微电网能量优化的应用[J].系统仿真学报,2014,26(1):225-229. 被引量：2
8王峰,雷志勇,黄桂根,陈庆,麻清华.雷达智能抗干扰体系研究[J].现代雷达,2014,36(1):80-82. 被引量：29
9郭予并,魏永峰.干扰条件下机载雷达对海探测距离数值计算分析[J].雷达与对抗,2014,34(4):5-8. 被引量：1
10张春磊,杨小牛.认知电子战与认知电子战系统研究[J].中国电子科学研究院学报,2014,9(6):551-555. 被引量：48

引证文献7

1尚熙,杨革文,戴少怀,蒋伊琳.基于强化学习的一对多雷达干扰资源分配策略研究[J].空天防御,2022,5(1):94-101. 被引量：1
2岳帅英,彭芃,任渊.舰载多功能相控阵雷达发展现状与趋势[J].舰船科学技术,2023,45(2):141-147. 被引量：2
3彭翔,许华,蒋磊,饶宁,宋佰霖.一种融合噪声网络的深度强化学习通信干扰资源分配算法[J].电子与信息学报,2023,45(3):1043-1054. 被引量：1
4王跃东,顾以静,梁彦,王增福,张会霞.伴随压制干扰与组网雷达功率分配的深度博弈研究[J].雷达学报（中英文）,2023,12(3):642-656. 被引量：2
5彭翔,许华,蒋磊,张悦,饶宁.一种基于深度强化学习的动态自适应干扰功率分配方法[J].电子学报,2023,51(5):1223-1234.
6马苗苗,董利鹏,刘向杰.基于Q-learning算法的多智能体微电网能量管理策略[J].系统仿真学报,2023,35(7):1487-1496. 被引量：4
7沈高青,蔡圣所,雷磊,贲德.基于数字孪生和强化学习的低空智联网协同认知干扰[J].数据采集与处理,2024,39(1):15-30.

二级引证文献10

1沈曈,张昱彤,陈敬贤,赵一,潘劲伟.人工智能在计算机信息中的标准化运用[J].数字技术与应用,2023,41(6):74-76.
2盛景泰.空间监视能力的技术驱动力发展现状及启示[J].空天预警研究学报,2023,37(1):1-7.
3胡明春.开放式相控阵概念与系统架构[J].雷达学报（中英文）,2023,12(4):684-695.
4王健,杨渡佳,黄科举,李小帅,杨俊安.认知电子战发展趋势:从单体智能到群体智能[J].信息对抗技术,2023,2(4):151-170. 被引量：3
5谢敬东,张蕾.电力市场价格风险动态监管机理研究[J].价格理论与实践,2023(8):71-75. 被引量：1
6张磊,罗迎,张群.雷达组网系统对抗有源干扰方法综述[J].信息对抗技术,2023,2(6):1-16.
7朱鸿宇,何丽丽,刘峥,谢荣,冉磊.基于多臂赌博机的频率捷变雷达在线决策方法[J].雷达学报（中英文）,2023,12(6):1263-1274.
8张超,赵冬梅,季宇,张颖.基于改进深度Q网络的虚拟电厂实时优化调度[J].中国电力,2024,57(1):91-100.
9赵莹莹,董普森,朱天晨,李凡,苏运,邰振赢,孙庆赟,凡航.面向电网拓扑调度仿真的采样效率优化方法研究[J].系统仿真学报,2024,36(2):283-295.
10姜俊秋,车德敏.基于人工智能的电力系统故障检测与自动修复方法研究[J].电气技术与经济,2024(3):22-24.

1智存,吕明山.基于雷达和电子战信息的精确化转移干扰决策[J].指挥控制与仿真,2021,43(3):7-11.
2岳地久,何晶,邹晓浩,张伟.反巡作战GPS干扰装备体系贡献率评估[J].电光与控制,2021,28(7):21-25. 被引量：1
3朱锦山,雷子欣.基于系统工程引擎的认知电子战系统设计[J].电子信息对抗技术,2021,36(4):6-10. 被引量：1
4李石川,张铁军,马榜,王博,陈元泰,倪凯捷.飞机末端自卫无源干扰智能决策技术[J].航天电子对抗,2021,37(3):41-44.
5张大琳,易伟,孔令讲.面向组网雷达干扰任务的多干扰机资源联合优化分配方法[J].雷达学报（中英文）,2021,10(4):595-606. 被引量：9
6杨仲平,杨书宁,周青松,张剑云.基于ADMM的低副瓣阵列区域聚焦照射[J].电子学报,2021,49(7):1370-1378. 被引量：3
7曹兰英,董晔,郭维娜.机载火控雷达发展趋势探究[J].航空科学技术,2021,32(6):1-8. 被引量：8
8周宏伟,殷利平,蔡地,陈新.基于干扰观测器的多源干扰系统优化设定控制[J].电光与控制,2021,28(8):21-25.

系统仿真学报

2021年第8期

浏览历史

内容加载中请稍等...

基于双Q学习算法的干扰资源分配策略被引量：7

参考文献4

二级参考文献28

共引文献50

同被引文献73

引证文献7

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于双Q学习算法的干扰资源分配策略 被引量：7

参考文献4

二级参考文献28

共引文献50

同被引文献73

引证文献7

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于双Q学习算法的干扰资源分配策略被引量：7