基于双层强化学习的多功能雷达认知干扰决策方法被引量：1

Multi-function radar cognitive jamming decision-making method based on two-layer reinforcement learning

下载PDF

导出

摘要针对认知对抗中干扰方难以获取雷达方正确先验知识、面对复杂模型求解最优干扰策略困难的问题,提出了基于双层强化学习的多功能雷达认知干扰决策算法,第1层强化学习验证先验知识是否正确,并决定是否更新先验知识;第2层强化学习基于更新的先验知识进行强化学习,生成Q矩阵指导干扰方进行干扰决策。为了提高双层强化学习算法的干扰决策效率以及干扰决策正确率,对Q-learning算法的动作选择策略和收益函数设置方法进行了改进。仿真实验表明,在错误先验知识的情况下,该算法可以解得正确的最优干扰策略。相比于单层强化学习,该算法提高了干扰方适应复杂电磁环境的能力,使得强化学习在多功能雷达认知干扰决策中更具应用价值。 In cognitive confrontation,it is difficult for the jammer to obtain correct prior knowledge of the radar and solve the optimal jamming strategy orienting to complex models.Therefore,a multi-function radar cognitive jamming decision-making algorithm based on two-layer reinforcement learning is proposed to solve above problem.The first�layer reinforcement learning verifies whether the prior knowledge is correct and decides whether to update the prior knowledge.The second layer of reinforcement learning performs reinforcement learning based on updated prior knowledge,and generates a Q matrix to guide the jammer to make jamming decisions.The strategy of action selection and benefit function setting method of the Q-learning algorithm are improved,so as to improve the efficiency of jamming decision-making and the accuracy of jamming decision-making.Simulations show that the algorithm can solve the correct optimal jamming strategy under the condition of false prior knowledge.Compared with single-layer reinforcement learning,the algorithm improves the ability of the jammer to adapt to complex electromagnetic environment,which makes reinforcement learning more valuable in multi-function radar cognitive jamming decision�making.

作者廖艳苹谢榕浩 LIAO Yanping;XIE Ronghao(College of Information and Communication Engineering,Harbin Engineering University,Harbin 150001,China)

机构地区哈尔滨工程大学信息与通信工程学院

出处《应用科技》 CAS 2023年第6期56-62,共7页 Applied Science and Technology

关键词多功能雷达认知对抗干扰决策强化学习先验知识最优干扰策略干扰决策效率干扰决策正确率 multi-function radar cognitive confrontation jamming decision-making reinforcement learning prior knowledge optimal jamming strategy efficiency of jamming decision-making accuracy of jamming decision-making

分类号 TN974 [电子电信—信号与信息处理]

引文网络
相关文献

参考文献10

1曹兰英,郭明明,罗美方.雷达与电子战的认知博弈[J].雷达科学与技术,2021,19(5):552-557. 被引量：7
2罗敏.多功能相控阵雷达发展现状及趋势[J].现代雷达,2011,33(9):14-18. 被引量：38
3方旖,陈秋菊,潘继飞,毕大平.基于卷积神经网络的多功能雷达行为辨识研究[J].火力与指挥控制,2021,46(1):32-37. 被引量：3
4王军,叶立诚,刘帅,韩冬梅.时变环境下基于最大期望加权估计的干扰决策方法[J].现代雷达,2021,43(3):30-36. 被引量：2
5朱霸坤,朱卫纲,李伟,杨莹,高天昊.基于强化学习的雷达干扰决策技术综述[J].电光与控制,2022,29(4):52-58. 被引量：4
6唐文龙,张剑云,王冰川,赵晓纪,尚鹏.干扰样式选择方法研究[J].现代雷达,2017,39(1):72-76. 被引量：10
7韩晨,刘爱军,牛英滔,李永贵,童新海.智能干扰:目的、方式、反馈[J].指挥与控制学报,2022,8(2):133-140. 被引量：4
8李云杰,朱云鹏,高梅国.基于Q-学习算法的认知雷达对抗过程设计[J].北京理工大学学报,2015,35(11):1194-1199. 被引量：32
9朱霸坤,朱卫纲,李伟,杨莹,高天昊.基于先验知识的多功能雷达智能干扰决策方法[J].系统工程与电子技术,2022,44(12):3685-3695. 被引量：5
10刘章孟,袁硕,康仕乾.多功能雷达脉冲列的语义编码与模型重建[J].雷达学报（中英文）,2021,10(4):559-570. 被引量：8

二级参考文献78

1李鸿,吴嗣亮,杨春山.对策论在雷达反干扰作战中的应用[J].现代雷达,2008,30(2):10-12. 被引量：12
2孙宏伟,童宁宁,孙富君.基于D-S证据理论的电子干扰模式选择[J].弹箭与制导学报,2003,23(S2):218-220. 被引量：9
3李真芳,保铮.利用子阵处理提高天基SAR的性能[J].现代雷达,2004,26(9):1-3. 被引量：3
4束坤,盛九朝.ESM系统与低截获概率雷达之争[J].舰船电子对抗,2005,28(3):11-13. 被引量：3
5杜春侠,高云,张文.多智能体系统中具有先验知识的Q学习算法[J].清华大学学报（自然科学版）,2005,45(7):981-984. 被引量：21
6张光义.相控阵雷达的技术特点及关键技术[J].电子科技导报,1996(7):2-4. 被引量：15
7高彬,郭庆丰.BP神经网络在电子战效能评估中的应用[J].电光与控制,2007,14(1):69-71. 被引量：21
8李潮,张多林,刘付显.对策论在雷达电子战效能评估中的应用[J].航天电子对抗,2007,23(3):21-24. 被引量：7
9王世进,孙晟,周炳海,奚立峰.基于Q-学习的动态单机调度[J].上海交通大学学报,2007,41(8):1227-1232. 被引量：11
10黄玉川,饶妮妮,刘永红,刘斌.博弈论应用于干扰效果动态评估的研究[J].电子科技大学学报,2007,36(5):876-879. 被引量：25

共引文献94

1姜宗梁,李昂,赵康军,徐凯宏.基于先验知识的管道流体快速仿真技术研究[J].中国电子科学研究院学报,2023,18(5):450-454.
2赵飞,程乃平.低旁瓣球面共形随机稀疏阵列[J].现代雷达,2012,34(2):62-64. 被引量：1
3吴礼群,魏无际,陈旭.碳纤维复合材料的等离子粗化工艺研究[J].现代雷达,2012,34(11):81-83. 被引量：2
4魏清新,张婵.美国海军舰载雷达的研制进展[J].飞航导弹,2013(8):58-63. 被引量：2
5金林,刘小飞,李斌,刘明罡,高晖.微波新技术在现代相控阵雷达中的应用与发展[J].微波学报,2013,29(5):8-16. 被引量：29
6孙京.多功能相控阵雷达关键技术及其发展趋势分析[J].电子技术与软件工程,2014(5):136-136. 被引量：2
7冀琛,潘谊春,郁春来.相控阵雷达不同工作模式作用距离研究[J].四川兵工学报,2014,35(4):104-108. 被引量：6
8冀琛,潘谊春,郁春来,霍壮.对相控阵雷达工作模式的资源调度研究[J].现代防御技术,2014,42(3):20-24. 被引量：6
9王震.国外相控阵雷达发展综述[J].科技与企业,2015(14):235-235. 被引量：1
10王志武,杨安良.相控阵多普勒天气雷达技术发展展望[J].气象科技,2015,43(4):561-568. 被引量：3

同被引文献11

1曹家华,李晨正.电子对抗技术发展综述[J].飞机设计,2023,43(5):59-63. 被引量：1
2张柏开,朱卫纲.对多功能相控阵雷达干扰决策方法综述[J].兵器装备工程学报,2019,0(9):178-183. 被引量：9
3张柏开,朱卫纲.基于Q-Learning的多功能雷达认知干扰决策方法[J].电讯技术,2020,60(2):129-136. 被引量：16
4张柏开,朱卫纲.对多功能雷达的DQN认知干扰决策方法[J].系统工程与电子技术,2020,42(4):819-825. 被引量：15
5张柏开,朱卫纲.MFR认知干扰决策体系构建及关键技术[J].系统工程与电子技术,2020,42(9):1969-1975. 被引量：9
6吕锐,吴达,赵岩.认知干扰决策关键技术研究综述[J].电光与控制,2021,28(11):60-64. 被引量：2
7朱霸坤,朱卫纲,李伟,李佳芯,杨莹.基于规划步数自适应Dyna-Q的多功能雷达干扰决策方法[J].兵工自动化,2022,41(7):1-4. 被引量：2
8朱霸坤,朱卫纲,李伟,杨莹,高天昊.基于先验知识的多功能雷达智能干扰决策方法[J].系统工程与电子技术,2022,44(12):3685-3695. 被引量：5
9苏周,韩俊,刘飞,许晓剑.美军认知电子战发展特点和趋势研究[J].中国电子科学研究院学报,2022,17(11):1057-1064. 被引量：6
10黄知涛,王翔,赵雨睿.认知电子战综述[J].国防科技大学学报,2023,45(5):1-11. 被引量：3

引证文献1

1黄湘松,查力根,潘大鹏.基于威胁机制-双重深度Q网络的多功能雷达认知干扰决策[J].应用科技,2024,51(4):145-153.

1古龙,唐佳,罗昀,张耀升.基于多维资源管理的多功能雷达任务调度算法[J].现代雷达,2023,45(10):73-79.
2何宏斌.决策论视角下情报组织认知对抗的理性行为体模式[J].情报杂志,2023,42(10):74-80.
3刘光育.智能化战争的哲学考量[J].天中学刊,2023,38(4):38-43.
4梁猛,王卫,余波,陈飞,曹育维.基于优势行动-评论的雷达自主干扰决策方法[J].航天电子对抗,2023,39(5):17-21.
5徐文鹏,王东晓,付林朋,张鹏,侯守明,曾艳阳.基于Q-learning的轻量化填充结构3D打印路径规划[J].传感器与微系统,2023,42(12):44-47.
6陈烨,高金虎,马晓娟.预警情报的范式转向问题研究——基于美国预警情报工作的考察[J].情报杂志,2023,42(11):1-9.
7张秀岿.基于增强学习的计算机网络资源优化分配策略研究[J].信息与电脑,2023,35(16):41-43.
8刘艳平.复杂电磁环境下舰艇防空反导实战化考核研究[J].舰船电子工程,2023,43(9):212-217.
9于波,毛鑫浩.基于改进TD3的MEC多任务计算卸载[J].计算机系统应用,2023,32(12):95-103.
10孟维维,奚成勋.带移民和瞬态拯救的二次加权分枝过程的相关性质[J].应用概率统计,2023,39(5):711-729.

应用科技

2023年第6期

浏览历史

内容加载中请稍等...

基于双层强化学习的多功能雷达认知干扰决策方法被引量：1

参考文献10

二级参考文献78

共引文献94

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于双层强化学习的多功能雷达认知干扰决策方法 被引量：1

参考文献10

二级参考文献78

共引文献94

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于双层强化学习的多功能雷达认知干扰决策方法被引量：1