基于无模型强化学习的雷达波束多阶段管理方法

Model-free Reinforcement Learning Based Radar Beam Multi-stage Management Method

下载PDF

导出

摘要火控雷达(FCR)工作时常常面临转发式干扰的挑战,考虑二者间多阶段对抗场景,针对未知环境模型下雷达波束多阶段管理问题,提出了一种基于无模型强化学习的波束驻留时间优化方法。首先,建立了未知环境模型下的马尔可夫决策过程,用于多阶段波束驻留时间优化,为了评价雷达探测的性能,以FCR对目标锁定时间的期望为评价标准;然后,为克服未知环境模型的挑战,提出了一种面向多阶段波束驻留时间优化的强化学习框架,并在此基础上提出了一种基于Q学习的驻留时间优化方法;最后,通过数值仿真验证了该方法的有效性。 Repeater jamming is often the challenge faced by fire control radar(FCR). Considering the multi-stage confrontation scenario, a dwell time optimization method based on model-free reinforcement learning is proposed to handle the problem of radar beam multi-stage management with unknown environment model. Firstly, a Markov decision process with unknown environment model is built for multi-stage dwell time optimization. To evaluate the performance of radar detection, the expectation of the search to lock-on time of the FCR is selected as an evaluation criterion. Then, to overcome the challenge of the unknown environment model, a reinforcement learning framework for multi-stage dwell time optimization is formulated. According to the framework, a method of multi-stage dwell time optimization based on Q-learning is proposed. Finally, numerical results are provided to verify the validity of the proposed method.

作者马智杰王远航姜家财张天贤 MA Zhijie;WANG Yuanhang;JIANG Jiacai;ZHANG Tianxian(School of Information and Communication Engineering,University of Electronic Science and Technology of China,Chengdu 611731,China;No.10 Research Institute of China Electronics Technology Group Corporation,Chengdu 610036,China)

机构地区电子科技大学信息与通信工程学院中国电子科技集团公司第十研究所

出处《现代雷达》 CSCD 北大核心 2022年第11期44-50,共7页 Modern Radar

基金国家自然科学基金资助项目(61971109) 国防科技创新特区支持项目(重点项目) 中央高校基本科研业务费资助项目(ZYGX2018J009)。

关键词雷达波束管理多阶段驻留时间优化未知环境模型 Q学习 radar beam management multi-stage dwell time optimization unknown environment model Q-learning

分类号 TN972 [电子电信—信号与信息处理]

引文网络
相关文献

参考文献3

1张锡熊.低截获概率(LPI)雷达的发展[J].现代雷达,2003,25(12):1-4. 被引量：55
2史忠亚,吴华,沈文迪,程嗣怡,陈游.考虑射频隐身的雷达功率自适应管控方法[J].现代雷达,2017,39(10):6-10. 被引量：7
3阮淑芬,崔占涛,张杰.射频辐射功率控制原理与实现方法研究[J].现代雷达,2015,37(1):17-20. 被引量：9

二级参考文献19

1[2]Jianjun Ge, Jun Zhou, Nianshen Xiong, etc. A LPI radar, system design and its performance. 1998 International Radar Symposium, Munich, Germany. 1998.9: 161～165
2[4]Donald R Wehner . High-Resolution Radar. Artech House Boston London, 1995
3Schhher D C.LPI radar:fact or fiction[J].IEEE Aerospace and Electronic Systems Magazine,2006,21(5):3-6.
4Lynch D L.Introduction to RF stealth[M].[S.l.]:SciTecn Publishing,2004.
5Pace P E.Detecting and classifying low probability of intercept radar[M].[S.l.]:Artech House,2004.
6Levanon N.Radar signal[M].Hoboken,NJ:John Wiley & Sons,Inc,2004.
7徐映和.静悄悄的卫士——低截获概率雷达[C]//第八届全国雷达学术年会论文集.合肥:中国科学技术大学出版社,2002:93-99.
8廖俊,于雷,俞利新,罗寰.基于LPI的相控阵雷达辐射控制方法[J].系统工程与电子技术,2011,33(12):2638-2642. 被引量：16
9张贞凯,周建江,田雨波,杨庆.基于射频隐身的采样间隔和功率设计[J].现代雷达,2012,34(4):19-23. 被引量：16
10张贞凯,周建江,汪飞,田雨波.基于射频隐身的相控阵雷达功率控制算法[J].系统工程与电子技术,2012,34(11):2244-2248. 被引量：20

共引文献67

1储冬生.《面积单位》教学设计与说明[J].教学与管理（小学版）,2005(7):72-74.
2王剑,戴征坚,林谦.微波综合脉冲孔径雷达技术[J].现代雷达,2006,28(1):9-12. 被引量：7
3王洪先,寇朋韬.LPI雷达技术及其在战场侦察雷达上的应用[J].火控雷达技术,2006,35(1):30-34. 被引量：9
4陈知明.机载雷达的隐身波形[J].现代雷达,2006,28(9):24-26. 被引量：6
5王毅鹰,苏兮.基于m序列信号的多普勒补偿方法[J].现代雷达,2007,29(2):48-51. 被引量：10
6朱华邦,杜娟,焦淑瑜.十字型振子FSS在机(弹)载雷达天线隐身中的应用研究[J].海军工程大学学报,2007,19(2):50-54. 被引量：4
7苏福,王小念,皮军明,罗金亮.随机信号雷达抗ARM能力分析[J].航天电子对抗,2007,23(4):9-11.
8张杰.基于MIMO体制的雷达LPI性能分析和应用[J].中国电子科学研究院学报,2007,2(4):397-401. 被引量：4
9袁伟明.一种新的准连续波雷达波形设计方法研究[J].现代雷达,2007,29(9):16-19. 被引量：13
10彭巧乐,司锡才,杜亚琦.基于瞬时互相关和STFT的LFM信号测向算法[J].哈尔滨工程大学学报,2008,29(2):179-182. 被引量：3

1曹俊,孙莹莹,赵航.智能电网中基于增强学习的动态价格优化算法[J].太赫兹科学与电子信息学报,2023,21(1):112-118.
2段娜娜,虎婕,侯艳.老年肺癌患者癌症复发恐惧水平与家庭支持、癌症健康素养关系[J].辽宁医学杂志,2022,36(6):15-18.
3赵利民,冯超红,蒋向,王俊美,徐飞,宋玉立.小麦茎基腐病防治技术研究进展[J].中国植保导刊,2022,42(11):22-27. 被引量：5
4张银红,胡晓凯,胡皓云.一种高性能频率合成系统国产化设计[J].电子测试,2022,36(21):17-19.
5熊智敏,王党卫,李星辉.OFDM-MIMO雷达转发式主瓣干扰自适应抑制方法[J].国防科技大学学报,2023,45(1):25-34.
6蔡泽,胡耀光,闻敬谦,张立祥.复杂动态环境下基于深度强化学习的AGV避障方法[J].计算机集成制造系统,2023,29(1):236-245. 被引量：4
7Madri Brink,Geert P.J.Janssens,Evelyne Delezie.Does feeding more phases reduce ammonia concentrations from broiler litter?[J].Animal Nutrition,2022(4):152-159.
8卢树昌,胡晓锋,马凯蕾,秦文燕,覃凤梅,李世凤,王永旺.纳布啡混合罗哌卡因用于初产妇硬膜外分娩镇痛的优化效应:与舒芬太尼混合罗哌卡因比较[J].中华麻醉学杂志,2022,42(10):1211-1214. 被引量：5
9Biyun Zhou,Bo Chen,Huijuan Shi,Lihao Xue,Yingfang Ao,Li Ding.SEMG-based fighter pilot muscle fatigue analysis and operation performance research[J].Medicine in Novel Technology and Devices,2022(4):345-349. 被引量：1

现代雷达

2022年第11期

浏览历史

内容加载中请稍等...

基于无模型强化学习的雷达波束多阶段管理方法

参考文献3

二级参考文献19

共引文献67

相关作者

相关机构

相关主题

浏览历史