-
题名基于无模型强化学习的雷达波束多阶段管理方法
- 1
-
-
作者
马智杰
王远航
姜家财
张天贤
-
机构
电子科技大学信息与通信工程学院
中国电子科技集团公司第十研究所
-
出处
《现代雷达》
CSCD
北大核心
2022年第11期44-50,共7页
-
基金
国家自然科学基金资助项目(61971109)
国防科技创新特区支持项目(重点项目)
中央高校基本科研业务费资助项目(ZYGX2018J009)。
-
文摘
火控雷达(FCR)工作时常常面临转发式干扰的挑战,考虑二者间多阶段对抗场景,针对未知环境模型下雷达波束多阶段管理问题,提出了一种基于无模型强化学习的波束驻留时间优化方法。首先,建立了未知环境模型下的马尔可夫决策过程,用于多阶段波束驻留时间优化,为了评价雷达探测的性能,以FCR对目标锁定时间的期望为评价标准;然后,为克服未知环境模型的挑战,提出了一种面向多阶段波束驻留时间优化的强化学习框架,并在此基础上提出了一种基于Q学习的驻留时间优化方法;最后,通过数值仿真验证了该方法的有效性。
-
关键词
雷达波束管理
多阶段驻留时间优化
未知环境模型
Q学习
-
Keywords
radar beam management
multi-stage dwell time optimization
unknown environment model
Q-learning
-
分类号
TN972
[电子电信—信号与信息处理]
-
-
题名一种距离门拖引干扰策略的智能生成方法
被引量:2
- 2
-
-
作者
贾瑞
张天贤
王远航
邓艳红
孔令讲
-
机构
电子科技大学信息与通信工程学院
-
出处
《信号处理》
CSCD
北大核心
2021年第2期276-283,共8页
-
基金
自然科学基金面上项目(61971109)
自然科学基金重点(U19B2017)
+2 种基金
长江学者基金
国防科技创新特区支持项目(重点项目)
中央高校基本科研业务费资助项目(ZYGX2018J009)。
-
文摘
针对未知环境模型下的多帧距离门拖引干扰的策略优化问题,提出一种基于改进粒子群算法的拖引干扰策略优化方案。首先,以平均波门偏移距离作为干扰效果的性能评价指标,建立了距离门拖引干扰的多帧联合优化模型。然后,为了解决目标函数解析表达式难以获取的难点,提出了一种结合奖励机制的蒙特卡洛目标函数拟合方法;在此基础上,面向优化维度过高的难点,提出了基于粒子群算法的策略优化方法;最后,数值仿真结果证明了算法的有效性。
-
关键词
距离门拖引干扰
环境模型未知
拖引策略
改进粒子群算法
-
Keywords
RGPO jamming
unknown environment model
jamming strategy
improved particle swarm optimization
-
分类号
TN972.32
[电子电信—信号与信息处理]
TN974
[电子电信—信号与信息处理]
-