期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于无模型强化学习的雷达波束多阶段管理方法
1
作者 马智杰 王远航 +1 位作者 姜家财 张天贤 《现代雷达》 CSCD 北大核心 2022年第11期44-50,共7页
火控雷达(FCR)工作时常常面临转发式干扰的挑战,考虑二者间多阶段对抗场景,针对未知环境模型下雷达波束多阶段管理问题,提出了一种基于无模型强化学习的波束驻留时间优化方法。首先,建立了未知环境模型下的马尔可夫决策过程,用于多阶段... 火控雷达(FCR)工作时常常面临转发式干扰的挑战,考虑二者间多阶段对抗场景,针对未知环境模型下雷达波束多阶段管理问题,提出了一种基于无模型强化学习的波束驻留时间优化方法。首先,建立了未知环境模型下的马尔可夫决策过程,用于多阶段波束驻留时间优化,为了评价雷达探测的性能,以FCR对目标锁定时间的期望为评价标准;然后,为克服未知环境模型的挑战,提出了一种面向多阶段波束驻留时间优化的强化学习框架,并在此基础上提出了一种基于Q学习的驻留时间优化方法;最后,通过数值仿真验证了该方法的有效性。 展开更多
关键词 雷达波束管理 多阶段驻留时间优化 未知环境模型 Q学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部