期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于无模型强化学习的雷达波束多阶段管理方法
1
作者 马智杰 王远航 +1 位作者 姜家财 张天贤 《现代雷达》 CSCD 北大核心 2022年第11期44-50,共7页
火控雷达(FCR)工作时常常面临转发式干扰的挑战,考虑二者间多阶段对抗场景,针对未知环境模型下雷达波束多阶段管理问题,提出了一种基于无模型强化学习的波束驻留时间优化方法。首先,建立了未知环境模型下的马尔可夫决策过程,用于多阶段... 火控雷达(FCR)工作时常常面临转发式干扰的挑战,考虑二者间多阶段对抗场景,针对未知环境模型下雷达波束多阶段管理问题,提出了一种基于无模型强化学习的波束驻留时间优化方法。首先,建立了未知环境模型下的马尔可夫决策过程,用于多阶段波束驻留时间优化,为了评价雷达探测的性能,以FCR对目标锁定时间的期望为评价标准;然后,为克服未知环境模型的挑战,提出了一种面向多阶段波束驻留时间优化的强化学习框架,并在此基础上提出了一种基于Q学习的驻留时间优化方法;最后,通过数值仿真验证了该方法的有效性。 展开更多
关键词 雷达波束管理 多阶段驻留时间优化 未知环境模型 Q学习
下载PDF
一种距离门拖引干扰策略的智能生成方法 被引量:2
2
作者 贾瑞 张天贤 +2 位作者 王远航 邓艳红 孔令讲 《信号处理》 CSCD 北大核心 2021年第2期276-283,共8页
针对未知环境模型下的多帧距离门拖引干扰的策略优化问题,提出一种基于改进粒子群算法的拖引干扰策略优化方案。首先,以平均波门偏移距离作为干扰效果的性能评价指标,建立了距离门拖引干扰的多帧联合优化模型。然后,为了解决目标函数解... 针对未知环境模型下的多帧距离门拖引干扰的策略优化问题,提出一种基于改进粒子群算法的拖引干扰策略优化方案。首先,以平均波门偏移距离作为干扰效果的性能评价指标,建立了距离门拖引干扰的多帧联合优化模型。然后,为了解决目标函数解析表达式难以获取的难点,提出了一种结合奖励机制的蒙特卡洛目标函数拟合方法;在此基础上,面向优化维度过高的难点,提出了基于粒子群算法的策略优化方法;最后,数值仿真结果证明了算法的有效性。 展开更多
关键词 距离门拖引干扰 环境模型未知 拖引策略 改进粒子群算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部