期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于强化学习的多目标点航关联方法
1
作者 丁国胜 蔡民杰 《指挥控制与仿真》 2022年第2期43-48,共6页
针对密集杂波环境下的多目标点迹-航迹关联问题,以强化学习(Reinforcement Learning,RL)方法为基础,提出了一种基于Q学习的多目标点迹-航迹关联方法。首先,根据整个过程中目标的运动状态,建立马尔可夫决策过程(Markov Decision Process,... 针对密集杂波环境下的多目标点迹-航迹关联问题,以强化学习(Reinforcement Learning,RL)方法为基础,提出了一种基于Q学习的多目标点迹-航迹关联方法。首先,根据整个过程中目标的运动状态,建立马尔可夫决策过程(Markov Decision Process,MDP)模型。其次,利用各状态间的相关程度构成策略函数,选择准确的动作,并设定相应的奖励函数。最后,考虑杂波密集时虚假量测难以分辨,结合目标先验信息,增加了Q表再学习环节,进一步优化关联精度。仿真结果表明,在非机动和强机动两种环境下,该方法都能准确地关联到目标的量测,具有较好的点迹-航迹关联性能。 展开更多
关键词 多目标点迹-航迹关联 强化学习 MDP模型 策略函数 q表再学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部