期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于混合采样深度Q网络的水面无人艇逃脱策略
1
作者 杨远鹏 宋利飞 +2 位作者 茅嘉琪 李一 陈侯京 《中国舰船研究》 CSCD 北大核心 2024年第1期256-263,共8页
[目的]针对敌方船舶采用合围战术,研究我方无人艇(USV)被敌方船舶包围情况下的逃跑策略规划问题。[方法]提出一种混合采样深度Q网络(HS-DQN)强化学习算法,逐步增加重要样本的回放频率,并保留一定的探索性,防止算法陷入局部最优。设计状... [目的]针对敌方船舶采用合围战术,研究我方无人艇(USV)被敌方船舶包围情况下的逃跑策略规划问题。[方法]提出一种混合采样深度Q网络(HS-DQN)强化学习算法,逐步增加重要样本的回放频率,并保留一定的探索性,防止算法陷入局部最优。设计状态空间、动作空间和奖励函数,通过训练获得最优的USV逃跑策略,并从奖励值和逃脱成功率方面与DQN算法进行对比。[结果]仿真结果表明,使用HSDQN算法进行训练,逃脱成功率提高2%,算法的收敛速度提高了20%。[结论]HS-DQN算法可以减少USV无效探索的次数,并加快算法的收敛速度,仿真实验验证了USV逃跑策略的有效性。 展开更多
关键词 无人艇 阿波罗尼奥斯圆 围捕-逃跑 深度强化学习 混合采样
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部