期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于强化学习的海洋移动观测网络观测路径规划方法 被引量:3
1
作者 赵玉新 杜登辉 +3 位作者 成小会 周迪 邓雄 刘延龙 《智能系统学报》 CSCD 北大核心 2022年第1期192-200,共9页
合理有效地对移动海洋环境观测平台进行规划,有利于海洋环境观测网络的设计和海洋环境信息的采集。针对庞大的海洋环境,在有限的观测资源下,使用深度强化学习算法对海洋环境观测网络进行规划。针对强化学习算法求解路径规划问题中的离... 合理有效地对移动海洋环境观测平台进行规划,有利于海洋环境观测网络的设计和海洋环境信息的采集。针对庞大的海洋环境,在有限的观测资源下,使用深度强化学习算法对海洋环境观测网络进行规划。针对强化学习算法求解路径规划问题中的离散和连续动作设计问题,分别使用DQN和DDPG两种算法对该问题进行单平台和多平台实验,实验结果表明,使用离散动作的DQN算法的奖赏函数优于使用连续动作的DDPG算法。进一步对两种算法求解的移动海洋观测平台的采样路径结果进行分析,结果显示,使用离散动作的DQN算法的采样结果也更好。实验结果证明,使用离散动作的DQN算法可以最大化对海洋环境中有效资料信息采集,说明了该方法的有效性和可行性。 展开更多
关键词 深度强化学习 海洋环境观测 路径规划 无人测量船 Q学习 多智能体 深度确定性策略梯度 高斯排序
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部