-
题名基于强化学习的海洋移动观测网络观测路径规划方法
被引量:3
- 1
-
-
作者
赵玉新
杜登辉
成小会
周迪
邓雄
刘延龙
-
机构
哈尔滨工程大学智能科学与工程学院
中国舰船研究设计中心
-
出处
《智能系统学报》
CSCD
北大核心
2022年第1期192-200,共9页
-
基金
国家自然科学基金项目(41676088)
中央高校基本科研业务费项目(3072021CFJ0401).
-
文摘
合理有效地对移动海洋环境观测平台进行规划,有利于海洋环境观测网络的设计和海洋环境信息的采集。针对庞大的海洋环境,在有限的观测资源下,使用深度强化学习算法对海洋环境观测网络进行规划。针对强化学习算法求解路径规划问题中的离散和连续动作设计问题,分别使用DQN和DDPG两种算法对该问题进行单平台和多平台实验,实验结果表明,使用离散动作的DQN算法的奖赏函数优于使用连续动作的DDPG算法。进一步对两种算法求解的移动海洋观测平台的采样路径结果进行分析,结果显示,使用离散动作的DQN算法的采样结果也更好。实验结果证明,使用离散动作的DQN算法可以最大化对海洋环境中有效资料信息采集,说明了该方法的有效性和可行性。
-
关键词
深度强化学习
海洋环境观测
路径规划
无人测量船
Q学习
多智能体
深度确定性策略梯度
高斯排序
-
Keywords
deep reinforcement learning
marine environmental observation
path planning
USV
Q learning
multiagent
DDPG
RankGauss
-
分类号
TP242.6
[自动化与计算机技术—检测技术与自动化装置]
-