期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
水面无人艇自适应危险规避决策过程收敛性分析 被引量:6
1
作者 张汝波 唐平鹏 +2 位作者 杨歌 李雪耀 史长亭 《计算机研究与发展》 EI CSCD 北大核心 2014年第12期2644-2652,共9页
水面无人艇(unmanned surface vehicle,USV)是一种重要的海洋自主机器人,当前正被广泛研究并逐渐应用于实际.然而USV的安全航行问题仍严重制约其自主性能的提高,尤其是在复杂海况下的危险规避问题亟待解决.以Sarsa在线策略强化学习算法... 水面无人艇(unmanned surface vehicle,USV)是一种重要的海洋自主机器人,当前正被广泛研究并逐渐应用于实际.然而USV的安全航行问题仍严重制约其自主性能的提高,尤其是在复杂海况下的危险规避问题亟待解决.以Sarsa在线策略强化学习算法为基础,提出了USV在复杂海况下的自适应危险规避决策模型,并以渐进贪心策略作为行为探索策略,证明了USV自适应危险规避决策过程能够以概率1收敛到最优行为策略.论证结果表明,采用在线策略强化学习算法提升USV在复杂海况下的危险规避性能是可行的. 展开更多
关键词 水面无人艇 复杂海况 Sarsa在线策略强化学习 自适应危险规避决策过程 渐进贪心策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部