期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进的DQN机器人路径规划 被引量:20
1
作者 董永峰 杨琛 +3 位作者 董瑶 屈向前 肖华昕 王子秋 《计算机工程与设计》 北大核心 2021年第2期552-558,共7页
针对深度Q学习算法在机器人路径规划中的过估计问题,提出一种动态融合深度双Q算法(dynamic target double deep Q network,DTDDQN)。通过动态融合DDQN和平均DQN的先验知识进行网络参数训练,前期以较大权重的DDQN优化目标对估计网络进行... 针对深度Q学习算法在机器人路径规划中的过估计问题,提出一种动态融合深度双Q算法(dynamic target double deep Q network,DTDDQN)。通过动态融合DDQN和平均DQN的先验知识进行网络参数训练,前期以较大权重的DDQN优化目标对估计网络进行网络训练和先验知识的积累,随着学习的深入,增大平均DQN的优化目标对网络训练的权重,使网络输出的Q值更加接近真实Q值,减少过估计对机器人在选择动作时的影响,达到所选策略最优。仿真对比结果表明,DTDDQN算法在路径规划中能更好解决过估计问题,在动作选择方面以及规划路径长度方面都有一定提升。 展开更多
关键词 动态融合 机器人路径规划 过估计 深度强化学习 优化目标
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部