-
题名基于改进的DQN机器人路径规划
被引量:20
- 1
-
-
作者
董永峰
杨琛
董瑶
屈向前
肖华昕
王子秋
-
机构
河北工业大学人工智能与数据科学学院
河北工业大学河北省大数据计算重点实验室
河北工业大学河北省数据驱动工业智能工程中心
-
出处
《计算机工程与设计》
北大核心
2021年第2期552-558,共7页
-
基金
天津市自然科学基金重点基金项目(19JCZDJC40000)
天津市科技计划基金项目(18YFCZZC00060、18ZXZNGX00100)。
-
文摘
针对深度Q学习算法在机器人路径规划中的过估计问题,提出一种动态融合深度双Q算法(dynamic target double deep Q network,DTDDQN)。通过动态融合DDQN和平均DQN的先验知识进行网络参数训练,前期以较大权重的DDQN优化目标对估计网络进行网络训练和先验知识的积累,随着学习的深入,增大平均DQN的优化目标对网络训练的权重,使网络输出的Q值更加接近真实Q值,减少过估计对机器人在选择动作时的影响,达到所选策略最优。仿真对比结果表明,DTDDQN算法在路径规划中能更好解决过估计问题,在动作选择方面以及规划路径长度方面都有一定提升。
-
关键词
动态融合
机器人路径规划
过估计
深度强化学习
优化目标
-
Keywords
target fusion
robot path planning
overestimation
deep reinforcement learning
optimization target
-
分类号
TP242
[自动化与计算机技术—检测技术与自动化装置]
-