-
题名面向煤矿救援机器人路径规划的重回放机制DQN算法
被引量:1
- 1
-
-
作者
吴东领
魏群
刘心军
-
机构
唐山职业技术学院
华北理工大学理学院
唐山科技职业技术学院
-
出处
《煤炭技术》
CAS
北大核心
2023年第5期237-240,共4页
-
文摘
煤矿井下环境复杂,现有煤矿救援机器人路径规划算法存在收敛性差及平滑性能弱等不足。提出一种面向煤矿救援机器人路径规划的重回放机制和动态贪婪策略结合的DQN算法。首先,通过DQN网络训练得到的输出值替换原来的Q值表,并采用重回放机制,从而避免陷入维度灾难和改善算法的收敛性;其次,采用一种动态的贪婪搜索策略,选择出当前最佳的执行动作,打破样本之间的关联性,不断探索环境信息选择最优路径。最后,利用拓展邻域的位移模式,缩短搜索距离从而提升规划路径的平滑性能。仿真结果表明:提出的算法性能对比DQN算法在煤矿救援机器人规划路径指标性能上获得较大提升,从而保障了煤矿救援机器人实际作业时的高效运行。
-
关键词
煤矿救援机器人
路径规划
dqn网络训练
重回放机制
收敛性
-
Keywords
coal mine rescue robot
path planning
dqn network training
replay mechanism
convergence
-
分类号
TP242
[自动化与计算机技术—检测技术与自动化装置]
-