-
题名一类用于井下路径规划问题的Dyna_Q学习算法
被引量:2
- 1
-
-
作者
朱美强
李明
张倩
-
机构
中国矿业大学信电学院
-
出处
《工矿自动化》
北大核心
2012年第12期71-76,共6页
-
基金
国家自然科学基金资助项目(61273143)
中国矿业大学青年科技基金项目(OC080252)
-
文摘
在基于目标的强化学习任务中,欧氏距离常用于Dyna_Q学习的启发式规划中,但对于井下救援机器人路径规划这类状态空间在欧氏空间内不连续的任务效果不理想。针对该问题,文章引入流形学习中计算复杂度较低的拉普拉斯特征映射法,提出了一种基于流形距离度量的改进Dyna_Q学习算法,并在类似于井下环境的格子世界中进行了仿真研究。仿真结果验证了该算法的有效性。
-
关键词
dyna_q学习
欧氏距离
启发式规划
路径规划
拉普拉斯特征映射
流形距离
-
Keywords
Dyna_ Q-learning, Euclidean distance, heuristic planning, path planning, LaplacianEigenmap, manifold distance
-
分类号
TD67
[矿业工程—矿山机电]
-