期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一类用于井下路径规划问题的Dyna_Q学习算法 被引量:2
1
作者 朱美强 李明 张倩 《工矿自动化》 北大核心 2012年第12期71-76,共6页
在基于目标的强化学习任务中,欧氏距离常用于Dyna_Q学习的启发式规划中,但对于井下救援机器人路径规划这类状态空间在欧氏空间内不连续的任务效果不理想。针对该问题,文章引入流形学习中计算复杂度较低的拉普拉斯特征映射法,提出了一种... 在基于目标的强化学习任务中,欧氏距离常用于Dyna_Q学习的启发式规划中,但对于井下救援机器人路径规划这类状态空间在欧氏空间内不连续的任务效果不理想。针对该问题,文章引入流形学习中计算复杂度较低的拉普拉斯特征映射法,提出了一种基于流形距离度量的改进Dyna_Q学习算法,并在类似于井下环境的格子世界中进行了仿真研究。仿真结果验证了该算法的有效性。 展开更多
关键词 dyna_q学习 欧氏距离 启发式规划 路径规划 拉普拉斯特征映射 流形距离
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部