期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
强化学习算法中启发式回报函数的设计及其收敛性分析 被引量:13
1
作者 魏英姿 赵明扬 《计算机科学》 CSCD 北大核心 2005年第3期190-193,共4页
(中国科学院沈阳自动化所机器人学重点实验室沈阳110016)
关键词 强化学习算法 启发式回报函数 收敛性 马尔可夫决策过程 机器学习 人工智能
下载PDF
基于强化学习的自主移动机器人反应式自救控制 被引量:2
2
作者 王忠巍 曹其新 +1 位作者 栾楠 张蕾 《上海交通大学学报》 EI CAS CSCD 北大核心 2009年第11期1751-1755,共5页
为了解救陷入环境障碍的自主移动机器人,提出了一种基于强化学习的自救脱困控制方法.该方法通过移动机器人与环境的交互作用,能够在线学习实现脱困自救的运动控制策略,并利用机器人自身条件克服环境障碍,避免了实施救援机器人的行动和... 为了解救陷入环境障碍的自主移动机器人,提出了一种基于强化学习的自救脱困控制方法.该方法通过移动机器人与环境的交互作用,能够在线学习实现脱困自救的运动控制策略,并利用机器人自身条件克服环境障碍,避免了实施救援机器人的行动和终止其作业任务所造成的损失.利用工作环境的先验知识指导,设计含有启发信息的强化学习系统回报函数,保证搜索和学习控制策略向正确方向进行,同时提高学习控制器的适应性和鲁棒性.数字仿真证明了通过自学习控制策略实现自救脱困的可行性. 展开更多
关键词 自主移动机器人 反应控制 Q学习 启发式回报函数
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部