期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于节点生长k-均值聚类算法的强化学习方法 被引量:13
1
作者 陈宗海 文锋 +1 位作者 聂建斌 吴晓曙 《计算机研究与发展》 EI CSCD 北大核心 2006年第4期661-666,共6页
处理连续状态强化学习问题,主要方法有两类:参数化的函数逼近和自适应离散划分.在分析了现有对连续状态空间进行自适应划分方法的优缺点的基础上,提出了一种基于节点生长k均值聚类算法的划分方法,分别给出了在离散动作和连续动作两种情... 处理连续状态强化学习问题,主要方法有两类:参数化的函数逼近和自适应离散划分.在分析了现有对连续状态空间进行自适应划分方法的优缺点的基础上,提出了一种基于节点生长k均值聚类算法的划分方法,分别给出了在离散动作和连续动作两种情况下该强化学习方法的算法步骤.在离散动作的MountainCar问题和连续动作的双积分问题上进行仿真实验.实验结果表明,该方法能够根据状态在连续空间的分布,自动调整划分的精度,实现对于连续状态空间的自适应划分,并学习到最佳策略. 展开更多
关键词 强化学习 K-均值聚类算法 Sarsa学习 连续状态表示
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部