期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
机器学习中加速强化学习的一种函数方法
1
作者 宋炯 金钊 杨维和 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第S2期176-181,共6页
机器学习中值函数需要反复更新直至其收敛是造成强化学习速度慢的根本原因.提出一种可实现批量更新值函数的学习方法,从加快值函数收敛的角度来加速强化学习.通过在训练情节中记录下从初始状态到达当前状态的状态转换序列,从中求出其它... 机器学习中值函数需要反复更新直至其收敛是造成强化学习速度慢的根本原因.提出一种可实现批量更新值函数的学习方法,从加快值函数收敛的角度来加速强化学习.通过在训练情节中记录下从初始状态到达当前状态的状态转换序列,从中求出其它状态到达当前状态的最短状态路径,使当前状态更新的值函数可沿该最短状态路径逆序向前传播,从而实现值函数的批量更新.从在栅格环境中求最短路径的仿真试验结果看,该方法可显著提高值函数的更新频率,缩短学习时间. 展开更多
关键词 强化学习 值函数 最短状态路径 加速学习 栅格环境
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部