期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
提高强化学习速度的方法研究 被引量:8
1
作者 张汝波 《计算机工程与应用》 CSCD 北大核心 2001年第22期38-40,共3页
强化学习一词出自于行为心理学,这门学科把学习看作为反复试验的过程,以便把环境的状态映射为动作。强化学习的这种特性必然增加智能系统的困难性,学习时间增长。强化学习学习速度较慢的原因是没有明确的监督信号。因此,强化学习系统在... 强化学习一词出自于行为心理学,这门学科把学习看作为反复试验的过程,以便把环境的状态映射为动作。强化学习的这种特性必然增加智能系统的困难性,学习时间增长。强化学习学习速度较慢的原因是没有明确的监督信号。因此,强化学习系统在与环境交互时不得不采取反复试验的方法依靠外部评价信号来调整自己的行为。智能系统必然经过很长的学习过程。如何提高强化学习速度是一个最重要的研究问题。该文从几个方面来讨论提高强化学习速度的方法。 展开更多
关键词 强化学习 机器学习 Q-学习 自适应启发评价方法 学习速度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部