期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于组合神经网络的Sarsa(λ)学习算法
1
作者 殷苌茗 付超红 +1 位作者 薛丽华 李立云 《计算机工程与设计》 CSCD 北大核心 2008年第22期5817-5819,5823,共4页
标准的Sarsa(λ)算法对状态空间的要求是离散的且空间较小,而实际问题中很多系统的状态空间是连续的或尽管是离散的但空间较大,这就需要很大的内存来存储状态动作对。为此提出组合神经网络,首先用自组织映射(SOM)神经网络对状态空间进... 标准的Sarsa(λ)算法对状态空间的要求是离散的且空间较小,而实际问题中很多系统的状态空间是连续的或尽管是离散的但空间较大,这就需要很大的内存来存储状态动作对。为此提出组合神经网络,首先用自组织映射(SOM)神经网络对状态空间进行自适应量化,然后在此基础上用BP网络拟合Q函数。该方法实现了Sarsa(λ)算法在连续和大规模状态空间的泛化。最后,实验结果表明了该方法的有效性。 展开更多
关键词 组合神经网络 强化学习 自组织映射 BP网络 Sarsa算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部