期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
平均准则问题的即时差分学习算法 被引量:2
1
作者 胡光华 吴沧浦 《自动化学报》 EI CSCD 北大核心 2000年第4期533-536,共4页
考虑平均准则随机动态规划 (SDP)问题的一族在线即时差分 (TD)学习算法 .在学习中 ,平均问题的相对值函数是控制器所要学习的目标函数 .所提出的算法是已有的 TD(λ)算法及 R-学习算法的一种推广 .
关键词 即时差分学习算法 动态规划 平均准则问题
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部