期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
强化学习算法中启发式回报函数的设计及其收敛性分析 被引量:13
1
作者 魏英姿 赵明扬 《计算机科学》 CSCD 北大核心 2005年第3期190-193,共4页
(中国科学院沈阳自动化所机器人学重点实验室沈阳110016)
关键词 强化学习算法 启发式回报函数 收敛性 马尔可夫决策过程 机器学习 人工智能
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部