期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于隐偏向信息学习的强化学习算法 被引量:4
1
作者 李学勇 欧阳柳波 李国徽 《南华大学学报(理工版)》 2004年第2期10-16,共7页
传统的强化学习算法应用到大状态、动作空间和任务复杂的马尔可夫决策过程问题时,存在收敛速度慢,训练时间长等问题.有效地学习和利用问题中包含的偏向信息可以加快学习速度,提高学习效率.在分析了偏向机制特点的基础上引入了隐偏向信... 传统的强化学习算法应用到大状态、动作空间和任务复杂的马尔可夫决策过程问题时,存在收敛速度慢,训练时间长等问题.有效地学习和利用问题中包含的偏向信息可以加快学习速度,提高学习效率.在分析了偏向机制特点的基础上引入了隐偏向信息的概念,建立了一种基于偏向信息学习的强化学习模型,并提出了一种基于特征的改进SARSA(λ)算法.针对于推箱任务的实验表明,改进的算法明显提高了学习效率. 展开更多
关键词 强化学习 MARKOV决策过程 隐偏向信息 SARSA算法 复杂度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部