期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
逻辑半马尔可夫决策过程及Q学习
1
作者 王蓁蓁 王智钢 《金陵科技学院学报》 2013年第2期13-19,共7页
增强学习已经开始向关系增强学习发展,并且产生了许多新的算法。这些方法是将命题表达提升为关系或计算逻辑的表达。提出了一种新的表达形式,称为逻辑半马尔可夫决策过程。它是将逻辑程序与半马尔可夫过程相结合。在此框架中,抽象(状态... 增强学习已经开始向关系增强学习发展,并且产生了许多新的算法。这些方法是将命题表达提升为关系或计算逻辑的表达。提出了一种新的表达形式,称为逻辑半马尔可夫决策过程。它是将逻辑程序与半马尔可夫过程相结合。在此框架中,抽象(状态或行动)是至关重要的,并且提出了对于逻辑半马尔可夫决策过程的Q-学习算法,给出其收敛证明。这种框架对在关系增强学习发展中处理时间连续方面提供了一个合理的基础。 展开更多
关键词 关系增强学习 马尔可夫 逻辑半马尔可夫 决策过程
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部