期刊文献+

Q学习算法在库存控制中的应用 被引量:20

INVENTORY CONTROL USING Q LEARNING
下载PDF
导出
摘要 Q学习算法是Watkins提出的求解信息不完全马尔可夫决策问题的一种强化学习方法.这里提出了一种新的探索策略,并将该策略和Q学习算法有效结合来求解一类典型的有连续状态和决策空间的库存控制问题.仿真表明,该方法所求解的控制策略和用值迭代法在模型已知的情况下所求得的最优策略非常逼近,从而证实了Q学习算法在一些系统模型未知的工程控制问题中的应用潜力.
出处 《自动化学报》 EI CSCD 北大核心 1999年第2期236-241,共6页 Acta Automatica Sinica
基金 国家自然科学基金
  • 相关文献

参考文献2

  • 1Peng J,博士学位论文,1993年
  • 2Lin L J,Machine Learning,1992年,8卷,293页

同被引文献155

引证文献20

二级引证文献325

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部