期刊文献+

Q-learning算法及其在囚徒困境问题中的实现 被引量:7

Q-learning Algorithm and Its Usage in Prisoner's Dilemma
下载PDF
导出
摘要 Q-learning是一种优良的强化学习算法。该文首先阐述了Q-learning的基本学习机制,然后以囚徒困境问题为背景,分析、对比T Q-learning算法与TFT算法,验证了 Q-learning算法的优良特性。 Q-learning is an algorithm of Reinforcement learning algorithm.In this paper,We elaborate the learning method of Q-learning algorithm simply,use it in prisoner's dilemma game and compare it with TFT to show its good character.
出处 《计算机工程与应用》 CSCD 北大核心 2001年第13期121-122,128,共3页 Computer Engineering and Applications
基金 国家自然科学基金的支持(编号:69875017)
关键词 机器学习 强化学习 Q-learning算法 囚徒困境问题 人工智能 Machine Learning, Reinforcement learning, Q-learning algorithm, Agent,prisoner's dilemma,TFT algorithm
  • 相关文献

参考文献4

  • 1PR科恩 周少柏等(译).人工智能手册(第三卷)[M].科学出版社,1991..
  • 2史忠植,高级人工智能,1998年
  • 3蔡自兴,人工智能及其应用(第2版),1996年
  • 4周少柏,人工智能手册.第三卷,1991年

同被引文献78

引证文献7

二级引证文献43

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部