期刊文献+

基于混合Q学习的多Agent系统

The multi-Agent system based on hybrid Q-learning reinforcment learning
下载PDF
导出
摘要 本文设计了多Agent混合智能控制结构,该结构引入了经过改进的联合Q学习和神经网络,提出了多Agent混合Q学习算法,优化了联合Q学习的动作选取,解决了传统Q学习中Q表占用内存空间过大的问题,增强了系统的泛化能力,最后应用到Hunters-prey模型中。实验结果表明,大大缩小了状态-动作对,优化学习状态,提高学习效率。
出处 《制造业自动化》 北大核心 2010年第9期61-63,94,共4页 Manufacturing Automation
基金 江苏省自然科学基金(BK2006176)
  • 相关文献

参考文献8

二级参考文献44

  • 1胡守仁 余少波.神经网络导论[M].长沙:国防科技大学出版社,1992.113-129.
  • 2[6]WATKINS C J C H, DAYAN P. Q-learning [ J ]. Machine Learning, 1994,8(3 ): 279 - 292.
  • 3[1]TAMBE M. Tracking dynamic team activity [ J ]. Proceedings of National Conference on Artificial Intelligence (AAAl)[C]. [s. l. ]:[s.n. ],1998.
  • 4[3]STONE P, VELOSO M. Multi-agent systems: a survey from a machine learning perspective[R]. CMU CS technical report, No. CMU - CS -97 - 193.
  • 5[4]SINGH S. Agents and reinforcement learning [ M ]. San Mateo: CA: Miller freeman publish Inc, 1997.
  • 6[5]SUTTON R S, BARTO A G. Reinforcement Learning [M]. [s. l.]: MITPress,1998.
  • 7Watkins C J C H. Learning from Delayed Rewards:[Ph.D.thesis]. Cambridge University, 1989.
  • 8Watkins C J C H. Dayan P. Technical not:Q-learning. Machine Learning, 1992,8:279~292.
  • 9Ohashi T ,et al. State transition rate based reinforcement learning Systems, Man, and Cybernetics. In: 2000 IEEE Intl. Cord.Volume: 1, 2000. 236~241.
  • 10Yamagnchi T,et al. Propagating learned behaviors from a virtual agent to a physical robot in reinforcement learnins, In..Proe. IEEE Int. Conf. on Evolutionary Computation, 1996. 855~859.

共引文献307

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部