摘要
本文设计了多Agent混合智能控制结构,该结构引入了经过改进的联合Q学习和神经网络,提出了多Agent混合Q学习算法,优化了联合Q学习的动作选取,解决了传统Q学习中Q表占用内存空间过大的问题,增强了系统的泛化能力,最后应用到Hunters-prey模型中。实验结果表明,大大缩小了状态-动作对,优化学习状态,提高学习效率。
出处
《制造业自动化》
北大核心
2010年第9期61-63,94,共4页
Manufacturing Automation
基金
江苏省自然科学基金(BK2006176)