期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种新颖的多agent强化学习方法 被引量:8
1
作者 周浦城 洪炳镕 黄庆成 《电子学报》 EI CAS CSCD 北大核心 2006年第8期1488-1491,共4页
提出了一种综合了模块化结构、利益分配学习以及对手建模技术的多agent强化学习方法,利用模块化学习结构来克服状态空间的维数灾问题,将Q-学习与利益分配学习相结合以加快学习速度,采用基于观察的对手建模来预测其他agent的动作分布.追... 提出了一种综合了模块化结构、利益分配学习以及对手建模技术的多agent强化学习方法,利用模块化学习结构来克服状态空间的维数灾问题,将Q-学习与利益分配学习相结合以加快学习速度,采用基于观察的对手建模来预测其他agent的动作分布.追捕问题的仿真结果验证了所提方法的有效性. 展开更多
关键词 多AGENT学习 Q-学习 利益分配学习 模块化结构 对手建模
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部