期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
改进的CE-Q算法用于多Agent觅食的研究
1
作者 雷默涵 杨萍 《机械设计》 CSCD 北大核心 2015年第6期1-4,共4页
针对对策论框架下的诸多强化学习方法在复杂环境多Agent任务中存在的缺乏理性、难以保证收敛、计算复杂度较高和效率偏低等问题,文中在CE-Q强化算法的基本理论上,提出了加入对于动作过程的即时奖赏的CE-Q改进强化算法,有效地改善了上述... 针对对策论框架下的诸多强化学习方法在复杂环境多Agent任务中存在的缺乏理性、难以保证收敛、计算复杂度较高和效率偏低等问题,文中在CE-Q强化算法的基本理论上,提出了加入对于动作过程的即时奖赏的CE-Q改进强化算法,有效地改善了上述问题,并在执行任务过程中对Agent进行指导,很好地提高了系统效率。最后以多Agent觅食为任务,Matlab为平台进行仿真实试验,并与普通CE-Q及FF-Q算法进行对比,验证了其在复杂环境下对于多Agent系统的有效性和优越性。 展开更多
关键词 CE-Q强化学习算法 动作过程奖赏 多Agent觅食任务 系统效率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部