-
题名基于博弈论及Q学习的多Agent协作追捕算法
被引量:6
- 1
-
-
作者
郑延斌
樊文鑫
韩梦云
陶雪丽
-
机构
河南师范大学计算机与信息工程学院
智慧商务与物联网技术河南省工程实验室
-
出处
《计算机应用》
CSCD
北大核心
2020年第6期1613-1620,共8页
-
基金
国家自然科学基金资助项目(U1604156)
河南师范大学青年基金资助项目(2017QK20)。
-
文摘
多Agent协作追捕问题是多Agent协调与协作研究中的一个典型问题。针对具有学习能力的单逃跑者追捕问题,提出了一种基于博弈论及Q学习的多Agent协作追捕算法。首先,建立协作追捕团队,并构建协作追捕的博弈模型;其次,通过对逃跑者策略选择的学习,建立逃跑者有限的Step-T累积奖赏的运动轨迹,并把运动轨迹调整到追捕者的策略集中;最后,求解协作追捕博弈得到Nash均衡解,每个Agent执行均衡策略完成追捕任务。同时,针对在求解中可能存在多个均衡解的问题,加入了虚拟行动行为选择算法来选择最优的均衡策略。C#仿真实验表明,所提算法能够有效地解决障碍环境中单个具有学习能力的逃跑者的追捕问题,实验数据对比分析表明该算法在同等条件下的追捕效率要优于纯博弈或纯学习的追捕算法。
-
关键词
多AGENT
协作追捕
博弈论
Q学习
强化学习
-
Keywords
multi-agent
collaborative pursuit
game theory
Q-learning
reinforcement learning
-
分类号
TP24
[自动化与计算机技术—检测技术与自动化装置]
-