-
题名基于多Agent深度强化学习的无人机协作规划方法
- 1
-
-
作者
王娜
马利民
姜云春
宗成国
-
机构
青岛黄海学院智能制造学院
湖南大学电气与信息工程学院
-
出处
《计算机应用与软件》
北大核心
2024年第9期83-89,96,共8页
-
基金
湖南省自然科学基金项目(2018JJ1002)
青岛黄海学院校内博士项目(2017boshi02)。
-
文摘
人机协作控制是多无人机任务规划的重要方式。考虑多无人机任务环境协同解释和策略控制一致性需求,提出基于多Agent深度强化学习的无人机协作规划方法。依据任务知识和行为状态,构建基于任务分配Agent的任务规划器,生成人机交互的相互依赖关系;设计一种深度学习强化方法,解决群体行为最优策略和协同控制方法,并利用混合主动行为选择机制评估学习策略。实验结果表明:作为人机交互实例,所提方法通过深度强化学习使群体全局联合动作表现较好,学习速度和稳定性均能优于确定性策略梯度方法。同时,在跟随、自主和混合主动3种模式比较下,可以较好地控制无人机飞行路径和任务,为无人机集群任务执行提供了智能决策依据。
-
关键词
多agent规划
深度强化学习
无人机协同规划
混合主动行为
-
Keywords
Multi-agent planning
Deep reinforcement learning
UAV cooperative planning
Mixed-initiative behavior
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名多Agent环境下规划的验证方法
被引量:3
- 2
-
-
作者
李岳峰
刘大有
-
机构
吉林大学计算机科学系
-
出处
《计算机学报》
EI
CSCD
北大核心
1996年第3期202-207,共6页
-
文摘
如何验证多agent规划是一个非常重要的研究课题,因为该研究关系到规划的求解能否在分布式环境下有效地进行.在本文中,我们讨论了规划的验证方法,给出了压缩集合的生成算法,并给出了该算法的正确性证明.与Katz等人所提出的算法不同,我们用正向邻接表和逆向邻接表来表示规划链关系D,用辅助数组来控制所用到的子图(即不是真正的生成子图,但由辅助数组即能看出当前所要处理的子图),提出了避免无用子图产生的方法.我们所给出的算法不论在空间复杂性方面还是在时间复杂性方面都优于Katz等人所提出的算法.
-
关键词
多agent规划
规划
验证
人工智能
-
Keywords
Planning for multiple agents, plan verification, plan link relation.
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名不确定规划中的多Agent带权值强规化算法
- 3
-
-
作者
伍小辉
文中华
李洋
劳佳琪
-
机构
湘潭大学信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第1期190-195,共6页
-
基金
国家自然科学基金资助项目(61070232
61272295
61105039)
-
文摘
在智能规划领域中,以往对不确定规划问题的研究主要集中于单个Agent,而对多Agent规划的研究则侧重于确定规划。针对该问题,提出基于多Agent的带权值不确定规划问题,对所求解的强规划解,设计使其所需动作权值总和近似最小的算法。根据基于模型检测的强规划分层方法,对每个Agent进行强规划分层,合并所有Agent的分层信息,并在合并的过程中得到同层状态之间的冲突表。在保证冲突最小的情况下,以最小动作权值优先的贪心方法,求出强规划解。实验结果表明,该算法能较快地求解出使所选择的动作权值总和近似最小的强规划解。
-
关键词
多agent规划
不确定规划
强规划解
模型检测
动作权值
智能规划
-
Keywords
multi-agent planning
nondeterministic planning
strong planning solution
model checking
action weight
intelligent planning
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-