期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于多Agent深度强化学习的无人机协作规划方法
1
作者 王娜 马利民 +1 位作者 姜云春 宗成国 《计算机应用与软件》 北大核心 2024年第9期83-89,96,共8页
人机协作控制是多无人机任务规划的重要方式。考虑多无人机任务环境协同解释和策略控制一致性需求,提出基于多Agent深度强化学习的无人机协作规划方法。依据任务知识和行为状态,构建基于任务分配Agent的任务规划器,生成人机交互的相互... 人机协作控制是多无人机任务规划的重要方式。考虑多无人机任务环境协同解释和策略控制一致性需求,提出基于多Agent深度强化学习的无人机协作规划方法。依据任务知识和行为状态,构建基于任务分配Agent的任务规划器,生成人机交互的相互依赖关系;设计一种深度学习强化方法,解决群体行为最优策略和协同控制方法,并利用混合主动行为选择机制评估学习策略。实验结果表明:作为人机交互实例,所提方法通过深度强化学习使群体全局联合动作表现较好,学习速度和稳定性均能优于确定性策略梯度方法。同时,在跟随、自主和混合主动3种模式比较下,可以较好地控制无人机飞行路径和任务,为无人机集群任务执行提供了智能决策依据。 展开更多
关键词 多agent规划 深度强化学习 无人机协同规划 混合主动行为
下载PDF
多Agent环境下规划的验证方法 被引量:3
2
作者 李岳峰 刘大有 《计算机学报》 EI CSCD 北大核心 1996年第3期202-207,共6页
如何验证多agent规划是一个非常重要的研究课题,因为该研究关系到规划的求解能否在分布式环境下有效地进行.在本文中,我们讨论了规划的验证方法,给出了压缩集合的生成算法,并给出了该算法的正确性证明.与Katz等人所提出... 如何验证多agent规划是一个非常重要的研究课题,因为该研究关系到规划的求解能否在分布式环境下有效地进行.在本文中,我们讨论了规划的验证方法,给出了压缩集合的生成算法,并给出了该算法的正确性证明.与Katz等人所提出的算法不同,我们用正向邻接表和逆向邻接表来表示规划链关系D,用辅助数组来控制所用到的子图(即不是真正的生成子图,但由辅助数组即能看出当前所要处理的子图),提出了避免无用子图产生的方法.我们所给出的算法不论在空间复杂性方面还是在时间复杂性方面都优于Katz等人所提出的算法. 展开更多
关键词 多agent规划 规划 验证 人工智能
下载PDF
不确定规划中的多Agent带权值强规化算法
3
作者 伍小辉 文中华 +1 位作者 李洋 劳佳琪 《计算机工程》 CAS CSCD 北大核心 2015年第1期190-195,共6页
在智能规划领域中,以往对不确定规划问题的研究主要集中于单个Agent,而对多Agent规划的研究则侧重于确定规划。针对该问题,提出基于多Agent的带权值不确定规划问题,对所求解的强规划解,设计使其所需动作权值总和近似最小的算法。根据基... 在智能规划领域中,以往对不确定规划问题的研究主要集中于单个Agent,而对多Agent规划的研究则侧重于确定规划。针对该问题,提出基于多Agent的带权值不确定规划问题,对所求解的强规划解,设计使其所需动作权值总和近似最小的算法。根据基于模型检测的强规划分层方法,对每个Agent进行强规划分层,合并所有Agent的分层信息,并在合并的过程中得到同层状态之间的冲突表。在保证冲突最小的情况下,以最小动作权值优先的贪心方法,求出强规划解。实验结果表明,该算法能较快地求解出使所选择的动作权值总和近似最小的强规划解。 展开更多
关键词 多agent规划 不确定规划 规划 模型检测 动作权值 智能规划
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部