期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
DP-Q(λ):大规模Web3D场景中Multi-agent实时路径规划算法 被引量:4
1
作者 闫丰亭 贾金原 《系统仿真学报》 CAS CSCD 北大核心 2019年第1期16-26,共11页
大规模场景中Multi-agent可视化路径规划算法,需要在Web3D上实现实时、稳定的碰撞避让。提出了动态概率单链收敛回溯DP-Q(λ)算法,采用方向启发约束,使用高奖赏或重惩罚训练方法,在单智能体上采用概率p(0-1随机数)调节奖罚值,决定下一... 大规模场景中Multi-agent可视化路径规划算法,需要在Web3D上实现实时、稳定的碰撞避让。提出了动态概率单链收敛回溯DP-Q(λ)算法,采用方向启发约束,使用高奖赏或重惩罚训练方法,在单智能体上采用概率p(0-1随机数)调节奖罚值,决定下一步的寻路策略,同时感知下一位置是否空闲,完成行走过程的避碰行为,将单智能体的路径规划方案扩展到多智能体路径规划方案中,并进一步在Web3D上实现了这一方案。实验结果表明:该算法实现的多智能体实时路径规划具备了在Web3D上自主学习的高效性和稳定性的要求。 展开更多
关键词 WEB3D 大规模未知环境 多智能体 强化学习 动态奖赏p 路径规划
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部