期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于行为的多差速机器人强化学习任务监管器设计
1
作者 张祯毅 黄捷 《机器人》 EI CSCD 北大核心 2024年第4期397-413,424,共18页
针对多差速机器人系统提出了一种基于试错学习的多智能体强化学习任务监管器。此方法解决了基于行为的多智能体系统总是依赖人的智能设计切换规则以决策行为优先级的问题。首先,在零空间行为控制框架下引入了差速模型代替质点模型,首次... 针对多差速机器人系统提出了一种基于试错学习的多智能体强化学习任务监管器。此方法解决了基于行为的多智能体系统总是依赖人的智能设计切换规则以决策行为优先级的问题。首先,在零空间行为控制框架下引入了差速模型代替质点模型,首次推导了具有非完整约束的零空间行为控制范式,从而提升了系统对最小极值状态的鲁棒性。然后,首次将行为优先级切换问题建模为协作式马尔可夫博弈问题,学习了一个最优的联合策略以动态且智能地决策行为优先级,不仅避免了人工设计切换规则,而且降低了在线计算和存储负担。仿真结果显示,所提出多智能体强化学习任务监管器具有优越的行为优先级切换性能。在AgileX Limo系列多差速机器人系统上的成功应用,验证了该任务监管器的实用性。 展开更多
关键词 差速机器人 行为控制 强化学习 任务监管器 智能决策
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部