-
题名基于行为的多差速机器人强化学习任务监管器设计
- 1
-
-
作者
张祯毅
黄捷
-
机构
福州大学电气工程与自动化学院
福州大学
-
出处
《机器人》
EI
CSCD
北大核心
2024年第4期397-413,424,共18页
-
基金
国家自然科学基金(92367109)。
-
文摘
针对多差速机器人系统提出了一种基于试错学习的多智能体强化学习任务监管器。此方法解决了基于行为的多智能体系统总是依赖人的智能设计切换规则以决策行为优先级的问题。首先,在零空间行为控制框架下引入了差速模型代替质点模型,首次推导了具有非完整约束的零空间行为控制范式,从而提升了系统对最小极值状态的鲁棒性。然后,首次将行为优先级切换问题建模为协作式马尔可夫博弈问题,学习了一个最优的联合策略以动态且智能地决策行为优先级,不仅避免了人工设计切换规则,而且降低了在线计算和存储负担。仿真结果显示,所提出多智能体强化学习任务监管器具有优越的行为优先级切换性能。在AgileX Limo系列多差速机器人系统上的成功应用,验证了该任务监管器的实用性。
-
关键词
差速机器人
行为控制
强化学习
任务监管器
智能决策
-
Keywords
differential drive robot
behavioral control
reinforcement learning
mission supervisor
intelligent decision
-
分类号
TP242
[自动化与计算机技术—检测技术与自动化装置]
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名面向智慧工厂的多仓储机器人路径规划仿真教学研究
- 2
-
-
作者
黄捷
詹维捷
潘聪捷
刘尚坤
-
机构
福州大学电气工程与自动化学院
福州大学
-
出处
《实验技术与管理》
CAS
北大核心
2024年第11期100-108,共9页
-
基金
国家自然科学基金“未来工业互联网基础理论与关键技术”重大研究计划项目(92367109)
福建省本科高校研究生教育教学研究项目(FBJY20230052)。
-
文摘
面向智慧工厂中的多载位仓储机器人路径规划仿真教学,该文以多仓储机器人多目标配送与多任务冲突的案例作为典型教学内容,提出基于多智能体强化学习任务监管器的多载位仓储机器人路径规划仿真教学模式,设计多载位仓储机器人配送路径最优的仿真教学总体方案,实现多仓储机器人在路径规划过程中的多任务冲突消解,仿真教学案例有效减少了多载位仓储机器人的运输路径长度和避障时间。此设计适用于智慧工厂下智能物流机器人路径规划算法的课程教学,为创新型人才的培养和虚拟仿真实验室的建设提供了参考。
-
关键词
多载位仓储机器人
多智能体强化学习
任务监管器
仿真教学
路径规划
-
Keywords
multi-loading warehouse robot
multi-agent reinforcement learning
task supervisor
simulation teaching
path planning
-
分类号
TP202.7
[自动化与计算机技术—检测技术与自动化装置]
-