期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于递阶强化学习的多智能体AGV调度系统
被引量:
8
1
作者
李晓萌
杨煜普
许晓鸣
《控制与决策》
EI
CSCD
北大核心
2002年第3期292-296,共5页
递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。具有离散动态特性的AGV调度系统需要实时动态的调度方法 ,而具有 Max Q递阶强化学习能力的多智能体通过高效的强化学习方法和协作 ,可以实现 AGV的实时调度。
关键词
递阶强化学习
多智能体
AGV调度系统
机器
学习
下载PDF
职称材料
题名
基于递阶强化学习的多智能体AGV调度系统
被引量:
8
1
作者
李晓萌
杨煜普
许晓鸣
机构
上海交通大学自动化研究所
出处
《控制与决策》
EI
CSCD
北大核心
2002年第3期292-296,共5页
文摘
递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。具有离散动态特性的AGV调度系统需要实时动态的调度方法 ,而具有 Max Q递阶强化学习能力的多智能体通过高效的强化学习方法和协作 ,可以实现 AGV的实时调度。
关键词
递阶强化学习
多智能体
AGV调度系统
机器
学习
Keywords
hierarchical reinforcement learning
Max Q method
cooperative multiagent
AGV dispatching
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于递阶强化学习的多智能体AGV调度系统
李晓萌
杨煜普
许晓鸣
《控制与决策》
EI
CSCD
北大核心
2002
8
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部