期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种全局供需感知的均值场多智能体强化学习订单分配算法
被引量:
1
1
作者
宋旺
胡祥
+3 位作者
张玉辉
卫文江
周雅诗
康傲
《数据采集与处理》
CSCD
北大核心
2023年第3期652-664,共13页
提出一种具备全局供需动态感知能力、基于均值场多智能体强化学习的网约车平台订单分配算法。该算法通过将多智能体强化学习与均值场理论相结合,提升了智能体在局部空间上相互之间的协作性;通过注入全局空间上供需的动态分布信息,提升...
提出一种具备全局供需动态感知能力、基于均值场多智能体强化学习的网约车平台订单分配算法。该算法通过将多智能体强化学习与均值场理论相结合,提升了智能体在局部空间上相互之间的协作性;通过注入全局空间上供需的动态分布信息,提升了智能体对全局供需分布的感知和优化能力。本文构建了真实历史数据驱动的模拟器,用于算法的训练和评估。实验表明,在全天时段和高峰期时段两个不同场景下,本文提出的算法在网约车司机累计收益及订单应答率两个重要指标上均显著优于现有的订单分配算法。实验结果充分验证了本文提出算法的有效性。
展开更多
关键词
多智能体强化学习
均值场
全局供需动态感知
网约车平台
订单分配
下载PDF
职称材料
题名
一种全局供需感知的均值场多智能体强化学习订单分配算法
被引量:
1
1
作者
宋旺
胡祥
张玉辉
卫文江
周雅诗
康傲
机构
华北电力大学控制与计算机工程学院
出处
《数据采集与处理》
CSCD
北大核心
2023年第3期652-664,共13页
基金
国家自然科学基金(52078212)。
文摘
提出一种具备全局供需动态感知能力、基于均值场多智能体强化学习的网约车平台订单分配算法。该算法通过将多智能体强化学习与均值场理论相结合,提升了智能体在局部空间上相互之间的协作性;通过注入全局空间上供需的动态分布信息,提升了智能体对全局供需分布的感知和优化能力。本文构建了真实历史数据驱动的模拟器,用于算法的训练和评估。实验表明,在全天时段和高峰期时段两个不同场景下,本文提出的算法在网约车司机累计收益及订单应答率两个重要指标上均显著优于现有的订单分配算法。实验结果充分验证了本文提出算法的有效性。
关键词
多智能体强化学习
均值场
全局供需动态感知
网约车平台
订单分配
Keywords
multi-agent reinforcement learning
mean-field
global perceive supply-demand dynamics
online ride-hailing platform
order dispatch
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种全局供需感知的均值场多智能体强化学习订单分配算法
宋旺
胡祥
张玉辉
卫文江
周雅诗
康傲
《数据采集与处理》
CSCD
北大核心
2023
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部