期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种全局供需感知的均值场多智能体强化学习订单分配算法 被引量:1
1
作者 宋旺 胡祥 +3 位作者 张玉辉 卫文江 周雅诗 康傲 《数据采集与处理》 CSCD 北大核心 2023年第3期652-664,共13页
提出一种具备全局供需动态感知能力、基于均值场多智能体强化学习的网约车平台订单分配算法。该算法通过将多智能体强化学习与均值场理论相结合,提升了智能体在局部空间上相互之间的协作性;通过注入全局空间上供需的动态分布信息,提升... 提出一种具备全局供需动态感知能力、基于均值场多智能体强化学习的网约车平台订单分配算法。该算法通过将多智能体强化学习与均值场理论相结合,提升了智能体在局部空间上相互之间的协作性;通过注入全局空间上供需的动态分布信息,提升了智能体对全局供需分布的感知和优化能力。本文构建了真实历史数据驱动的模拟器,用于算法的训练和评估。实验表明,在全天时段和高峰期时段两个不同场景下,本文提出的算法在网约车司机累计收益及订单应答率两个重要指标上均显著优于现有的订单分配算法。实验结果充分验证了本文提出算法的有效性。 展开更多
关键词 多智能体强化学习 均值场 全局供需动态感知 网约车平台 订单分配
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部