多智能体深度强化学习机制的巡游出租车调度策略优化

Dispatching Policy Optimizing of Cruise Taxi in a Multiagent‑Based Deep Reinforcement Learning Framework

导出

摘要交通领域的传统线性规划方法仅在静态网络中求解有限规模的资源调度问题。笔者面向城市巡游出租车长周期运营过程优化目标,使用融合了监督学习神经网络机制和奖励的深度强化学习技术替代线性规划,将动态交通网络中表征乘客和驾驶员出行行为下的时空变化特征、状态属性特征和交互关系特征等领域知识转换映射为包含状态、行为、转移概率和奖励函数等元组的马尔可夫过程.

作者马祥元 MA Xiangyuan(Changjiang Spatial Information Technology Engineering Co.Ltd(Wuhan),Wuhan 430010,China)

机构地区长江空间信息技术工程有限公司(武汉)

出处《武汉大学学报（信息科学版）》 EI CAS CSCD 北大核心 2023年第12期2108-2108,共1页 Geomatics and Information Science of Wuhan University

关键词深度强化学习马尔可夫过程属性特征动态交通网络线性规划方法转移概率多智能体出行行为

分类号 P208 [天文地球—地图制图学与地理信息工程]

引文网络
相关文献

1许文文.开放与闭合:重大突发公共卫生事件中社会组织应急合作网络双模式——一项双案例比较分析[J].学习与实践,2023(3):98-108.
2曲越.贝叶斯网络理论和线性规划方法在商业银行新兴业务内部审计统筹管理中的应用研究[J].中国内部审计,2023(11):8-22.
3石学鹏.云计算环境下的虚拟机迁移算法优化与资源调度研究[J].电子元器件与信息技术,2023,7(8):105-109. 被引量：2
4孔德学,敖谷昌,徐威威,张惠玲.考虑高速公路差异化收费的货车出行行为研究[J].交通运输研究,2023,9(4):84-92.
5李奇儒,耿霞.基于改进DQN算法的机器人路径规划[J].计算机工程,2023,49(12):111-120. 被引量：3
6王小飞,任洪波,吴琼,李琦芬.考虑中长期碳减排约束的区域综合能源系统多阶段动态规划[J].中国电力,2023,56(11):185-196. 被引量：3
7郝耕,郝家麟,镇龙桂.农业农村现代化背景下土地适度规模经营问题研究[J].西安财经大学学报,2023,36(4):116-128. 被引量：5
8潘晓红,黄林青,彭友林.碳普惠政策对居民绿色出行行为影响因素实证分析——以重庆市为例[J].可持续发展,2023,13(6):1923-1935.
9冯帅,林光彬.中国共同富裕水平测度与动态演变特征研究[J].改革与战略,2023,39(5):63-77. 被引量：2
10信息窗[J].中国审计,2023(22):78-83.

武汉大学学报（信息科学版）

2023年第12期

浏览历史

内容加载中请稍等...

多智能体深度强化学习机制的巡游出租车调度策略优化

相关作者

相关机构

相关主题

浏览历史