-
题名基于强化学习的公交站场服务中断防治策略
- 1
-
-
作者
伦嘉铭
姜海明
谢康
-
机构
广东工业大学机电工程学院
-
出处
《计算机仿真》
2024年第4期129-135,425,共8页
-
基金
国家自然科学基金项目(11874126)、广东省“领军人才”项目(400180001)。
-
文摘
为缓解公交站场的服务中断问题,提出一种基于强化学习的动态发车控制策略。策略利用长短期记忆(LSTM)模型对公交行程时间进行预测,使智能体感知站场车辆与运行车辆的车头时距状态,以更好地评估决策的长期影响。针对站场无车可发的场景,在计算动作概率分布时应用状态相关可微函数将无效动作遮蔽,避免智能体下发无效指令。通过奖励函数对大发车间隔进行惩罚,并使用近端策略优化(PPO)对模型进行训练。仿真结果表明,与传统方法相比,所提方法不仅能有效避免公交站场服务中断,而且使车辆载客率更均衡,乘客等待时间更少,车辆利用效率更高。
-
关键词
公交服务中断
实时控制
强化学习
近端策略优化
无效动作遮蔽
-
Keywords
Bus service disruption
Real-Time control
Reinforcement learning
Proximal policy optimization
Invalid action masking
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-