期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于强化学习的公交站场服务中断防治策略
1
作者 伦嘉铭 姜海明 谢康 《计算机仿真》 2024年第4期129-135,425,共8页
为缓解公交站场的服务中断问题,提出一种基于强化学习的动态发车控制策略。策略利用长短期记忆(LSTM)模型对公交行程时间进行预测,使智能体感知站场车辆与运行车辆的车头时距状态,以更好地评估决策的长期影响。针对站场无车可发的场景,... 为缓解公交站场的服务中断问题,提出一种基于强化学习的动态发车控制策略。策略利用长短期记忆(LSTM)模型对公交行程时间进行预测,使智能体感知站场车辆与运行车辆的车头时距状态,以更好地评估决策的长期影响。针对站场无车可发的场景,在计算动作概率分布时应用状态相关可微函数将无效动作遮蔽,避免智能体下发无效指令。通过奖励函数对大发车间隔进行惩罚,并使用近端策略优化(PPO)对模型进行训练。仿真结果表明,与传统方法相比,所提方法不仅能有效避免公交站场服务中断,而且使车辆载客率更均衡,乘客等待时间更少,车辆利用效率更高。 展开更多
关键词 公交服务中断 实时控制 强化学习 近端策略优化 无效动作遮蔽
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部