汽车行业智能化和网联化的发展使车辆轨迹能够实现精细化控制,为改进城市交叉口交通信号控制方法提供了新思路。本文提出一种基于非冲突合流策略的灵活信号控制方法,将同时容纳直行和左转来车的合流相位定义为非冲突相位,在双环相位结...汽车行业智能化和网联化的发展使车辆轨迹能够实现精细化控制,为改进城市交叉口交通信号控制方法提供了新思路。本文提出一种基于非冲突合流策略的灵活信号控制方法,将同时容纳直行和左转来车的合流相位定义为非冲突相位,在双环相位结构基础上融入合流策略,形成一种具备12个动作空间的双环合流信号相位结构。在优化相位结构基础上,进一步提出改进的强化学习算法求解信号配时,以车辆到达情况为输入,当前状态下车辆等待时间最小为目标,充分考虑双环结构下相位切换的实际规律,学习当前状态下的最优相位控制策略。在SUMO(Simulation of Urban Mobility)仿真中根据算例需求生成场景数据,对比传统双环结构和双环合流相位结构在感应控制和改进强化学习算法下的不同控制策略的性能指标,分析网联车渗透率对控制效果的影响。结果显示:基于非冲突合流策略和改进强化学习算法能够在提升相位切换灵活性的基础上生成更加符合现实规律的相位配时方案;在不同交通流量条件,尤其是高流量和交通量分布不均衡的场景下,相较于双环相位结构和感应控制方法降低约37%的车均延误,提升了信号控制方案实际运行效果。展开更多
文摘汽车行业智能化和网联化的发展使车辆轨迹能够实现精细化控制,为改进城市交叉口交通信号控制方法提供了新思路。本文提出一种基于非冲突合流策略的灵活信号控制方法,将同时容纳直行和左转来车的合流相位定义为非冲突相位,在双环相位结构基础上融入合流策略,形成一种具备12个动作空间的双环合流信号相位结构。在优化相位结构基础上,进一步提出改进的强化学习算法求解信号配时,以车辆到达情况为输入,当前状态下车辆等待时间最小为目标,充分考虑双环结构下相位切换的实际规律,学习当前状态下的最优相位控制策略。在SUMO(Simulation of Urban Mobility)仿真中根据算例需求生成场景数据,对比传统双环结构和双环合流相位结构在感应控制和改进强化学习算法下的不同控制策略的性能指标,分析网联车渗透率对控制效果的影响。结果显示:基于非冲突合流策略和改进强化学习算法能够在提升相位切换灵活性的基础上生成更加符合现实规律的相位配时方案;在不同交通流量条件,尤其是高流量和交通量分布不均衡的场景下,相较于双环相位结构和感应控制方法降低约37%的车均延误,提升了信号控制方案实际运行效果。