城市快速路的交通运行效率对于整个城市的顺畅通行至关重要,在早晚高峰期间,受限于相连接辅路的交通承载能力,快速路上较大的交通流量无法顺利从出口匝道驶入目标路段,在匝道上形成排队现象,严重时会导致匝道回溢,使快速路上车道由于被...城市快速路的交通运行效率对于整个城市的顺畅通行至关重要,在早晚高峰期间,受限于相连接辅路的交通承载能力,快速路上较大的交通流量无法顺利从出口匝道驶入目标路段,在匝道上形成排队现象,严重时会导致匝道回溢,使快速路上车道由于被占用而产生交通瓶颈,造成较大的交通出行损失.利用深度强化学习算法进行出口匝道相关联的道路交叉口信号控制优化,将信号灯设为智能体,通过设置检测器,将快速路出口匝道及交叉口的交通运行情况作为智能体获取的状态信息,引入以辅路与出口匝道剩余通行能力之比为动态修正参数的奖励函数,在保证匝道交通运行效率下,完成交叉口信号优化过程.以中国北京市东三环快速路及某关联交叉口为例,借助交通仿真平台SUMO(simulation of urban mobility)及Traci库搭建仿真环境进行实验.结果表明,基于改进A2C(advantage actor critic)算法的信号控制方法在控制效果上优于传统信号控制以及基于深度Q网络(deep Q-network,DQN)算法的信号控制方法,在出行高峰期间能够有效降低匝道回溢的发生概率,有效改善辅道相联交叉口的通行效率.展开更多
文摘城市快速路的交通运行效率对于整个城市的顺畅通行至关重要,在早晚高峰期间,受限于相连接辅路的交通承载能力,快速路上较大的交通流量无法顺利从出口匝道驶入目标路段,在匝道上形成排队现象,严重时会导致匝道回溢,使快速路上车道由于被占用而产生交通瓶颈,造成较大的交通出行损失.利用深度强化学习算法进行出口匝道相关联的道路交叉口信号控制优化,将信号灯设为智能体,通过设置检测器,将快速路出口匝道及交叉口的交通运行情况作为智能体获取的状态信息,引入以辅路与出口匝道剩余通行能力之比为动态修正参数的奖励函数,在保证匝道交通运行效率下,完成交叉口信号优化过程.以中国北京市东三环快速路及某关联交叉口为例,借助交通仿真平台SUMO(simulation of urban mobility)及Traci库搭建仿真环境进行实验.结果表明,基于改进A2C(advantage actor critic)算法的信号控制方法在控制效果上优于传统信号控制以及基于深度Q网络(deep Q-network,DQN)算法的信号控制方法,在出行高峰期间能够有效降低匝道回溢的发生概率,有效改善辅道相联交叉口的通行效率.