现有交通信号灯控制策略大多针对单一交叉口展开分析,该策略仅考虑车流量的单一因素,难以适应动态的路网状态。对此,提出了一种结合模糊控制的深度强化学习交通灯控制策略,利用SAC(soft actor critic)深度强化学习对两交叉口的交通信号...现有交通信号灯控制策略大多针对单一交叉口展开分析,该策略仅考虑车流量的单一因素,难以适应动态的路网状态。对此,提出了一种结合模糊控制的深度强化学习交通灯控制策略,利用SAC(soft actor critic)深度强化学习对两交叉口的交通信号灯相位选择及配时进行联合优化,同时考虑车辆速度、路段车辆排队长度等因素,利用模糊控制对SAC的惩罚函数进行处理。实验结果表明,与固定循环周期策略、SAC控制策略和DDPG(deep deterministic policy gradient)控制策略相比,提出的交通信号灯控制策略能获得更快的车辆通行速度,车辆的油耗和尾气排放情况也得到了改善。展开更多