优化城市道路中的交通信号灯控制是低成本地提升城市交通路网性能的方法之一。该研究提出了一种利用策略梯度(Policy Gradient, PG)强化调优的交通灯控制算法。该算法引入了道路压力项、旅程时间项和黑名单机制项,利用统计方式预测汽车...优化城市道路中的交通信号灯控制是低成本地提升城市交通路网性能的方法之一。该研究提出了一种利用策略梯度(Policy Gradient, PG)强化调优的交通灯控制算法。该算法引入了道路压力项、旅程时间项和黑名单机制项,利用统计方式预测汽车行程轨迹,并采用策略梯度估计的优化算法调整算法中的参数。在数据挖掘国际会议Knowledge Discovery and Data Mining (KDD)组织的算法竞赛KDD Cup 2021城市大脑挑战赛中,获得了冠军的成绩。在该挑战赛提供的城市路网规模复杂车流仿真平台上的实验结果表明,算法具有应用于实际场景的价值。展开更多
文摘优化城市道路中的交通信号灯控制是低成本地提升城市交通路网性能的方法之一。该研究提出了一种利用策略梯度(Policy Gradient, PG)强化调优的交通灯控制算法。该算法引入了道路压力项、旅程时间项和黑名单机制项,利用统计方式预测汽车行程轨迹,并采用策略梯度估计的优化算法调整算法中的参数。在数据挖掘国际会议Knowledge Discovery and Data Mining (KDD)组织的算法竞赛KDD Cup 2021城市大脑挑战赛中,获得了冠军的成绩。在该挑战赛提供的城市路网规模复杂车流仿真平台上的实验结果表明,算法具有应用于实际场景的价值。