为了优化区域交通信号配时方案,提升区域通行效率,文章提出一种基于改进多智能体Nash Q Learning的区域交通信号协调控制方法。首先,采用离散化编码方法,通过划分单元格将连续状态信息转化为离散形式。其次,在算法中融入长短时记忆网络(...为了优化区域交通信号配时方案,提升区域通行效率,文章提出一种基于改进多智能体Nash Q Learning的区域交通信号协调控制方法。首先,采用离散化编码方法,通过划分单元格将连续状态信息转化为离散形式。其次,在算法中融入长短时记忆网络(Long Short Term Memory,LSTM)模块,用于从状态数据中挖掘更多的隐藏信息,丰富Q值表中的状态数据。最后,基于微观交通仿真软件SUMO(Simulation of Urban Mobility)的仿真测试结果表明,相较于原始Nash Q Learning交通信号控制方法,所提方法在低、中、高流量下车辆的平均等待时间分别减少了11.5%、16.2%和10.0%,平均排队长度分别减少了9.1%、8.2%和7.6%,平均停车次数分别减少了18.3%、16.1%和10.0%。结果证明了该算法具有更好的控制效果。展开更多
对五叉环形交叉口的信号控制方法进行了研究,给出了基于环道容量约束的信号控制参数优化的模型,模型着重考虑了两个因素:环道容量约束,进口道灯、环道灯相互之间的绿信号协调、红信号协调。利用本文提出的控制模型设计了一个实例的信号...对五叉环形交叉口的信号控制方法进行了研究,给出了基于环道容量约束的信号控制参数优化的模型,模型着重考虑了两个因素:环道容量约束,进口道灯、环道灯相互之间的绿信号协调、红信号协调。利用本文提出的控制模型设计了一个实例的信号控制方案,并通过V ISS IM仿真评价了该信号控制方案,验证了本文提出的控制方法的有效性。展开更多
文摘为了优化区域交通信号配时方案,提升区域通行效率,文章提出一种基于改进多智能体Nash Q Learning的区域交通信号协调控制方法。首先,采用离散化编码方法,通过划分单元格将连续状态信息转化为离散形式。其次,在算法中融入长短时记忆网络(Long Short Term Memory,LSTM)模块,用于从状态数据中挖掘更多的隐藏信息,丰富Q值表中的状态数据。最后,基于微观交通仿真软件SUMO(Simulation of Urban Mobility)的仿真测试结果表明,相较于原始Nash Q Learning交通信号控制方法,所提方法在低、中、高流量下车辆的平均等待时间分别减少了11.5%、16.2%和10.0%,平均排队长度分别减少了9.1%、8.2%和7.6%,平均停车次数分别减少了18.3%、16.1%和10.0%。结果证明了该算法具有更好的控制效果。
文摘对五叉环形交叉口的信号控制方法进行了研究,给出了基于环道容量约束的信号控制参数优化的模型,模型着重考虑了两个因素:环道容量约束,进口道灯、环道灯相互之间的绿信号协调、红信号协调。利用本文提出的控制模型设计了一个实例的信号控制方案,并通过V ISS IM仿真评价了该信号控制方案,验证了本文提出的控制方法的有效性。