-
题名基于绿灯时间等饱和度的TD学习配时优化模型
- 1
-
-
作者
邵维
张吉光
刘改红
-
机构
贵阳职业技术学院轨道交通分院
玉屏县公路管理所
-
出处
《长沙大学学报》
2014年第5期70-74,共5页
-
文摘
首先对传统的绿灯时间等饱和度概念进行了扩展,提出了分级绿灯时间等饱和度.在此基础上,针对分级绿灯时间等饱和度目标,构造了奖赏函数,采用了模糊方法解决流量状态空间维数爆炸问题,建立了定周期和变周期两种模式下的四种离线TD学习配时优化模型.通过Matlab编程,开发了这四种模型的计算程序,相对于在线TD学习模型,离线TD学习模型更适合交叉口信号配时优化.以一个两相位控制的单交叉口配时优化作为算例,对比分析了四种模型的性能.总体上变周期模式的离线TD学习模型可以获得解的结构、最优解的分布,这是传统配时理论不具备的.定周期条件下,奖赏分级的效果不明显;变周期条件下,奖赏分级效果明显,交通性能更优.
-
关键词
配时优化
绿灯时间等饱和度
TD方法
状态模糊
变周期
-
Keywords
timing optimization
green time equi-saturation
TD control
state fuzzy
variable cycle
-
分类号
U491
[交通运输工程—交通运输规划与管理]
-
-
题名基于绿灯时间等饱和度的离线Q学习配时优化模型
被引量:3
- 2
-
-
作者
卢守峰
邵维
韦钦平
刘喜敏
-
机构
长沙理工大学交通运输工程学院
-
出处
《系统工程》
CSSCI
CSCD
北大核心
2012年第7期117-122,共6页
-
基金
国家自然科学基金资助项目(71071024
70701006)
+5 种基金
教育部科研重点项目(145)
湖南省教育厅科研项目(09A003
11C0038)
长沙市科技局重点项目(K1106004-11
K1001010-11)
道路结构与材料交通部重点实验室开放基金资助项目(kfj100206)
-
文摘
首先对传统的绿灯时间等饱和度概念进行了扩展,提出了分级绿灯时间等饱和度。在此基础上,针对分级绿灯时间等饱和度目标,构造了奖赏函数,建立了定周期和变周期两种模式下的四种离线Q学习配时优化模型。相对于在线Q学习模型,离线Q学习模型更适合交叉口信号配时优化,变周期模式的离线Q学习模型可以获得解的结构、最优解的分布,这是传统配时理论不具备的。算例结果表明,定周期模式下最优解是唯一的。变周期模式下最优解是不唯一的,呈带状,奖赏分级模型比奖赏不分级的最优解更加集中。
-
关键词
交通控制
配时优化
Q学习
离线
绿灯时间等饱和度
-
Keywords
Traffic Control
Timing Optimization
Q Learning
Off-line
Green Time Equi-saturation
-
分类号
U121
[交通运输工程]
-