-
题名基于风险避免强化学习的单交叉口配时优化
- 1
-
-
作者
毛盈方
卢守峰
-
机构
长沙理工大学交通运输工程学院
-
出处
《交通科学与工程》
2014年第1期80-85,共6页
-
基金
国家自然科学基金项目(71071024)
湖南省自然科学基金项目(12JJ2025)
长沙市科技局重点项目(K1106004-11)
-
文摘
现有的信号配时强化学习模型大多是风险中立的强化学习模型,其缺点是在线学习中稳定性和鲁棒性较差,需要的运行时间较长,且收敛效果不明显。为了解决存在的这些问题,建立了风险避免强化学习交通信号配时模型,用排队长度差作为模型的交通评价指标。在集成VISSIM-Excel VBAMatlab的仿真平台上进行了仿真实验,分析了风险程度系数对配时方案优劣程度、收敛性的影响;与风险中立的强化学习模型进行对比分析,得出了新模型,它在稳定性方面有较大的改进,收敛速度较快,在交通评价指标上运行效果好。针对交通信号配时优化这类问题,应采用增量风险避免强化学习方法,即风险程度系数应采用小步距递增的方式。
-
关键词
增量风险避免
强化学习
信号配时
仿真
-
Keywords
incremental risk avoidance
reinforcement learning
signal timing
simulation
-
分类号
U491.54
[交通运输工程—交通运输规划与管理]
-