期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于风险避免强化学习的单交叉口配时优化
1
作者 毛盈方 卢守峰 《交通科学与工程》 2014年第1期80-85,共6页
现有的信号配时强化学习模型大多是风险中立的强化学习模型,其缺点是在线学习中稳定性和鲁棒性较差,需要的运行时间较长,且收敛效果不明显。为了解决存在的这些问题,建立了风险避免强化学习交通信号配时模型,用排队长度差作为模型的交... 现有的信号配时强化学习模型大多是风险中立的强化学习模型,其缺点是在线学习中稳定性和鲁棒性较差,需要的运行时间较长,且收敛效果不明显。为了解决存在的这些问题,建立了风险避免强化学习交通信号配时模型,用排队长度差作为模型的交通评价指标。在集成VISSIM-Excel VBAMatlab的仿真平台上进行了仿真实验,分析了风险程度系数对配时方案优劣程度、收敛性的影响;与风险中立的强化学习模型进行对比分析,得出了新模型,它在稳定性方面有较大的改进,收敛速度较快,在交通评价指标上运行效果好。针对交通信号配时优化这类问题,应采用增量风险避免强化学习方法,即风险程度系数应采用小步距递增的方式。 展开更多
关键词 增量风险避免 强化学习 信号配时 仿真
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部