基于绿灯时间等饱和度的TD学习配时优化模型

The Optimization Model of TD Learning Timing Based on the Green Time Equi-saturation

下载PDF

导出

摘要首先对传统的绿灯时间等饱和度概念进行了扩展,提出了分级绿灯时间等饱和度.在此基础上,针对分级绿灯时间等饱和度目标,构造了奖赏函数,采用了模糊方法解决流量状态空间维数爆炸问题,建立了定周期和变周期两种模式下的四种离线TD学习配时优化模型.通过Matlab编程,开发了这四种模型的计算程序,相对于在线TD学习模型,离线TD学习模型更适合交叉口信号配时优化.以一个两相位控制的单交叉口配时优化作为算例,对比分析了四种模型的性能.总体上变周期模式的离线TD学习模型可以获得解的结构、最优解的分布,这是传统配时理论不具备的.定周期条件下,奖赏分级的效果不明显;变周期条件下,奖赏分级效果明显,交通性能更优. We propose the multi-level green time saturation.On this basis,for the classification of green time saturation target,the study constructs a reward function,uses the fuzzy method to solve the traffic state space dimension explosion problem,and establishes four optimization models of offline TD learning under fixed period and variable cycle two modes.Using a two-phase control of a single intersection as an example,the study comparatively analyzes the performance of four models.Generally speaking,offline TD learning model of variable cycle mode can obtain the structure of solutions and the optimal solutions distribution,which does not belong to the traditional timing theory.Under the fixed period condition,reward grading effect is not obvious,while under the variable cycle condi-tion,reward grading effect is obvious and the traffic has better performance.

作者邵维张吉光刘改红

机构地区贵阳职业技术学院轨道交通分院玉屏县公路管理所

出处《长沙大学学报》 2014年第5期70-74,共5页 Journal of Changsha University

关键词配时优化绿灯时间等饱和度 TD方法状态模糊变周期 timing optimization green time equi-saturation TD control state fuzzy variable cycle

分类号 U491 [交通运输工程—交通运输规划与管理]

引文网络
相关文献

参考文献7

1Stevanovic A. Adaptive Traffic Control Systems: Domestic and For- eign State of Practice [ M ]. Washington D C: Transportation Re- search Board, 2010.
2Sutton R S, Barto A G. Reinforcement Learning - An Introduction [ M]. Cambridge: The MIT Press, 1998.
3Kaelbling L P, Littman M L, Moore A W. Reinforcement learning: a survey[ J]. Journal of Artificial Intelligence Research, 1996, (2) : 237 - 285.
4马寿峰,李英,刘豹.一种基于Agent的单路口交通信号学习控制方法[J].系统工程学报,2002,17(6):526-530. 被引量：62
5刘越伟,张海波.基于SCOOT交通控制系统的信号灯倒计时研究及应用[J].交通标准化,2012,40(1):145-147. 被引量：4
6全永粜.城市交通控制[M].北京:人民交通出版社,1989.
7卢守峰,邵维,韦钦平,刘喜敏.基于绿灯时间等饱和度的离线Q学习配时优化模型[J].系统工程,2012,30(7):117-122. 被引量：3

二级参考文献26

1杨晓光,庄斌,李克平.信号交叉口饱和流率和启动延误的影响分析[J].同济大学学报（自然科学版）,2006,34(6):738-743. 被引量：22
2承向军,常歆识,杨肇夏.基于Q-学习的交通信号控制方法[J].系统工程理论与实践,2006,26(8):136-140. 被引量：14
3赵晓华,李振龙,陈阳舟,李云驰.基于混杂系统Q学习最优控制的信号灯控制方法[J].高技术通讯,2007,17(5):498-502. 被引量：5
4全永椠.城市交通控制[M].北京:人民交通出版社,1989.
5马凤伟,刘智勇.城市交通干线的Q-学习控制算法[J].五邑大学学报（自然科学版）,2007,21(3):16-22. 被引量：3
6Sutton R S. Introduction: The challenge of reinforcement learning[J]. Machine Learning, 1992, 8: 225-227
7LIN Long_Ji. Self_improving reactive agents based on reinforcement learning, planning and teaching[J]. Machine Learning, 1992, 8: 69-97
8Watkins C J C H. Technical notes:Q_learning[J]. Machine Learning, 1992, 8: 55-68
9He Guoguang,Noeth G. Urban traffic control system-A general analysis from the point of view of control theory[A]. Transportation Systems: Theory and Application of Advanced Technology[C]. Oxford:PERGAMON Press,1997. 518-521
10Oliveira, et al. Reinforcement learning based control of traffic lights in non-stationary environments: A case study in a microscopic simulator [C] // Proceedings of the 4th European Workshop on Multi- Agent Systems (EUMAS06). Lisbon, Portugal, December 2006 :31-42.

共引文献65

1张会,张春.基于层次分析法的运营车辆驾驶疲劳影响因素分析[J].中国科技论文在线精品论文,2020(2):227-233.
2承向军,杨肇夏.一种交通信号自学习控制方法及仿真实现[J].系统仿真学报,2004,16(7):1519-1524. 被引量：5
3曹富禄,苏诗琳,蔡占华,蔺广逢.基于多Agent技术的城市交通信号控制系统的研究[J].现代电子技术,2004,27(15):11-12. 被引量：1
4许伦辉,刘细平.基于两级模糊控制城市交叉口的设计与仿真[J].交通与计算机,2004,22(6):57-60. 被引量：7
5承向军,杜鹏,贺振欢,杨肇夏.单路口交通信号智能控制方法[J].系统工程学报,2005,20(1):23-29. 被引量：6
6承向军,杨肇夏.一种分布式交通信号控制方法及仿真实现[J].系统仿真学报,2005,17(8):1970-1973. 被引量：8
7承向军,杜鹏,杨肇夏.基于多智能体的分布式交通信号协调控制方法[J].系统工程理论与实践,2005,25(8):130-135. 被引量：15
8许伦辉,杨荣,刘细平.基于两级模糊控制的交叉口多相位控制[J].中南公路工程,2005,30(4):104-107. 被引量：1
9郭建钢,伍雄斌.多智能体技术在交通系统协调控制中的应用[J].华东交通大学学报,2005,22(6):38-41. 被引量：13
10陆小芳,郑应平,王令群.交通信号控制系统的多agent协调研究[J].计算机工程与应用,2006,42(2):188-190. 被引量：2

1卢守峰,邵维,韦钦平,刘喜敏.基于绿灯时间等饱和度的离线Q学习配时优化模型[J].系统工程,2012,30(7):117-122. 被引量：3
2蒲琪,谭永朝,杨超.交叉口信号配时优化模型研究[J].上海铁道大学学报,1999,20(4):31-34. 被引量：48
3常争艳,郭富平,贾志绚.交叉口信号配时优化方法的改进设计[J].山西交通科技,2005(1):70-72. 被引量：3
4王大海,张晓峰,张廷山,桑兆辉,王立锦.自协调变周期的交通信号集散控制系统——论第三代城市交通信号控制系统[J].河北省科学院学报,1997,14(3):8-13. 被引量：4
5林董希.论智能交通的在我国的发展及应用[J].湖南农机（学术版）,2012,39(6):168-168. 被引量：1
6杨锡武,陈国祯.一种评价柔性路面状况的模糊方法[J].重庆交通学院学报,1994,13(2):35-39. 被引量：3
7李春阳.相控电力机车整流装置桥段数的选择[J].机车电传动,1991(2):22-26.
8赵忠杰,刘小强,谢光秋.单交通路口变相位变周期信号控制[J].长安大学学报（自然科学版）,2005,25(6):70-72. 被引量：30
9刘宝鑫,王学桐,邢占龙,龚佃选.交叉口信号配时优化模型[J].科教导刊（电子版）,2016,0(15):173-173.
10魏丽,孙俊,商蕾.微观交通仿真模型建模及应用[J].武汉理工大学学报（交通科学与工程版）,2010,34(4):793-796. 被引量：5

长沙大学学报

2014年第5期

浏览历史

内容加载中请稍等...

基于绿灯时间等饱和度的TD学习配时优化模型

参考文献7

二级参考文献26

共引文献65

相关作者

相关机构

相关主题

浏览历史