基于强化学习的汇流瓶颈区可变限速策略研究被引量：14

Variable Speed Limit Control at Freeway Merge Bottlenecks Based on Reinforcement Learning

下载PDF

导出

摘要为提高高速公路汇流瓶颈区的通行效率,本文结合强化学习无需建立模型,具有智能学习的特点,对瓶颈区的可变限速策略进行了优化,首次提出了基于Q学习算法的可变限速控制策略.策略以最大化系统总流出车辆数为目标,通过遍历交通流状态集合,尝试不同限速值序列进行自适应学习.以真实路段交通流数据搭建了元胞传输模型仿真平台,通过将其与无控制和基于反馈控制的可变限速策略进行对比,对Q学习策略的控制效果进行评价.通行时间的降低和交通参数的变化表明,强化学习控制策略在提高汇流瓶颈区通行效率和改善交通流运行状况方面具有优越性. To improve the efficiency of freeway merge bottleneck, this paper optimizes the bottleneck variable speed limit strategy. Considering the characteristics of reinforcement learning that it is modelingfree and intelligent learning, a QL-VSL control strategy that integrates the Q-learning（QL） algorithm in the VSL control is proposed for the first time. The goal of the strategy is to maximize the outflow vehicle, it is adaptive learning through traversing traffic flow states and taking different speed limits. The cell transmission model（CTM） calibrated with the real traffic data is used for the simulation. The effectiveness of the proposed QL-VSL control strategy is evaluated with no VSL control and the feedback VSL control in the simulation. The travel time reduction and traffic parameter changes show that the proposed QL-VSL control strategy outperforms in improving the traffic efficiency and traffic operations at freeway merge bottlenecks.

作者段荟刘攀李志斌汤斗南

机构地区嘉兴学院东南大学加州大学

出处《交通运输系统工程与信息》 EI CSCD 北大核心 2015年第1期55-61,共7页 Journal of Transportation Systems Engineering and Information Technology

基金国家自然科学基金资助项目(51322810)

关键词智能交通可变限速强化学习高速公路汇流瓶颈区 Q学习算法 intelligent transportation variable speed limit reinforcement learning freeway merge bottleneck Q-learning

分类号 U491 [交通运输工程—交通运输规划与管理]

引文网络
相关文献

参考文献11

1Cassidy M J,Rudjanakanoknad J.Increasing the capacity of an isolated merge by metering its onramp[J].Transportation Research Part B:Methodological,2005,39(10):896-913.
2Kang K P,Chang G L,Zou N.Optimal dynamic speedlimit control for highway work zone operations[J].Transp.Res.Rec.,2004,1877:77-84.
3Hegyi A,Bart S D,Hellendoorn J P.Optimal coordination of variable speed limits to suppress shock waves[J].IEEE Trans.Intel.Transp.Syst.,2005,6(1):102-112.
4Zhang J,Chang H,Ioannou P A.A simple roadway control system for freeway traffic[C].Minneapolis:Proc.American Control Conference ,2006:4900–4905.
5Carlson R C,Papamichail I,Papageorgiou M.Local feedback-based mainstream traffic flow control on motorways using variable speed limits[C].Madeira Island,Portugal:13th International IEEE Annual Conference on Intelligent Transportation Systems,2010.
6Sutton R S,Barto A G.Reinforcement learning-an Introduction.[M].Cambridge,Massachusetts :MIT Press,1998.
7Rezaee K,Abdulhai B,Abdelgawad H.Self-learning adaptive ramp metering:analysis of design parameters on a test case in Toronto[C].Washington,D.C:92th Annual Meeting of TRB,2013.
8Veljanovska K,Bombol K M,Maher T.Reinforcement learning technique in multiple motorway access control strategy design[C].Intelligent Transport Systems (ITS) Preliminary Communication .Mar.19,2010.
9Abdulhai B,Pringle R,Karakoulas G J.Reinforcement learning for true adaptive traffic signal control[J].ASCE Journal of Transportation Engineering.2003,129 (3):278-285.
10Watkins C,Dayan P.Q-learning.machine learning[J].1992,8(3-4):279-292.

同被引文献98

1陈娟,荆昊,孙向阳.基于模糊非支配排序遗传算法的多车型快速路交通拥堵和排放优化[J].上海大学学报（自然科学版）,2021,27(4):766-784. 被引量：3
2刘立英,李新刚,贾斌.基于元胞自动机模型的交织区通行能力特性分析[J].交通信息与安全,2013,31(3):28-32. 被引量：8
3朱秀,谢子殿.基于AT89C51单片机的动态限速标志的设计[J].黑龙江科技学院学报,2004,14(6):367-370. 被引量：1
4陈建阳.高速公路可变限速标志的作用及控制[J].同济大学学报（自然科学版）,1993,21(3):387-391. 被引量：9
5张海军,杨晓光,张珏.高速道路入口匝道控制方法综述[J].同济大学学报（自然科学版）,2005,33(8):1051-1055. 被引量：23
6雷丽,董力耘,宋涛,戴世强.基于元胞自动机模型的高架路交织区交通流的研究[J].物理学报,2006,55(4):1711-1717. 被引量：29
7任黎立.高速道路入口匝道控制方法综述[J].交通标准化,2006,34(5):146-149. 被引量：14
8李杨.高速公路可变速度控制方法研究[D].西安:长安大学,2011.
9庞明宝,贺国光.基于支持向量机的交通流混沌快速识别研究[J].系统工程学报,2007,22(6):593-598. 被引量：12
10Barth M, Boriboonsomsin K. Real-world carbon dioxide impacts of traffic congestion[J]. Transportation Research Record: Journal of the Transportation Research Board, 2008, 2058(1): 163-171.

引证文献14

1安实,姚焓东,姜慧夫,崔建勋.信号交叉口绿色驾驶车速控制方法[J].交通运输系统工程与信息,2015,15(5):53-59. 被引量：19
2程鹏,谢小年.基于BP神经网络的Q-学习可变限速控制对拥堵路段交通流的优化[J].山东交通学院学报,2017,25(3):38-43. 被引量：2
3吴德华,林毅.基于混沌的汇流瓶颈区交通流模糊控制与仿真研究[J].贵州大学学报（自然科学版）,2017,34(6):110-114. 被引量：3
4刘伟,陈科全,田宗忠,杨广川.干道交织区通行能力最大化的合流车道控制[J].交通运输系统工程与信息,2019,19(1):55-61. 被引量：9
5刘卓,郑祖恩.高速公路不利气象条件下可变限速标志设置探讨[J].湖南交通科技,2019,45(3):202-207. 被引量：2
6谢济铭,彭博,蔡晓禹,唐聚,张媛媛.城市快速路交织区控制策略研究综述[J].公路与汽运,2020,0(1):24-31. 被引量：7
7朱健,丁鹏程.非常发性瓶颈区可变限速控制方法[J].交通科技与经济,2020,22(1):38-43. 被引量：2
8刘玮蔚,刘建蓓,余强,骆中斌,高健强.考虑高速公路运行风险的雨天可变限速方法[J].中国公路学报,2022,35(9):38-50. 被引量：5
9韩磊,张轮,郭为安.混合交通流环境下基于改进强化学习的可变限速控制策略[J].交通运输系统工程与信息,2023,23(3):110-122. 被引量：5
10徐延军,陈建雄.基于深度强化学习的平滑车速控制系统[J].上海船舶运输科学研究所学报,2023,46(3):35-41.

二级引证文献56

1朱晴晴.基于设计速度与运行速度理念在山区高速公路限速设计中的优化应用研究[J].运输经理世界,2023(4):25-27.
2鹿应荣,许晓彤,丁川,鲁光泉.连续信号交叉口网联自动驾驶车速控制[J].北京航空航天大学学报,2018,44(11):2257-2266. 被引量：14
3鹿应荣,许晓彤,丁川,鲁光泉.车联网环境下信号交叉口车速控制策略[J].交通运输系统工程与信息,2018,18(1):50-58. 被引量：29
4胡林,钟远兴,黄晶,杜荣华,张新.考虑信号交叉口延时的最优车辆路径规划算法[J].汽车工程,2018,40(10):1223-1229. 被引量：15
5崔洪军,朱敏清,邢江柯,宋长柏.信号交叉口车路协同诱导策略下ACC车辆控制模式研究[J].公路交通科技,2019,36(6):86-93. 被引量：14
6马庚华,郑长江,徐威,沈金星.城市干道交叉口联动控制优化建模[J].贵州大学学报（自然科学版）,2019,36(4):119-124. 被引量：2
7刘欢,杨雷,邵社刚,王赵明.车路协同环境下信号交叉口速度引导策略[J].重庆交通大学学报（自然科学版）,2019,38(12):8-17. 被引量：16
8王宁邦,徐博.一种LBS和实时SC的智能高速公路防交通拥堵模型及算法[J].昆明冶金高等专科学校学报,2019,35(4):95-103. 被引量：1
9谢济铭,彭博,蔡晓禹,唐聚,张媛媛.城市快速路交织区控制策略研究综述[J].公路与汽运,2020,0(1):24-31. 被引量：7
10安树科,徐良杰,陈国俊,罗浩顺,曹辉.基于车路协同技术的信号交叉口改进车辆跟驰模型[J].东南大学学报（自然科学版）,2020,50(1):169-174. 被引量：11

1张佳运,卢刚.集装箱码头连续泊位动态分配优化模型及算法[J].北方交通,2011(4):127-128. 被引量：2
2刘明,孙广香.也论缓解城市道路拥堵的具体措施[J].经济技术协作信息,2008(25):82-82.
3陈照亮,周建,谢军.分车道限速策略下六车道高速公路运行安全特征[J].公路交通科技（应用技术版）,2016,12(12):175-176.
4曾庆成,杨忠振.集装箱码头集卡调度模型与Q学习算法[J].哈尔滨工程大学学报,2008,29(1):1-4. 被引量：37
5龙琼,胡列格,张谨帆,周昭明,彭烁.考虑交通管理策略的交叉口信号控制多目标优化[J].中南大学学报（自然科学版）,2014,45(7):2503-2508. 被引量：7
6石凯.公路养护施工区限速策略有效性评估[J].交通科技,2016,26(2):197-199. 被引量：1
7张辰.基于Q学习的多目标分时段路口交通控制[J].电脑知识与技术,2016,12(1X):291-292.
8张辉,陈阳舟,杨玉珍,李世伟.基于Multi-Agent的区域交通协调控制研究[J].交通与计算机,2006,24(2):94-98. 被引量：9
9沈文,李志强.基于车均延误最小的Q学习交通信号控制方法[J].交通科学与工程,2009,25(3):90-94. 被引量：2
10张允颂,单之元,刘向龙.故障一点通[J].汽车维修与保养,2008(2):54-56.

交通运输系统工程与信息

2015年第1期

浏览历史

内容加载中请稍等...

基于强化学习的汇流瓶颈区可变限速策略研究被引量：14

参考文献11

同被引文献98

引证文献14

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

基于强化学习的汇流瓶颈区可变限速策略研究 被引量：14

参考文献11

同被引文献98

引证文献14

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

基于强化学习的汇流瓶颈区可变限速策略研究被引量：14