基于图像卷积神经网络的匝道控制深度强化学习算法研究被引量：4

Research on Ramp Metering Based on Deep Reinforcement Learning with Image Convolutional Neural Network

下载PDF

导出

摘要针对入口匝道流量控制提升通行效率问题,提出了一种基于图像卷积神经网络的匝道控制深度强化学习算法.克服传统依赖定点检测器的匝道控制对于交通状态估计模糊的缺陷,建立基于图像卷积神经网络的连续时空交通状态解析,采用具有优先经验回放的深度Q学习算法,构建以视频图像作为输入、最优匝道流量策略为输出的算法框架.基于交通仿真(SUMO)平台,模拟了典型的高速公路合流瓶颈路段并进行控制效果测试.结果表明,深度强化学习匝道控制策略能够主动响应不同的交通状态,在短训练时间内达到目标找到最优控制策略,通过采取合适控制动作消除和预防合流区拥堵.本文提出的控制策略有效减少系统总旅行时间13.05%,优于传统定时调节式匝道控制和反馈式匝道控制算法,能更加有效提升高速公路合流区通行效率. To improve the efficiency of the roadway traffic system, this study proposes a ramp metering strategy based on deep reinforcement learning with image convolutional neural networks. This strategy overcomes the blurred state estimation from traditional fixed loop detectors in the previous ramp metering strategy, and performs a continuous space-time traffic state analysis on the basis of the image convolutional neural networks. The deep Q network (DQN) algorithm with a prioritized experience replay is used to construct a methodological framework which takes the image as inputs and generates the optimal metering. The open-source software SUMO, a simulation platform, is employed to model the highway weaving bottleneck and evaluate the ramp metering strategy. The results show that the deep reinforcement learning ramp metering strategy can actively respond to different traffic states, converge to find the optimal control strategy in short training time and take appropriate actions to alleviate and prevent congestion. The strategy proposed in this paper effectively reduces the total system travel time by 13.05%, which effectively improves the traffic efficiency of the highway bottleneck and is superior to the traditional fixed-time ramp metering and reactive ramp metering strategy.

作者戴昇宏李志斌 DAI Shenghong;LI Zhibin(School of Transportation,Southeast University,Nanjing 210096,China)

机构地区东南大学交通学院

出处《交通工程》 2019年第4期1-6,共6页 Journal of Transportation Engineering

基金国家自然科学基金(71871057)

关键词匝道控制人工智能深度强化学习图像效果评价 ramp metering artificial intelligence deep reinforcement learning image effect evaluation

分类号 U491.4 [交通运输工程—交通运输规划与管理]

引文网络
相关文献

参考文献4

1施赛江,陈锋.交叉口信号优化控制的深度循环Q学习方法[J].信息技术与网络安全,2018,37(6):85-89. 被引量：3
2陆海亭,张宁,钱振东.高速道路入口匝道控制方法及应用探索[J].公路,2008,53(8):180-186. 被引量：13
3Li Li,Yisheng Lv,Fei-Yue Wang.Traffic Signal Timing via Deep Reinforcement Learning[J].IEEE/CAA Journal of Automatica Sinica,2016,3(3):247-254. 被引量：70
4任黎立.高速道路入口匝道控制方法综述[J].交通标准化,2006,34(5):146-149. 被引量：14

二级参考文献18

1王飞跃.平行系统方法与复杂系统的管理和控制[J].控制与决策,2004,19(5):485-489. 被引量：330
2张海军,杨晓光,张珏.高速道路入口匝道控制方法综述[J].同济大学学报（自然科学版）,2005,33(8):1051-1055. 被引量：23
3任黎立.高速道路入口匝道控制方法综述[J].交通标准化,2006,34(5):146-149. 被引量：14
4陈恺,张宁,黄卫.出入口管理技术改善立交与地面道路的交通衔接[J].公路,2006,51(10):111-116. 被引量：14
5Louis G Neudorff, et al. Freeway Management And Operations Handbook [R]. FHWA, U.S. DOT, 2003.
6Persuad B S, et al. Study of Breakdown-Related Capacity for a Freeway With Ramp Metering [C]. Washington, D.C. :TRR1748, 2001.
7Leslie Jacobson, et al. Ramp Management And Control Handbook[R]. FHWA, U.S. DOT ,2006.
8Stratified Zone Metering-The Minnesota Algorithm [R]. Minneapolis ,MN. , 2003.
9Jacobson L N, K C Henry, O Mehyar. Real Time Metering Algorithm for Centralized Control [M]. Washington, D.C. :TRR1232, 1989.
10NET. System-Wide Adaptive Ramp Metering Algorithm-High Level Design[R]. La Mirada, CA: 1997.

共引文献91

1吕宜生,王飞跃,张宇,张晓东.虚实互动的平行城市:基本框架、方法与应用[J].智能科学与技术学报,2019,1(3):311-317. 被引量：15
2吕宜生,陈圆圆,金峻臣,李镇江,叶佩军,朱凤华.平行交通:虚实互动的智能交通管理与控制[J].智能科学与技术学报,2019,1(1):21-33. 被引量：29
3曹鹏,贾洪飞,隽志才,唐明.高速公路入口匝道控制算法用户公平性分析[J].公路交通科技,2006,23(11):129-132. 被引量：6
4陆克丽霞,杜豫川,孙立军.上海快速路入口匝道自动控制系统设计及评价[J].交通与计算机,2008,26(1):5-9. 被引量：4
5陆海亭,张宁,钱振东.高速道路入口匝道控制方法及应用探索[J].公路,2008,53(8):180-186. 被引量：13
6陆克丽霞,杜豫川,孙立军.基于ALINEA算法的上海快速路入口匝道控制方法[J].同济大学学报（自然科学版）,2009,37(2):207-213. 被引量：13
7陈晖,张友纯.入口匝道控制方法的应用探索[J].科教文汇,2009(24):273-274.
8徐琛,蒋珉,柴干.Bottleneck算法的改进与仿真[J].计算机技术与发展,2009,19(10):37-39.
9朱弘戈.快速路出口与衔接道路平交口的协调控制问题研究[J].交通标准化,2010,38(14):119-122.
10李英帅,姚红云,吕乔.城市快速路匝道交通特性分析[J].交通信息与安全,2010,28(5):21-24. 被引量：5

同被引文献29

1李晨,许雪,郭业才.基于深度神经网络的单幅图像盲去噪算法[J].电子测量技术,2023,46(21):183-192. 被引量：2
2赵明,侯忠生,晏静文.受限迭代学习入口匝道控制收敛性分析[J].交通运输系统工程与信息,2011,11(2):166-173. 被引量：5
3王兴举,高桂凤,宫城俊彦.高速公路单点入口匝道RLRM控制方法[J].交通运输工程学报,2012,12(3):101-107. 被引量：5
4贺敬凯,徐建闽.基于BP神经网络的入口匝道控制器的设计[J].华南理工大学学报（自然科学版）,2002,30(7):24-27. 被引量：14
5刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：456
6温惠英,吴嘉彬,漆巍巍,吴丽莎,张克雄.高速公路入口匝道合流区的CP-CS融合模型[J].华南理工大学学报（自然科学版）,2020,48(2):50-57. 被引量：15
7曲昭伟,潘昭天,陈永恒,李海涛,王鑫.考虑博弈的多智能体强化学习分布式信号控制[J].交通运输系统工程与信息,2020,20(2):76-82. 被引量：10
8朱轶伦,陈新建,高强,洪道鉴,王周虹.一种基于深度强化学习的电网潮流特征提取方法[J].电网与清洁能源,2020,36(3):7-12. 被引量：10
9刘畅,庄伟超,殷国栋,黄泽豪,刘昊吉.高速匝道入口多智能网联车协同合流控制[J].东南大学学报（自然科学版）,2020,50(5):965-972. 被引量：11
10马庆禄,袁新新,张琳.交织区多车道协同自适应控制方法[J].交通信息与安全,2020,38(4):34-41. 被引量：1

引证文献4

1章立辉,余宏鑫,熊满初,胡文琴,王亦兵.平衡主线和匝道交通运行的强化学习型匝道控制研究[J].重庆交通大学学报（自然科学版）,2023,42(4):87-97.
2程凤敏.基于深度强化学习的自动特征提取模型研究[J].电子质量,2024(4):11-15.
3刘冰,唐钰,暨育雄,沈煜,杜豫川.典型匝道控制场景下深度强化学习决策机理解析[J].同济大学学报（自然科学版）,2024,52(6):928-934.
4马庆禄,闫浩,聂振宇,李杨梅.匝道合流区智能网联车辆协同控制方法[J].吉林大学学报（工学版）,2024,54(5):1332-1346.

1董可然,朱自博,封春房,唐克双.考虑拥堵关联的城市主干道运行可靠性建模[J].武汉理工大学学报（交通科学与工程版）,2018,42(5):862-867. 被引量：2
2钟珊,刘全,傅启明,龚声蓉,董虎胜.一种采用模型学习和经验回放加速的正则化自然行动器评判器算法[J].计算机学报,2019,42(3):532-553. 被引量：3
3肖昆.川北旅游交通枢纽的现实可行性分析[J].旅游纵览（下半月）,2017,0(5):168-168.
4郭静秋,方守恩,曲小波,王亦兵,刘洋泽西.基于强化协作博弈方法的双车道混合交通流特性[J].同济大学学报（自然科学版）,2019,47(7):976-983. 被引量：4
5陈建平,康怡怡,胡龄爻,陆悠,吴宏杰,傅启明.基于多线程并行强化学习的建筑节能方法[J].计算机工程与应用,2019,55(15):219-227. 被引量：1
6孙文涛,林梓凌,李凡,洪定刚,周建飞,庞向华,韦怀籍,徐攀峰,王小芃.臀中肌主动响应对老年骨质疏松股骨颈骨折的有限元断裂力学分析[J].中国组织工程研究,2019,23(32):5170-5174. 被引量：1
7谢嘉诚,鲍正德,唐娅雯.浅析强化学习与蒙特卡洛树的基本原理[J].计算机系统网络和电信,2019,1(2):294-297.
8朱斐,吴文,伏玉琛,刘全.基于双深度网络的安全深度强化学习方法[J].计算机学报,2019,42(8):1812-1826. 被引量：26
9两年内基本取消全国高速公路省界收费站,实现不停车快捷收费[J].华东公路,2019,0(2):10-11.
10詹斯弗·洛托,王妙香(编译).混合电推进技术能否重振支线航空[J].国际航空,2019,0(7):40-42.

交通工程

2019年第4期

浏览历史

内容加载中请稍等...

基于图像卷积神经网络的匝道控制深度强化学习算法研究被引量：4

参考文献4

二级参考文献18

共引文献91

同被引文献29

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于图像卷积神经网络的匝道控制深度强化学习算法研究 被引量：4

参考文献4

二级参考文献18

共引文献91

同被引文献29

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于图像卷积神经网络的匝道控制深度强化学习算法研究被引量：4