基于Double DQN的双模式多目标信号配时方法

A Dual-mode Multi-objective Signal Timing Method Based on Double DQN

下载PDF

导出

摘要近年来深度强化学习作为一种高效可靠的机器学习方法被广泛应用在交通信号控制领域。目前,现有交通信号配时方法通常忽略了特殊车辆(例如救护车、消防车等)的优先通行;此外,基于传统深度强化学习的信号配时方法优化目标较为单一,导致其在复杂交通场景中性能不佳。针对上述问题,基于Double DQN提出一种融合特殊车辆优先通行的双模式多目标信号配时方法(Dual-mode Multi-objective signal timing method based on Double DQN,DMDD),以提高不同交通场景下路口的通行效率。该方法首先基于路口的饱和状态选择信号控制模式,特殊车辆在紧急控制模式下被赋予更高的通行权重,有利于其更快通过路口;接着针对等待时长、队列长度和CO 2排放量3个指标分别设计神经网络进行奖励计算;最后利用Double DQN进行最优信号相位的选择,通过灵活切换信号相位以提升通行效率。基于SUMO的实验结果表明,DMDD与对比方法相比能有效缩短路口处特殊车辆的等待时长、队列长度和CO 2排放量,特殊车辆能够更快通过路口,有效地提高了通行效率。 In recent years,deep reinforcement learning has been widely used as an efficient and reliable machine learning method in the field of traffic signal control.Currently,existing traffic signal timing methods usually ignore the priority of special vehicles(e.g.,ambulances,fire engines,etc.);in addition,the optimization objectives of signal timing methods based on traditional deep reinforcement learning are often relatively single,resulting in poor performance in complex traffic scenarios.To address the above problems,we propose a Dual-mode Multi-objective signal timing method based on Double DQN(DMDD)that incorporates the priority of special vehicles for improving the traffic efficiency of intersections under different scenarios.The method first decides the signal control mode based on the saturation state of the intersection and gives higher weights to special vehicles when in emergency control mode so that they can pass through the intersection faster.Then,neural networks are designed to calculate the rewards for the three metrics of waiting time,queue length and CO 2 emission.Finally,Double DQN is utilized to select the optimal signal phase,and the signal phase is flexibly switched to improve the traffic efficiency.The experimental results based on SUMO show that the DMDD can effectively reduce the waiting time,queue length and CO 2 emission of special vehicles at the intersection compared with other methods,and special vehicles can pass through the intersection faster,which effectively improves the efficiency of traffic.

作者聂雷张明萱黄庆涵鲍海洲 NIE Lei;ZHANG Ming-xuan;HUANG Qing-han;BAO Hai-zhou(School of Computer Science and Technology,Wuhan University of Science and Technology,Wuhan 430065,China;Hubei Province Key Laboratory of Intelligent Information Processing and Real-Time Industrial System,Wuhan 430065,China)

机构地区武汉科技大学计算机科学与技术学院智能信息处理与实时工业系统湖北省重点实验室

出处《计算机技术与发展》 2024年第8期143-150,共8页 Computer Technology and Development

基金国家自然科学基金(61802286) 湖北省教育厅科学研究计划青年项目(Q20221108) 武汉科技大学智能信息处理与实时工业系统湖北省重点实验室基金(ZNXX2022009)。

关键词交通信号配时深度强化学习双模式多目标 Double DQN SUMO traffic signal timing deep reinforcement learning dual-mode multi-objective Double DQN Simulation of Urban MObility

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1聂雷,汪奇锋,张明萱.基于模糊控制的高峰时段过饱和交通流配时方法[J].计算机与数字工程,2022,50(7):1468-1473. 被引量：1
2赵纯,董小明,任奕颖.基于深度强化学习的多路口信号控制优化研究[J].计算机应用研究,2022,39(8):2329-2332. 被引量：1
3刘智敏,叶宝林,朱耀东,姚青,吴维敏.基于深度强化学习的交通信号控制方法[J].浙江大学学报（工学版）,2022,56(6):1249-1256. 被引量：16
4吴黎兵,聂雷,刘冰艺,吴妮,邹逸飞,叶璐瑶.一种VANET环境下的智能交通信号控制方法[J].计算机学报,2016,39(6):1105-1119. 被引量：20
5Lei NIE,Bo LIU,Peng LI,Heng HE,Libing WU.An improved multi-attribute decision-making based network selection algorithm for heterogeneous vehicular network[J].Frontiers of Computer Science,2022,16(3):211-213. 被引量：3

二级参考文献18

1刘建航,孙江明,毕经平,边永超,刘新宇,李忠诚.基于动态时槽的车联网协助下载方法研究[J].计算机学报,2011,34(8):1378-1386. 被引量：27
2刘建航,毕经平,徐鹏,边永超,李忠诚.一种提高系统吞吐量的协助下载补偿模型[J].计算机学报,2012,35(7):1390-1398. 被引量：6
3孙健,李宏智,郭灵波,陈升来.VANET中一种安全消息拥塞控制机制[J].通信学报,2014,35(5):134-140. 被引量：8
4林晓辉.车路协同下基于交通密度的交叉口交通信号控制方法与仿真[J].工业工程,2014,17(4):123-128. 被引量：5
5罗涛,李俊涛,刘瑞娜,丁磊,李剑峰.VANET中安全信息的快速可靠广播路由算法[J].计算机学报,2015,38(3):663-672. 被引量：24
6吴黎兵,聂雷,刘冰艺,吴妮,邹逸飞,叶璐瑶.一种VANET环境下的智能交通信号控制方法[J].计算机学报,2016,39(6):1105-1119. 被引量：20
7Bao-Lin Ye,Weimin Wu,Keyu Ruan,Lingxi Li,Tehuan Chen,Huimin Gao,Yaobin Chen.A Survey of Model Predictive Control Methods for Traffic Signal Control[J].IEEE/CAA Journal of Automatica Sinica,2019,6(3):623-640. 被引量：10
8Libing WU,Lei NIE,Samee U. KHAN,Osman KHALID,Dan WU.A V2I communication-based pipeline model for adaptive urban traffic light scheduling[J].Frontiers of Computer Science,2019,13(5):929-942. 被引量：2
9赖建辉.基于D3QN的交通信号控制策略[J].计算机科学,2019,46(S11):117-121. 被引量：8
10钟馥声,王安麟,姜涛,花彬.城市交通信号自组织控制规则的邻域重构[J].哈尔滨工业大学学报,2020,52(3):74-81. 被引量：5

共引文献35

1聂雷,陈美君,吴黎兵.基于自适应分簇和演化博弈的异构车载网络选择方法[J].武汉大学学报（理学版）,2023,69(2):169-177.
2WU Libing,NIE Lei,FAN Jing,HE Yanxiang,LIU Qin,WU Dan.An Efficient Multi-hop Broadcast Protocol for Emergency Messages Dissemination in VANETs[J].Chinese Journal of Electronics,2017,26(3):614-623. 被引量：4
3吴黎兵,范静,聂雷,崔建群,邹逸飞.一种车联网环境下的城市车辆协同选路方法[J].计算机学报,2017,40(7):1600-1613. 被引量：20
4张传娟.机器学习在智能交通中的应用关键技术研究[J].电子世界,2017,0(22):186-187. 被引量：4
5刘燕.基于车流量检测的交通灯控制系统设计[J].智能计算机与应用,2018,8(1):148-150. 被引量：9
6李树彬,赵景春,党文修,康睿.信号控制技术的智能化创新应用研究[J].中国人民公安大学学报（自然科学版）,2018,24(1):90-93. 被引量：2
7孔轶艳,马立军.基于ARM的智能交通监控系统方案设计[J].大众科技,2018,20(8):1-2.
8韩伟莉,李炬.城市交叉路口交通信号优化控制研究[J].价值工程,2019,38(18):234-236. 被引量：1
9赵文天,万夕里,白光伟.城市交通流量预测与信号控制优化[J].小型微型计算机系统,2019,40(7):1579-1584. 被引量：16
10聂雷,张全玉,李鹏,何亨,吴黎兵.一种动态迭代分区紧急消息广播方法[J].小型微型计算机系统,2019,40(8):1689-1694.

1唐小焱.中国省级能源消耗CO_(2)排放状况及未来趋势分析[J].管理现代化,2024,44(1):180-189.
2王玉梅,周永鑫,张继钦.计及需求侧资源和碳捕集的电网低碳经济调度[J].电工技术,2023(16):78-82.
3孙丽丽,吴群英.“双碳”目标下基于多能融合的炼化高质量发展路径研究[J].石油炼制与化工,2024,55(1):135-144. 被引量：1
4丁杰峰,成川,向权,罗小勇.某柔性直流换流站阀外余热回收分析[J].建筑节能（中英文）,2023,51(12):109-112.
5江安旎,杜煜,原颖,张昊,赵世昕.基于GA-TD3算法的交叉路口决策模型[J].计算机应用研究,2024,41(7):1965-1970.
6无.Ineos德国异丙苯装置投产[J].石油化工技术与经济,2024,40(1):58-58.
7李佳洁,田杭,王念欣,曾晖,靳心,AMER Baras,倪文.纤维掺量对钢渣薄板碳化固结特性的影响[J].有色金属工程,2023,13(11):134-140.
8海德鲁新槽电耗12270 kWh/t-Al[J].轻金属,2024(2):61-61.
9刁济元.“双碳”背景下森林旅游碳排放测算及影响因素研究——以东北三省为例[J].商业经济,2024(3):145-148. 被引量：1
10任佳佳,柳寅奎,胡学敏,向宸,罗显志.面向复杂交通场景的自动驾驶运动规划模型[J].计算机工程与应用,2024,60(15):91-100.

计算机技术与发展

2024年第8期

浏览历史

内容加载中请稍等...

基于Double DQN的双模式多目标信号配时方法

参考文献5

二级参考文献18

共引文献35

相关作者

相关机构

相关主题

浏览历史