多Agent强化学习下的城市路网自适应交通信号协调配时决策研究综述被引量：2

Review of Study on Adaptive Traffic Signal Coordinated Timing Decision of Urban Road Network under Multi-Agent Reinforcement Learning

下载PDF

导出

摘要相对于传统的交通信号配时决策方法,多Agent强化学习及其协调方法能更好地适应城市路网交通环境的变化。为探讨其在城市路网自适应交通信号配时决策中的应用,系统地总结了多Agent强化学习及协调机制的研究方法,详细地分析了国内外研究现状,并指出现有研究中存在的问题,在此基础上对未来研究进行了展望。研究结果表明,既有研究主要针对规模较小的路网,存在维数灾难问题,强化学习与协调机制结合研究还不够深入,相关学习参数分析不够细致,仿真环境和情景现实性不强。未来研究可以引入马尔科夫博弈提高决策协调性,嵌入混合交通流、公交优先等交通管理思想增强决策实用性,引入先验知识及其他学习技术加快学习速度,融入物联网、主动管理、大数据等先进理念和前沿技术增加决策的实时性,与交通诱导等集成提升决策的系统性。 Compared with the approaches of traditional traffic signal timing decision, multi-agent reinforcement learning and its coordination method can better adapt to the variation of traffic environment of urban road network. In order to explore its application in adaptive traffic signal coordinated timing decision of urban road network, the research methods of multi-agent reinforcement learning and its coordina- tion mechanism were systematically summarized, the research status at home and abroad were extensively analyzed, and the existing research problems were put forward. Finally, the directions of future re- search on this topic were discussed. The study results show that the existing research mainly aims at small scale road network and exists the problem of dimension disaster. The research of combination of re- inforcement learning and coordination mechanism isn＇t deep enough. The relevant learning parameter analysis isn＇t meticulous enough, and the reality of simulation environment and scene aren＇t strong enough. The future research can introduce the Markov game to improve coordination, embed traffic man- agement idea such as mixed traffic flow and bus priority to enhance practicability, add the priori knowl- edge to accelerate the learning speed, combine advanced concepts and cutting-edge technology such as the Internet of Things, active management, big data to increase the real-time performance of decision, and integrate traffic guidance to promote the systematieness of decision.

作者夏新海

机构地区广州航海学院港口与航运管理学院

出处《交通运输研究》 2017年第2期17-23,30,共8页 Transport Research

基金广东省自然科学基金项目(2016A030310104) 广东省科技计划项目(2015B010129017)

关键词 Agent 强化学习交通信号交叉口信号配时 Agent reinforcement learning traffic signal intersection signal timing

分类号 U491.51 [交通运输工程—交通运输规划与管理]

引文网络
相关文献

参考文献14

1马寿峰,李英,刘豹.一种基于agent协调的两路口交通控制方法[J].系统工程学报,2003,18(3):272-278. 被引量：25
2首艳芳,徐建闽.基于群体动力学的协调控制子区划分[J].华南理工大学学报（自然科学版）,2013,41(4):77-82. 被引量：8
3朱铭琳,陈阳舟.基于博弈的交叉口交通信号配时系统设计[J].计算机仿真,2013,30(7):151-155. 被引量：4
4闫飞,田福礼,史忠科.城市区域交通信号迭代学习控制策略[J].控制与决策,2015,30(8):1411-1416. 被引量：18
5Li Li,Yisheng Lv,Fei-Yue Wang.Traffic Signal Timing via Deep Reinforcement Learning[J].IEEE/CAA Journal of Automatica Sinica,2016,3(3):247-254. 被引量：71
6李建明,余春艳.演化博弈下单点信号灯配时优化研究[J].交通运输系统工程与信息,2012,12(4):72-78. 被引量：2
7刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：468
8李瑞敏.城市交通信号控制系统发展分析[J].综合运输,2015,37(7):104-108. 被引量：6
9杜荣华,吴泉源.城市区域交通协调控制中的多Agent博弈研究[J].计算机工程与科学,2007,29(4):120-123. 被引量：7
10张邻,吴伟明,黄选伟.基于动态信号配时的非线性规划模型[J].公路交通科技,2014,31(8):131-137. 被引量：5

二级参考文献130

1段后利,李志恒,张毅,胡坚明.交通控制子区动态划分模型[J].吉林大学学报（工学版）,2009,39(S2):13-18. 被引量：12
2李瑞敏.SPOT/UTOPIA交通信号控制系统[J].中国交通信息产业,2004(6):69-71. 被引量：2
3王飞跃.平行系统方法与复杂系统的管理和控制[J].控制与决策,2004,19(5):485-489. 被引量：332
4魏朗,陈荫三,饭田恭敬.城市主干道交通信号群系统控制的参数优化设计模式及其模拟系统开发[J].交通运输工程学报,2001,1(1):72-76. 被引量：5
5袁爱进,曹立明,王小平.一种基于博弈论的多Agent交互模型[J].计算机工程,2005,31(6):50-51. 被引量：10
6石纯一,王克宏,王学军,康小强,罗翊,胡军.分布式人工智能进展[J].模式识别与人工智能,1995,8(A01):72-92. 被引量：18
7魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19
8沈国江,孙优贤.面向控制的城市交通网络宏观动态模型[J].浙江大学学报（工学版）,2005,39(10):1485-1489. 被引量：6
9刘沃野,吴洪臣,吴振宇.排队论在交通控制中的应用[J].数理统计与管理,1996,15(1):19-22. 被引量：7
10阎平凡.再励学习——原理、算法及其在智能控制中的应用[J].信息与控制,1996,25(1):28-34. 被引量：30

共引文献614

1傅汇乔,唐开强,邓归洲,王鑫鹏,陈春林.基于深度强化学习的六足机器人运动规划[J].智能科学与技术学报,2020(4):361-371. 被引量：3
2刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：43
3吕宜生,王飞跃,张宇,张晓东.虚实互动的平行城市:基本框架、方法与应用[J].智能科学与技术学报,2019,1(3):311-317. 被引量：15
4吕宜生,陈圆圆,金峻臣,李镇江,叶佩军,朱凤华.平行交通:虚实互动的智能交通管理与控制[J].智能科学与技术学报,2019,1(1):21-33. 被引量：29
5韩志豪,汪益兵,张宇,郝永志.基于深度强化学习的船舶航线自动规划[J].中国航海,2021,44(1):100-105. 被引量：9
6李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：45
7周瑶瑶,李烨.基于排序优先经验回放的竞争深度Q网络学习[J].计算机应用研究,2020,37(2):486-488. 被引量：6
8李逊,李俊超,邓林忠,康旭云,欧启捷,劳恒辉.人工智能优化技术在钢筋混凝土结构的应用[J].建筑结构,2023,53(S02):1425-1430. 被引量：1
9王雪鉴,文永明,石晓荣,张宁宁,刘洁玺.多智能体多耦合任务混合式智能决策架构设计[J].航空学报,2023,44(S02):418-425.
10刘洋,李建军.深度确定性策略梯度算法优化[J].辽宁工程技术大学学报（自然科学版）,2020(6):545-549. 被引量：2

同被引文献17

1朱茵,隋晓庆.国内外综合运输系统智能化发展现状[J].综合运输,2012,34(4):22-26. 被引量：7
2王松,黄柯棣,杨妹.基于动态数据驱动的交通在线决策[J].计算机仿真,2019,36(1):167-170. 被引量：7
3李瑞敏.城市交通信号控制系统发展分析[J].综合运输,2015,37(7):104-108. 被引量：6
4顾江洋,应世杰.基于智能控制理论STC10芯片交通信号灯系统的设计[J].价值工程,2017,36(2):148-149. 被引量：4
5罗云辉,李林,靳文舟.基于大数据的单点交通信号配时优化策略研究[J].公路与汽运,2017(4):22-27. 被引量：3
6李珣,刘瑶,周健,刘薇,洪良.基于改进遗传算法的交通信号配时优化模型[J].工业仪表与自动化装置,2017(4):125-130. 被引量：7
7张晓.城市道路交通信号控制配时优化策略研究[J].科技尚品,2017,0(8):175-175. 被引量：1
8邱建东,解小平,汤旻安,佘飞.基于车流量的智能交通信号优化控制研究[J].计算机应用与软件,2018,35(1):92-96. 被引量：7
9袁丽丽,孙红艳.单交叉口交通信号灯的实时自适应控制策略[J].中小企业管理与科技,2017,1(34):194-196. 被引量：4
10郑承宇,谯小康,武显金,仵晓萱,刘晓光.基于车流密度的交通信号灯配时优化模型[J].科技创新导报,2018,15(5):167-169. 被引量：7

引证文献2

1朱昭俊,李雪芹.基于Python与Tensorflow的交通信号决策系统[J].综合运输,2022,44(5):74-79. 被引量：1
2朱理婧.基于人工智能的轨道交通信号配时自动控制方法研究[J].科技通报,2019,35(9):70-74. 被引量：3

二级引证文献4

1王东霞.一种轨道交通信号配时自动控制设计方法[J].新一代信息技术,2022,5(1):35-37.
2强应海,陈坚,刘西北,万超.关于人工智能技术应用于信号处理的思考[J].IT经理世界,2022,25(11):91-94. 被引量：1
3邓兰,吴义虎.基于异步优势强化学习的交通信号控制策略[J].交通科学与工程,2023,39(3):110-117.
4陈玉如,张容,唐秋生.改进人工鱼群算法的多目标信号配时优化研究[J].重庆理工大学学报（自然科学）,2023,37(7):25-33.

1梅晓莲.电动汽车的现实性[J].电工技术交流,1993(2):91-97.
2周恩同.论修建西安至南京铁路的紧迫性与现实性[J].铁道勘测与设计,1995(4):18-20.
3殷传亮.使维修走向规范[J].汽车维修技师,2014(2):118-119.
4李志南,李志策,高永诚.DK-1与CCBⅡ机车制动机控制均衡风缸原理对比[J].河北轨道运输,2016,0(1):1-3.
5黄晶.摩托车减挡时的操作[J].摩托车,2003(7):36-36.
6李霞.市政路桥施工质量控制措施探析[J].科技创新与应用,2014,4(8):175-175. 被引量：3
7葛修润.隧道掘进过程中轴向变形产生机制的研究[J].岩土力学,1992,13(2):80-89.
8胡瑶欣.停车诱导信息集成结构模型设计及实现[J].道路交通与安全,2010,10(1):43-47.
9Honda和日立联手开发电动摩托车[J].摩托车,2017,0(3):10-10.
10本田投资东南亚打车软件Grab[J].世界汽车,2017,0(1):134-134.

交通运输研究

2017年第2期

浏览历史

内容加载中请稍等...

多Agent强化学习下的城市路网自适应交通信号协调配时决策研究综述被引量：2

参考文献14

二级参考文献130

共引文献614

同被引文献17

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

多Agent强化学习下的城市路网自适应交通信号协调配时决策研究综述 被引量：2

参考文献14

二级参考文献130

共引文献614

同被引文献17

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

多Agent强化学习下的城市路网自适应交通信号协调配时决策研究综述被引量：2