基于参数融合的Q学习交通信号控制方法被引量：5

A Control Method of Traffic Signals Based on Parameter Fusion of Q-learning

下载PDF

导出

摘要传统Q学习交通控制方法经常因城市道路交通流的随机性和不确定性而产生维数问题,导致控制系统的学习效率和响应速度降低。针对该问题进行分析,提出了一种基于Q学习的改进路口交通信号自适应控制方法。其中,采用模糊技术与Q学习算法相结合的控制策略,改进了Q学习的奖惩机制;同时在Q学习中引入基于经验的状态划分对状态空间进行了优化,并通过建立交通参数融合函数的方式在保持多参数评价交通状态的前提下降低了状态空间存储及更新的复杂度;针对不定周期Q学习配时方案状态空间过于庞大的问题,给出基于相位的绿灯配时方案,从而最终达到对交通流的实时响应控制。使用仿真软件对控制方法进行了仿真研究,仿真结果表明该方法的控制效果优于传统控制。 Traditional Q-learning traffic control methods often generate dimension problem due to the randomness and uncertainty of traffic flow which will result in the reduction of learning efficiency and response speed of the control system.For this,we introduce an improved traffic signal adaptive control method based on Q-learning.A fuzzy technology and Q-learning algorithm is combined to improve the reward and punishment mechanism of Q-learning.At the same time,the empirical state partition is introduced in Q-learning to optimize the state space,and the complexity of state space storage and update is reduced on the premise of maintaining multi-parameter evaluation of traffic state by establishing the traffic parameter fusion function.Aiming at the problem that the state space of the unsteady period Q-learning timing scheme is too large,the phase-based green light timing scheme is presented,so as to achieve the real-time response control of traffic flow.At last,simulation software is used for the control method research,which shows that the control effect of this method is better than traditional control.

作者刘成健罗杰 LIU Cheng-jian;LUO Jie(School of Automation,Nanjing University of Posts and Telecommunications,Nanjing 210000,China)

机构地区南京邮电大学自动化学院

出处《计算机技术与发展》 2018年第11期48-51,共4页 Computer Technology and Development

基金江苏省自然科学基金(BK2011758)

关键词交叉口 Q学习模糊逻辑参数融合相位配时 intersection Q-learning fuzzy logic parameters fusion phase signal plan

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献5

1杜春侠,高云,张文.多智能体系统中具有先验知识的Q学习算法[J].清华大学学报（自然科学版）,2005,45(7):981-984. 被引量：21
2张辰,喻剑,何良华.基于Q学习和动态权重的改进的区域交通信号控制方法[J].计算机科学,2016,43(8):171-176. 被引量：2
3卢守峰,张术,刘喜敏.平均排队长度差最小的单交叉口在线Q学习模型[J].公路交通科技,2014,31(11):116-122. 被引量：6
4胡亚琦,胡翔宇,朱强化,李洪中.基于模糊控制算法的城市交通区域协调控制[J].计算机工程与应用,2015,51(7):266-270. 被引量：5
5臧志刚,陆锋,李海峰,崔海燕.7种微观交通仿真系统的性能评价与比较研究[J].交通与计算机,2007,25(1):66-70. 被引量：35

二级参考文献77

1胡明伟,郭秀芝.用微观交通仿真软件实现ITS模拟的比较研究[J].交通与计算机,2004,22(4):19-22. 被引量：9
2于功弟.DSS的新决策方法——模糊决策法的应用[J].计算机工程,1993,19(2):20-23. 被引量：2
3郭昕,王慧.交通分析仿真软件的研究进展与展望[J].中南公路工程,2005,30(1):144-149. 被引量：8
4能宁,黄毓瑜,李公立.基于元胞自动机的微观城市道路混合交通仿真[J].系统仿真学报,2005,17(5):1234-1236. 被引量：13
5胡明伟,史其信.支持ITS影响评价的交通仿真模型研究[J].ITS通讯,2005,7(1):5-9. 被引量：4
6盖春英.VISSIM微观仿真系统及在道路交通中的应用[J].公路,2005,50(8):118-121. 被引量：47
7刘智勇,李水友.基于免疫遗传算法的区域交通自适应协调控制[J].控制理论与应用,2006,23(1):119-125. 被引量：23
8承向军,常歆识,杨肇夏.基于Q-学习的交通信号控制方法[J].系统工程理论与实践,2006,26(8):136-140. 被引量：14
9赵晓华,李振龙,陈阳舟,李云驰.基于混杂系统Q学习最优控制的信号灯控制方法[J].高技术通讯,2007,17(5):498-502. 被引量：5
10赵晓华,石建军,李振龙,赵国勇.基于Q-learning和BP神经元网络的交叉口信号灯控制[J].公路交通科技,2007,24(7):99-102. 被引量：9

共引文献64

1郭晓军,杨建军,李红卫.Agent仿真中具有先验知识的混合学习算法与混合结构模型[J].海军航空工程学院学报,2007,22(2):247-251.
2孙智源,于丽娜,孙杨杨.基于TransCAD、Hardsoft和S-Paramics的城市对外交通道路网设计[J].中国水运（下半月）,2009,9(8):217-219. 被引量：2
3赫圣杰,孙凤英.基于TransModeler仿真的信号交叉口延误研究[J].城市公共交通,2010(12):36-39. 被引量：1
4何涛,白振兴.多智能体系统设计的关键技术研究[J].现代电子技术,2006,29(14):31-34. 被引量：2
5王惠,符策,谢益武,许瑞雪,杨小佳.面向伙伴选择的模糊Markov博弈控制及仿真研究[J].系统仿真学报,2007,19(15):3572-3576. 被引量：1
6韩伟,韩忠愿.基于黑板模型的多智能体合作学习[J].计算机工程,2007,33(22):42-44. 被引量：5
7韩伟.基于边界样本协调的多智能体合作学习[J].模式识别与人工智能,2008,21(1):111-115.
8毛俊杰,刘国栋.基于先验知识的改进强化学习及其在MAS中应用[J].计算机工程与应用,2008,44(24):156-158. 被引量：2
9李红梅,严正.具有先验知识的Q学习算法在AGC中的应用[J].电力系统自动化,2008,32(23):36-40. 被引量：10
10王国磊,钟诗胜,林琳.基于聚类状态隶属度的动态调度Q-学习[J].高技术通讯,2009,19(4):428-433. 被引量：8

同被引文献36

1王殿海,祁宏生,徐程,陈松.信号交叉口停车次数[J].吉林大学学报（工学版）,2009,39(S2):140-145. 被引量：6
2徐勋倩,黄卫.单路口交通信号多相位实时控制模型及其算法[J].控制理论与应用,2005,22(3):413-416. 被引量：36
3赵晓华,石建军,李振龙,赵国勇.基于Q-learning和BP神经元网络的交叉口信号灯控制[J].公路交通科技,2007,24(7):99-102. 被引量：9
4高丽颖,陈阳舟,李振龙.基于Agent控制器的单路口信号灯学习控制方法研究[J].交通与计算机,2007,25(5):59-62. 被引量：5
5沈文,李志强.基于车均延误最小的Q学习交通信号控制方法[J].交通科学与工程,2009,25(3):90-94. 被引量：2
6卢守峰,张术,刘喜敏.平均排队长度差最小的单交叉口在线Q学习模型[J].公路交通科技,2014,31(11):116-122. 被引量：6
7魏威.信号控制交叉口有效绿灯时间计算方法研究[J].山西建筑,2015,41(4):125-126. 被引量：5
8曹洁,张玲.自适应遗传算法的Multi-Agent交通信号优化控制[J].计算机工程与应用,2016,52(13):265-270. 被引量：10
9顾江洋,应世杰.基于智能控制理论STC10芯片交通信号灯系统的设计[J].价值工程,2017,36(2):148-149. 被引量：4
10夏新海.多Agent强化学习下的城市路网自适应交通信号协调配时决策研究综述[J].交通运输研究,2017,3(2):17-23. 被引量：2

引证文献5

1胡宇,刘美玲,周子昂,张敏.基于Q学习的单路口交通信号协调控制[J].计算机与现代化,2020,0(5):96-100. 被引量：5
2赵纯,董小明.基于深度Q-Learning的信号灯配时优化研究[J].计算机技术与发展,2021,31(8):198-203. 被引量：8
3李振龙,张靖思,刘钦,邢冠仰.基于改进Q学习的双周期干线信号协调控制方法[J].科学技术与工程,2021,21(29):12744-12750. 被引量：4
4田超,郑皎凌.CTS:基于拥堵溯源算法的信号灯多智能体强化学习组织方案[J].计算机应用研究,2023,40(1):178-184. 被引量：1
5朱理婧.基于人工智能的轨道交通信号配时自动控制方法研究[J].科技通报,2019,35(9):70-74. 被引量：3

二级引证文献20

1徐长青.保障特殊车辆优先通行的交通信号协调控制方法与应用[J].交通世界,2021(19):5-7. 被引量：1
2赵纯,董小明.基于深度Q-Learning的信号灯配时优化研究[J].计算机技术与发展,2021,31(8):198-203. 被引量：8
3李振龙,张靖思,刘钦,邢冠仰.基于改进Q学习的双周期干线信号协调控制方法[J].科学技术与工程,2021,21(29):12744-12750. 被引量：4
4王东霞.一种轨道交通信号配时自动控制设计方法[J].新一代信息技术,2022,5(1):35-37.
5尹聪慧,杨曦,彭强,张清勇,余琴.道路交叉口多目标信号配时优化设计[J].武汉理工大学学报,2022,44(8):84-90. 被引量：5
6范英飞,黄河,李鹏飞,贾志绚,晋民杰.基于大数据支撑的干线信号协调控制综合评估[J].科学技术与工程,2022,22(26):11675-11681. 被引量：2
7齐林,邵康.基于Anylogic的交通信号灯配时优化设计[J].电子测试,2022,36(19):56-59. 被引量：3
8林泽阳,赖俊,陈希亮.基于课程学习的深度强化学习研究综述[J].计算机技术与发展,2022,32(11):16-23.
9吉柯,唐进君,曾捷,刘鑫源.基于递阶优化的城市区域路网交通控制[J].铁道科学与工程学报,2023,20(1):63-73. 被引量：3
10周欣,谢耀华,王润民,郑兵兵.考虑前车运动不确定的随机最优ACC控制策略[J].电子设计工程,2023,31(6):75-79.

1张杰.智能交通信号控制系统及控制策略浅谈[J].信息记录材料,2018,19(11):103-104. 被引量：2
2顾庆福.城市治堵工程中交叉口“移位左转”交通组织研究[J].低碳世界,2017,7(36):258-259. 被引量：5
3张启明.五岔路口交通信号的新设置[J].中国公路,2018,0(12):83-86.
4郑高,潘凌,陈瑞.二型模糊熵研究现状[J].工业控制计算机,2018,31(11):70-71.
5王逸,姚志洪,蒋阳升,赵斌,谭宇.基于自适应遗传算法的双环信号配时优化模型[J].工业工程,2018,21(5):72-80. 被引量：11
6尹慧超,白玉,张羽,王伟.关于在城市道路交叉口设置禁入区的理论分析[J].交通与运输,2018,34(A01):170-173.
7刘雅倩,勒国庆.智能计算的干线多路口交通信号控制方法研究[J].南方农机,2018,49(5):112-112.
8李文华,郑杭,陈君,李爽,胡琦.航天继电器步退加速寿命试验温度应力周期的确定方法[J].航天控制,2018,36(5):87-92.
9张泽枫,冯浩,潘少猷,张志勇,邹冬华.基于视频图像的道路交通事故信号灯状态鉴定[J].中国司法鉴定,2018(1):82-86. 被引量：5
10张建寰,李姗文,张陈涛,林坤,吉莹.基于多参数融合的铅酸蓄电池SOC估算方法研究[J].电源技术,2018,42(11):1704-1706. 被引量：7

计算机技术与发展

2018年第11期

浏览历史

内容加载中请稍等...

基于参数融合的Q学习交通信号控制方法被引量：5

参考文献5

二级参考文献77

共引文献64

同被引文献36

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于参数融合的Q学习交通信号控制方法 被引量：5

参考文献5

二级参考文献77

共引文献64

同被引文献36

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于参数融合的Q学习交通信号控制方法被引量：5