基于强化学习的交叉口交通低排放信号控制研究

Traffic Emission Driven Signal Control of Urban Intersection Based on Reinforcement Learning

导出

摘要交叉口车辆排放较为复杂,尤其是在考虑初始排队长度的情况下,更是难以建立明确的数学模型。Q学习是一种无模型的强化学习算法,通过与环境的试错交互学习最优控制策略。本文提出了一种基于Q学习的交通排放信号控制方案。利用仿真平台USTCMTS2.0,通过不断地试错学习找到在不同相位排队长度下最优配时。在Q学习中添加了模糊初始化Q函数的方法以改进Q学习的收敛速度,加速了学习过程。仿真实验结果表明:强化学习算法取得较好的效果。相比较Hideki的方法,在车流量较高时,车辆平均排放量减少了13.9%,并且对Q函数值的模糊初始化大大加速了Q函数收敛的过程。 Vehicle emissions at intersection are highly complex and it is difficult to establish clear mathematical model of vehicle emission especially in considering intersection initial queue length. Q-learning is a kind of model-free reinforcement learning algorithm. It searches for the optimal control strategy through trial and error interactive with environment. Based on microscopic traffic simulator USTCMTS2.0 platform, Q-learning is used to search for the optimal signal timing scheme with lowest emission in the different conditions of intersection initial queue length. In allusion to the low learning efficiency of Q-learning, the fuzzy inference is introduced to accelerate convergence of Q-learning. Simulation results show that the reinforcement learning algorithm is more effective. The average vehicle emissions are reduced by 13.9% compared with Hideki＆#39;s method for high saturation of the intersection and the fuzzy initialization of Q-value significantly accelerates the convergence process of Q-learning.

作者李昕

机构地区中国科学技术大学信息科学技术学院

出处《电子技术（上海）》 2014年第8期5-8,共4页 Electronic Technology

关键词 Q学习模糊推理交通信号控制排队长度尾气排放 Q-learning Fuzzy inference traffic signal control queue length vehicle emission

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1赵佳,闫学东,王江锋.机动车尾气排放和扩散研究综述[J].公路交通科技,2011,28(S1):147-153. 被引量：5
2Jing-Quan,Li Guoyuan Wu, Ning Zou Transportation Reserch Part D 16 (2011)409-414.
3Jin Peng Lv ,Yunlong Zhang Effect of signal coordination on traffic emission Transportation Reserch Part D 17 (2012)149-153.
4Nakamura H: Cycle Length Optimization at Isolated Signalized Intersections from the Viewpoint of Emission[J]. Traffic and Transportation Studies,2010,2010:275-284.
5李世武,王琳虹,郭栋,孙文财,杨志发.基于机动车排放的自适应信号控制模型[J].华南理工大学学报（自然科学版）,2011,39(3):101-106. 被引量：13
6Glorennec P Y, Jouffe L. Fuzzy Q-learning[C]//Fuzzy Systems, 1997., Proceedings of the Sixth IEEE International Conference on. IEEE, 1997,2: 659-662.

二级参考文献41

1陈小锋,史忠科.基于遗传算法的交通信号动态优化方法[J].系统仿真学报,2004,16(6):1155-1157. 被引量：25
2裴文文,于雷,杨方,王文,宋国华,王丽水.北京市机动车行驶周期的建立方法研究[J].交通环保,2004,25(3):17-20. 被引量：9
3王海鲲,陈长虹,黄成,戴懿,赵静,Jim Lents,Matt Barth,Nick Nikkilia.上海市城区典型道路行驶特征研究[J].交通环保,2005,26(3):35-39. 被引量：17
4王秋平,谭学龙,张生瑞.城市单点交叉口信号配时优化[J].交通运输工程学报,2006,6(2):60-64. 被引量：109
5莫飞,于雷,宋国华.车载尾气检测技术及相关研究综述[J].车辆与动力技术,2006(4):57-62. 被引量：14
6陈琨,于雷.用于交通控制策略评估的微观交通尾气模拟与实例分析[J].交通运输系统工程与信息,2007,7(1):93-100. 被引量：26
7徐振涛.南京市机动车尾气污染现状调查及其对人群健康的影响[J].环境监测管理与技术,1996,8(5):20-22. 被引量：11
8李世武,王云鹏,付建萍,韩立波,宋玉林,郭栋.基于车辆排放的城市道路交叉口信号配时优化仿真[J].吉林大学学报（工学版）,2007,37(6):1268-1272. 被引量：9
9QU Tonghin,RLETT L R,ZIETSMAN J.Estimating the Impact of Freeway Speed Limits on Automobile Emissions. Transportation Research . 2003
10BARTH M,YOUNGLOVE T,WENZELT,et a1.Analysis of Moda1 Emissions from a Diverse in UseVehicle Fleet. Transportation Research . l997

共引文献16

1LI Wen,CAI Yongqing,CHEN Mengfan,LIU Peng.Optical cavity structure design and optical path simulation for rapid nitric oxide detection[J].Optoelectronics Letters,2021,17(12):757-762.
2蔡晓华,何杰,王轶,王海峰,杭文.交通管理与控制对城市隧道机动车尾气排放的影响[J].重庆交通大学学报（自然科学版）,2012,31(6):1198-1202. 被引量：9
3冯雨芹,冷军强,张亚平,李涵武,张春平.城市道路路段燃油经济性评价模型[J].华南理工大学学报（自然科学版）,2011,39(8):104-108. 被引量：10
4汪成亮,陈俊宏,张晨.基于车联网的油耗检测及其时空分布研究[J].计算机工程,2013,39(9):34-38. 被引量：5
5沈家军,王群.绿闪信号作用下交叉口的绿灯间隔时间[J].江苏大学学报（自然科学版）,2015,36(4):406-410.
6李世武,徐艺,王琳虹,孙文财,别一鸣.基于万有引力搜索算法的低排放自适应配时[J].浙江大学学报（工学版）,2015,49(7):1313-1318. 被引量：4
7姚荣涵,王筱雨,赵胜川,徐洪峰,刘锴.基于机动车比功率的单点信号配时优化模型[J].交通运输系统工程与信息,2015,15(5):89-95. 被引量：9
8杨兆升,曲鑫,林赐云,邴其春,龚勃文.考虑低排放低延误的交通信号优化方法[J].华南理工大学学报（自然科学版）,2015,43(10):29-34. 被引量：9
9修伟杰,张立立,李凯龙,王铭远.基于车辆排放的交叉口信号配时优化控制[J].交通运输研究,2016,2(2):6-11. 被引量：4
10尚连生.关于机动车尾气检测方法的对比探讨[J].中国科技纵横,2016,0(9):51-52. 被引量：4

1肖平,王继先,冯能莲.奥运场馆用混合动力电动汽车建模与仿真研究[J].系统仿真学报,2007,19(15):3568-3571.
2国内首台光伏电站智能无水清洁机器人亮相[J].军民两用技术与产品,2014,0(14):36-36.
3李树珉,杜艾永,夏均忠,王大玮,武朋辉.基于软测量技术的车辆排放结果在线处理研究[J].轻型汽车技术,2006(6):19-21.
4陈新全,侯志祥,吴义虎,刘振闻.无检测器交叉口交通流量预测的灰色神经网络模型[J].系统仿真学报,2004,16(12):2655-2656. 被引量：8
5李海威,韦天瀚.基于Q函数优化的加权有向复杂网络模糊聚类算法设计研究[J].广东科技,2016,25(10):54-56.
6杜艾永,李树珉,夏均忠,王大玮,武朋辉.软测量技术在车辆排放数据处理中的应用研究[J].中国测试技术,2007,33(3):41-43. 被引量：1
7王洪彦.新的启发式Q学习算法[J].计算机工程,2009,35(22):173-175. 被引量：1
8声音[J].中国信息化,2010(1):10-10.
9朱铭琳,陈阳舟.基于博弈的交叉口交通信号配时系统设计[J].计算机仿真,2013,30(7):151-155. 被引量：4
10盛玉晓,王童童,李盛恩.基于属性和关系的OLAP算法研究[J].计算机技术与发展,2014,24(6):99-102.

电子技术（上海）

2014年第8期

浏览历史

内容加载中请稍等...

基于强化学习的交叉口交通低排放信号控制研究

参考文献6

二级参考文献41

共引文献16

相关作者

相关机构

相关主题

浏览历史