引入谈判博弈的Q-学习下的城市交通信号协调配时决策被引量：4

Urban Traffic Signal Timing Decision Based on Q-learning with Negotiation Game Mechanism

下载PDF

导出

摘要由于城市交通路网中交叉口间交通信号决策是相互影响的,并且车联网技术使得交叉口交通信号配时agent间能进行直接交互,此决策问题可用博弈框架来描述。建立了城市路网中相邻交叉口间交通流关联模型,通过嵌入谈判博弈模型来设计Q-学习方法,此方法中利用谈判参考点来进行配时行为的选择。仿真实验分析表明,相对于无协调的Q-学习算法,谈判博弈Q-学习取得更好的控制效果和稳定性能。谈判博弈Q-学习在处理交通拥挤及干扰交通流时,能根据交通条件灵活地改变交通信号配时决策,具有较强的适应能力。 Because the traffic signal decision between intersection in urban traffic network is interactional,and internet of vehicles can make the intersection traffic signal agent interact directly,this decision problem can be described by the game framework.A traffic flow correlation model between adjacent intersections in urban traffic network was established,and Q-learning method was designed by embedding negotiation game model where negotiation reference point was used to choose timing behavior.The simulation experiment shows that the negotiation game Q-learning achieves better control effect and stability performance compared with the uncoordinated Q-learning algorithm.When dealing with disturbing and congested traffic flow,negotiation game Q-learning has the flexibility to change the traffic signals according to the traffic conditions and necessity.

作者夏新海许伦辉 XIA Xin-hai;XU Lun-Hui(Department of Port and Shipping Management,Guangzhou Maritime University,Guangzhou 510725,China;School of Civil Engineering and Transportation,South China University of Technology,Guangzhou 510640,China)

机构地区广州航海学院港口与航运管理学院华南理工大学土木与交通学院

出处《科学技术与工程》北大核心 2018年第33期108-116,共9页 Science Technology and Engineering

基金广东省自然基金(2016A030310104) 广东省科技计划(2015B010129017)资助

关键词谈判博弈 Q-学习交通信号配时决策 negotiation game Q-learning traffic signal timing decision

分类号 U491.512 [交通运输工程—交通运输规划与管理]

引文网络
相关文献

参考文献5

1戈军,周莲英.基于SARSA(λ)的实时交通信号控制模型[J].计算机工程与应用,2015,51(24):244-248. 被引量：8
2张邻,吴伟明,黄选伟.基于分层序列的相邻信号交叉口控制系统动态优化模型[J].公路交通科技,2015,32(9):121-127. 被引量：2
3Li Li,Yisheng Lv,Fei-Yue Wang.Traffic Signal Timing via Deep Reinforcement Learning[J].IEEE/CAA Journal of Automatica Sinica,2016,3(3):247-254. 被引量：70
4闫飞,田福礼,史忠科.城市区域交通信号迭代学习控制策略[J].控制与决策,2015,30(8):1411-1416. 被引量：16
5首艳芳,徐建闽.基于群体动力学的协调控制子区划分[J].华南理工大学学报（自然科学版）,2013,41(4):77-82. 被引量：8

二级参考文献53

1段后利,李志恒,张毅,胡坚明.交通控制子区动态划分模型[J].吉林大学学报（工学版）,2009,39(S2):13-18. 被引量：12
2沈国江,孙优贤.城市交通干线递阶模糊控制及其神经网络实现[J].系统工程理论与实践,2004,24(4):99-105. 被引量：40
3王飞跃.平行系统方法与复杂系统的管理和控制[J].控制与决策,2004,19(5):485-489. 被引量：330
4王正武,罗大庸,黄中祥,张航.线控系统协调优化模型及其改进粒子群算法研究[J].系统工程理论与实践,2007,27(10):165-171. 被引量：8
5Diakaki C. Integrated control of traffic flow in corridor road networks[D]. Chania: Technical University of Crete, 1999.
6Diakaki C, Papageorgiou M, Aboudolas K. A multivariable regulator approach to traffic responsive network-wide signal control[J]. Control Engineering Practice, 2002, 10(1): 183-195.
7Diakaki C, Dinopoulou V, Aboudolas K, et al. Extensions and new applications of the trafficresponsive urban control strategy: Coordinated signal control for urban networks [J]. Transportation Research Record, 2003, 1856:202-211.
8Lin S, De Schutter B, Xi Y, et al. An efficient model- based method for coordinated control of urban traffic networks[C]. Proc of the 2010 IEEE Int Conf on Networking, Sensing and Control. Chicago: IEEE Press, 2010: 8-13.
9Lin S, De Schutter B, Xi Y, et al. Efficient network- wide model-based predictive control for urban traffic networks[J]. Transportation Research Part C, 2012, 24(9): 122-140.
10Lin S, De Schutter B, Xi Y, et al. Fast model predictive control for urban road networks via MILP[J]. IEEE Trans on Intelligent Transportation System, 2011, 12(3): 846- 856.

共引文献90

1吕宜生,王飞跃,张宇,张晓东.虚实互动的平行城市:基本框架、方法与应用[J].智能科学与技术学报,2019,1(3):311-317. 被引量：15
2吕宜生,陈圆圆,金峻臣,李镇江,叶佩军,朱凤华.平行交通:虚实互动的智能交通管理与控制[J].智能科学与技术学报,2019,1(1):21-33. 被引量：29
3成世伦.对[法轮功]现象的反思[J].政工师,2000(1):48-48.
4冯远静,单敏,乐浩成,张贵军,俞立.绿波协调控制的子区动态划分算法[J].控制理论与应用,2014,31(8):1034-1046. 被引量：7
5闫飞,田福礼,史忠科.城市交通信号的迭代学习控制及其对路网宏观基本图的影响[J].控制理论与应用,2016,33(5):645-652. 被引量：16
6张龙,余发山,康洪,王要东.过饱和单交叉口信号配时控制算法的研究[J].电子测量技术,2016,39(5):150-153. 被引量：4
7张逊逊,许宏科,闫茂德.基于MFD的城市区域路网多子区协调控制策略[J].交通运输系统工程与信息,2017,17(1):98-105. 被引量：15
8胡文伟,胡建强,李湛,周剑峰.基于强化学习算法的自适应配对交易模型[J].管理科学,2017,30(2):148-160. 被引量：18
9夏新海.多Agent强化学习下的城市路网自适应交通信号协调配时决策研究综述[J].交通运输研究,2017,3(2):17-23. 被引量：2
10刘昕,王晓,张卫山,汪建基,王飞跃.平行数据:从大数据到数据智能[J].模式识别与人工智能,2017,30(8):673-681. 被引量：40

同被引文献23

1孙薇,孔祥维,何德全,尤新刚.基于演化博弈论的信息安全攻防问题研究[J].情报科学,2008,26(9):1408-1412. 被引量：19
2姜伟,方滨兴,田志宏,张宏莉.基于攻防随机博弈模型的防御策略选取研究[J].计算机研究与发展,2010,47(10):1714-1723. 被引量：71
3李建明,余春艳.演化博弈下单点信号灯配时优化研究[J].交通运输系统工程与信息,2012,12(4):72-78. 被引量：2
4朱铭琳,陈阳舟.基于博弈的交叉口交通信号配时系统设计[J].计算机仿真,2013,30(7):151-155. 被引量：4
5杨晓芳,张盛,付强.基于博弈论的信号配时方法研究[J].上海理工大学学报,2013,35(6):567-571. 被引量：3
6朱建明,宋彪,黄启发.基于系统动力学的网络安全攻防演化博弈模型[J].通信学报,2014,35(1):54-61. 被引量：39
7窦水海,苟娟琼.信号交叉口过街行人和机动车驾驶员行为演化研究[J].北京交通大学学报（社会科学版）,2015,14(4):66-72. 被引量：8
8卢维科,刘澜,冯伟.基于相邻相位合作博弈的单信号交叉口实时滚动优化建模和仿真[J].公路交通科技,2015,32(11):120-125. 被引量：4
9黄健明,张恒巍,王晋东,黄世锐.基于攻防演化博弈模型的防御策略选取方法[J].通信学报,2017,38(1):168-176. 被引量：24
10黄健明,张恒巍.基于改进复制动态演化博弈模型的最优防御策略选取[J].通信学报,2018,39(1):170-182. 被引量：14

引证文献4

1刘荣,王凤兰,王非.基于演化博弈模型的网络攻防策略[J].科学技术与工程,2020,20(21):8671-8675. 被引量：5
2刘荣,王凤兰,吕良东.基于改进复制动态演化博弈模型的行人与机动车冲突[J].科学技术与工程,2020,20(30):12486-12491. 被引量：4
3李振龙,张靖思,刘钦,邢冠仰.基于改进Q学习的双周期干线信号协调控制方法[J].科学技术与工程,2021,21(29):12744-12750. 被引量：3
4夏新海,许伦辉,杨景山,彭智敏.信号交叉口相位间谈判博弈协调控制[J].公路交通科技,2022,39(4):131-139. 被引量：1

二级引证文献13

1鄂小松,石峻松.资源受限下的网络安全动态博弈模型[J].机械设计与制造工程,2020,49(12):121-124. 被引量：1
2李佳.欧盟新外资审查框架下投资东道国政府的政策选择[J].南通大学学报（社会科学版）,2021,37(2):122-129. 被引量：1
3俞阳,赵锐,冯珂.公众监督下地铁施工企业行为演化博弈分析[J].科学技术与工程,2021,21(34):14853-14861. 被引量：1
4杨晓芳,薄波.基于心理账户前景值的交通安全管理群体行为演化分析[J].物流科技,2022,45(2):73-76. 被引量：2
5陈赟,刘慧琳.基于演化博弈的地铁施工人员不安全行为动态惩罚策略优化[J].科学技术与工程,2022,22(13):5506-5512. 被引量：3
6叶帅辰.基于模型的网络安全风险评估方法研究[J].信息与电脑,2022,34(7):138-142. 被引量：2
7范英飞,黄河,李鹏飞,贾志绚,晋民杰.基于大数据支撑的干线信号协调控制综合评估[J].科学技术与工程,2022,22(26):11675-11681. 被引量：2
8张娴,朱建明,隋智源,明盛智.数字货币交易匿名性与监管的博弈分析[J].网络与信息安全学报,2022,8(5):150-157. 被引量：1
9孙伟,张梦雅,马成元,朱际宸,杨晓光.新型混合交通交叉口信号与车辆轨迹协同控制方法[J].交通运输系统工程与信息,2023,23(1):97-105. 被引量：6
10宋太龙,贺玉龙,刘钦.基于深度强化学习的大型活动关键交叉口信号控制[J].科学技术与工程,2023,23(22):9694-9701.

1张祺,彭云,王文渊,宋向群,郭子坚.基于节点限制的轴幅式集装箱海运网络优化设计[J].重庆交通大学学报（自然科学版）,2018,37(1):109-115. 被引量：4
2长城汽车与百度共推车联网技术落地[J].汽车之友,2018,0(23):128-128.
3王健,卢超杰,陈洪涛,王娟.电动汽车同时充电负荷优化策略及调控技术[J].科学技术创新,2017(22):1-2. 被引量：1
4于和平.智能交通信号控制系统及控制策略浅谈[J].信息周刊,2018,0(4):0013-0013.
5依克热木.阿木提.解析车联网技术发展与应用前景[J].汽车与配件,2018,0(32):50-51. 被引量：7
6刘少堂,张海,任超.天津市城市交通信号宏观控制战略研究与应用[J].电子世界,2018,0(23):139-140.
7张鸿彪.车联网平台功能及实现方法研究[J].信息记录材料,2018,19(11):95-96. 被引量：2
8王子贤,吕庆华,杨敏.基于演化博弈的网络团购实现机制研究[J].闽南师范大学学报（自然科学版）,2018,31(4):110-119.
9郝孟军,宫涛,陈丹,刘良.基于汽车尾气污染物排放量的宜宾市交通信号控制策略研究[J].技术与市场,2018,25(12):167-167. 被引量：1
10丁弋弋.政策红利驱动群雄鏖战车联网市场[J].上海信息化,2018,0(12):48-50.

科学技术与工程

2018年第33期

浏览历史

内容加载中请稍等...

引入谈判博弈的Q-学习下的城市交通信号协调配时决策被引量：4

参考文献5

二级参考文献53

共引文献90

同被引文献23

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

引入谈判博弈的Q-学习下的城市交通信号协调配时决策 被引量：4

参考文献5

二级参考文献53

共引文献90

同被引文献23

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

引入谈判博弈的Q-学习下的城市交通信号协调配时决策被引量：4