基于深度强化学习的列车运行图冗余时间布局优化研究

Time supplements allocation model for railway timetables based on deep reinforcement learning

下载PDF

导出

摘要为精细化布局冗余时间,提升运行图抗干扰能力,本文考虑多种列车最小间隔时间约束,提出了基于深度强化学习的列车运行图停站-区间冗余时间联合优化模型。首先,基于武广高速铁路列车运行实绩,研究冗余时间作用特点及布局影响因素。其次,基于决策树回归算法构建环境模型,预测不同冗余时间下的列车晚点恢复效率;基于马尔可夫决策过程中的循环反馈结构,构建后验晚点时空分布学习闭环;基于Proximal Policy Optimization算法构建智能体。最后,进行实例验证,结果表明:(1)相比于线性优化结构,基于循环反馈优化结构的模型具有更准确的后验晚点时长估计精度,平均提升约11.8%;(2)本文模型收敛稳定,平均提升列车晚点恢复效率约14.87%,最高约45.17%。 To optimize the allocation of time supplements at stations and in sections precisely and enhance the robustness of railway timetables,this paper proposes a joint optimization model based on deep reinforcement learning that considers various constraints on train headways.First,the characteristics of the time supplement utilization and the influencing factors of the problem are studied according to the actual operation records of Wuhan-Guangzhou high-speed railway.Second,an environment model is constructed using decision-tree regression to predict the train delay recovery under different allocations.A learning loop of a posterior delay distribution based on the cyclic feedback structure of the Markov decision process is then constructed,and an agent is constructed on the basis of the Proximal Policy Optimization algorithm.Finally,examples are selected for model verification.The results indicate that(1)the model with a cyclic feedback optimization structure can more accurately estimate the temporal and spatial distributions of posterior delays than a model with a linear structure,with an average improvement of 11.8%,and(2)the proposed model converges stably,with an average improvement in the delay recovery efficiency of approximately 14.87%and a maximum improvement of approximately 45.17%.

作者徐欣仪黄平文超彭其渊 XU Xin-yi;HUANG Ping;WEN Chao;PENG Qi-Yuan(School of Traffic and Logistics,Southwest Jiaotong University,Chengdu 611756,China;National United Engineering Laboratory of Integrated and Intelligent Transportation,Chengdu 611756,China)

机构地区西南交通大学综合交通运输智能化国家地方联合工程实验室

出处《交通运输工程与信息学报》 2023年第3期161-176,共16页 Journal of Transportation Engineering and Information

基金国家重点研发计划项目(2022YFB4300502) 四川省自然科学基金青年科学基金项目(2022NSFSC1867)。

关键词铁路运输冗余时间布局优化深度强化学习列车运行图近端策略优化 railway timetable time supplement deep reinforcement learning delay recovery Proximal Policy Optimization

分类号 U292.41 [交通运输工程—交通运输规划与管理]

引文网络
相关文献

参考文献18

1黄平,李忠灿,文超,彭其渊.高速铁路故障时空分布及持续时长分布特征研究[J].中国安全科学学报,2018,28(S2):99-104. 被引量：10
2庄河,文超,李忠灿,汤轶雄,黄平.基于高速列车运行实绩的致因-初始晚点时长分布模型[J].铁道学报,2017,39(9):25-31. 被引量：28
3徐传玲,文超,胡瑞,冯永泰.高速铁路列车连带晚点产生机理及其判定[J].交通运输工程与信息学报,2020,18(4):31-37. 被引量：4
4胡雨欣,彭其渊,鲁工圆,李力.基于初始晚点和冗余时间的列车晚点恢复时间预测模型[J].交通运输工程与信息学报,2020,18(2):93-102. 被引量：7
5葛学锴,陈锐锐,黄平,文超,蒋朝哲.高速铁路列车调度策略关联规则分析[J].中国铁路,2022(1):91-98. 被引量：2
6张岳松,田长海,姜昕良,王钰滨.高速铁路列车间隔时间的计算方法[J].中国铁道科学,2013,34(5):120-125. 被引量：49
7文超,李津,李忠灿,智利军,田锐,宋邵杰.机器学习在铁路列车调度调整中的应用综述[J].交通运输工程与信息学报,2022,20(1):1-14. 被引量：5
8邓云霞,马驷,让林.城际铁路列车运行图缓冲时间设置仿真与优化[J].交通运输工程与信息学报,2015,13(2):65-69. 被引量：5
9刘杰,江峰,胡万欣,徐敏.基于换乘条件的轨道交通列车运行图缓冲时间设置[J].铁道运输与经济,2015,37(6):80-84. 被引量：4
10邓鹏.关于我国高速铁路列车运行图缓冲时间的研究[J].交通运输工程与信息学报,2014,12(3):68-74. 被引量：2

二级参考文献90

1汤轶雄,徐传玲,文超,李忠灿,宋邵杰.高铁故障晚点时间预测的支持向量回归模型[J].中国安全科学学报,2019,29(S02):18-23. 被引量：3
2杨肇夏,胡安洲,李菊,胡克,董中英.列车运行图动态性能及其指标体系的研究[J].铁道学报,1993,15(4):46-56. 被引量：34
3刘海东,毛保华,何天健,丁勇,王璇.不同闭塞方式下城轨列车追踪运行过程及其仿真系统的研究[J].铁道学报,2005,27(2):120-125. 被引量：41
4胡思继,孙全欣,胡锦云,杨肇夏.区段内列车晚点传播理论的研究[J].中国铁道科学,1994,15(2):41-54. 被引量：28
5杨肇夏,胡安洲,李菊,胡克,董中英,田长海.列车晚点传播模拟系统[J].铁道学报,1995,17(2):17-24. 被引量：9
6徐瑞华,江志彬,邵伟中,朱效洁.城市轨道交通列车运行延误及其传播特点的仿真研究[J].铁道学报,2006,28(2):7-10. 被引量：36
7张星臣,胡安洲.列车区间运行时分偏离的β函数分布分析[J].铁道学报,1996,18(3):1-6. 被引量：8
8李博,田长海.客运专线追踪列车间隔时间的检算[J].铁道运输与经济,2007,29(7):20-22. 被引量：16
9Yuan Jianxin,Hansen Ingo A.Optimizing capacity utilization of stations by estimating knock-on train delays[J].Transportation Research Part B,2007,41[2] :202-217.
10Lei Nie.Analysis of distributions of train speed,headway and buffer time:the hague case[M].Beijing:Beijing Jiaotong University Publishing House,2008:37-39.

共引文献134

1胡瑞,徐传玲,冯永泰,文超,王全泉.广深高速铁路列车分类型晚点预测[J].中国安全科学学报,2019,29(S02):181-186. 被引量：5
2李力,闫迪,田锐,王全泉.基于晚点恢复的高速铁路行车调度质量评价[J].中国安全科学学报,2019,29(S02):118-125. 被引量：1
3汤轶雄,徐传玲,文超,李忠灿,宋邵杰.高铁故障晚点时间预测的支持向量回归模型[J].中国安全科学学报,2019,29(S02):18-23. 被引量：3
4文超,李忠灿,黄平,田锐,牟玮玮,李力.数据驱动的列车晚点传播研究[J].中国安全科学学报,2019,29(S02):1-9. 被引量：3
5赵乐,关达.基于资源池的铁路列车运行图自动调整算法研究[J].铁道运输与经济,2022,44(S01):71-76.
6刘梦雨,李建民,石睿,许心越.高速铁路非正常事件时长分布及场景划分研究[J].铁道运输与经济,2020(S01):105-110.
7张岳松,白鑫,田长海.高速铁路车站到达追踪间隔时间优化研究[J].铁道运输与经济,2020(S01):47-52. 被引量：3
8赵建勋,田长海,张守帅.基于闭塞时间的高速铁路列车间隔时间研究[J].铁道运输与经济,2020(S01):37-46. 被引量：5
9单杏花.基于运行图压缩的高速铁路区段通过能力研究[J].铁道运输与经济,2020(S01):15-20. 被引量：2
10赵宇刚,毛保华,杨远舟,何韬.城市轨道交通站台最高聚集人数计算方法研究[J].交通运输系统工程与信息,2011,11(2):149-154. 被引量：13

1周政铎,周黎,李博.面向旅客到达晚点最小的高速铁路列车运行图冗余时间布局优化研究[J].铁道运输与经济,2023,45(2):25-32. 被引量：2
2马丽颖.浅谈专利布局的三大考虑要素[J].区域治理,2023(9):16-18.
3钟海龙.地铁车站出入口优化设计研究[J].运输经理世界,2023(2):13-15.
4张建军,赵小明,何亚东,文虹茜,卿粼波.基于多尺度特征融合的图片情感分布学习[J].四川大学学报（自然科学版）,2023,60(4):90-97. 被引量：1
5夏江涛,刘奔越,左逸帆.广东省体育旅游资源空间分异、影响因素及开发路径[J].体育学刊,2023,30(3):76-83. 被引量：5
6焦芳钱,李俊,杨雅倩.新时代我国三大球项目的发展与振兴研究[J].福建体育科技,2023,42(1):45-48. 被引量：4
7肖李蔚宁,柏赟,付昌友,沈晓鹏,杨丽娟.基于虚拟编组技术的列车运行状态转换方案研究[J].铁道标准设计,2023,67(8):16-23.
8周姗琪.“一日一图”目标下高速铁路列车运力供给与市场需求适配质量评价研究[J].铁道运输与经济,2023,45(9):42-48.
9李韵石.“永不晚点”的航司被强制退市[J].法人,2023(8):65-66.
10李桂馨.城乡商贸流通一体化与收入差距耦合协调及循环反馈机制研究[J].商业经济研究,2023(18):14-18. 被引量：1

交通运输工程与信息学报

2023年第3期

浏览历史

内容加载中请稍等...

基于深度强化学习的列车运行图冗余时间布局优化研究

参考文献18

二级参考文献90

共引文献134

相关作者

相关机构

相关主题

浏览历史