基于ASP-SAC算法的列车自动驾驶速度控制

Automatic train operation speed control based on ASP-SAC algorithm

下载PDF

导出

摘要随着经济建设的绿色转型以及人工智能的快速发展,城市轨道交通已成为居民日常出行的重要方式,在保障安全性、高效性和准点性的前提下,列车运行的节能性和舒适性需求也越来越被关注。合理的运行策略能够有效实现多种目标需求下的列车自动驾驶速度控制,强化学习作为一种智能决策方法,能够有效解决这一控制问题。首先,通过综合分析技术、安全性和乘客体验等方面的因素,基于专家经验动作划分和状态信息熵将软演员-评论家(SAC)改进为动作状态经验优先软演员-评论家(ASP-SAC)方法,用于研究列车自动驾驶速度控制问题。其次,将问题马尔可夫形式化,搭建了列车运行环境,确定了状态空间、动作空间以及基于目标控制的奖励函数。最后,以北京地铁亦庄线的一段区间数据为例进行试验,对ASP-SAC方法进行验证并与其他一些算法在相同环境下进行性能优劣比较。研究结果表明:该方法对于多目标控制需求下的列车自动驾驶速度控制问题具有可行性,与未改进前相比算法效率提高22.73%,与PPO算法相比提高29.17%,改进效果良好。同时,列车运行时在安全性、舒适性无误的情况下,准时性、精确性和节能性都强于SAC、DQN、PPO以及PID算法,其中能耗分别减少3.64%、5.62%、4.38%、7.35%,控制效果良好。此外,该方法亦具备鲁棒性,在列车自动驾驶速度控制方面具有一定的优越性和可参考性。 With the green transformation of economic development and the rapid advancement of artificial intelligence,urban rail transit has become an important mode of daily travel for residents.While ensuring safety,efficiency,and punctuality,the energy-saving and comfort demands of train operation have also attracted increasing attention.Reasonable operation strategies can effectively achieve automatic driving speed control of trains under multiple control requirements.Reinforcement learning,as an intelligent decision-making method,can effectively solve this control problem.Firstly,based on the comprehensive analysis of factors such as technology,safety,and passenger experience,the Soft Actor-Critic(SAC)algorithm was improved as the Action-State Experience Prioritized Soft Actor-Critic(ASP-SAC)method,using expert experience action segmentation and state information entropy to study the problem of automatic train operation speed control.Secondly,the problem was formalized as a Markov decision process.The train operation environment was established.The state space,action space,and reward function based on goal control were determined.Finally,using a section of data from the Beijing Subway Yizhuang Line as an example,the ASP-SAC method was validated and compared with other algorithms in the same environment.The research results show that the method is feasible for automatic train operation speed control under multiple target requirements,with an efficiency improvement of 22.73%compared to the unimproved algorithm,and a 29.17%improvement compared to the PPO algorithm.Additionally,the method outperforms SAC,DQN,PPO,and PID algorithms in timeliness,precision,and energy efficiency while ensuring safety and comfort during train operation,with energy consumption reduced by 3.64%,5.62%,4.38%,and 7.35%respectively,demonstrating good control effects.Furthermore,the method can possess robustness and has certain superiority and reference value in the aspect of automatic train operation speed control.

作者刘伯鸿卢田 LIU Bohong;LU Tian(School of Automation and Electrical Engineering,Lanzhou Jiaotong University,Lanzhou 730070,China)

机构地区兰州交通大学自动化与电气工程学院

出处《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第7期2637-2648,共12页 Journal of Railway Science and Engineering

基金国家自然科学基金资助项目(51967010)。

关键词列车自动驾驶多目标控制强化学习 ASP-SAC算法速度控制 automatic train operation multi-objective control reinforcement learning ASP-SAC algorithm speed control

分类号 U284.48 [交通运输工程—交通信息工程及控制]

引文网络
相关文献

参考文献9

1武晓春,金则灵.基于DDPG算法的列车节能控制策略研究[J].铁道科学与工程学报,2023,20(2):483-493. 被引量：7
2张淼,张琦,刘文韬,周博渊.一种基于策略梯度强化学习的列车智能控制方法[J].铁道学报,2020,42(1):69-75. 被引量：15
3宁强,刘元盛,谢龙洋.基于SAC的自动驾驶车辆控制方法应用[J].计算机工程与应用,2023,59(8):306-314. 被引量：2
4彭姿馀,王高才,农望.基于SAC的多服务移动边缘计算中任务卸载和资源配置算法[J].计算机应用研究,2023,40(5):1497-1503. 被引量：4
5李波,白双霞,孟波波,梁诗阳,李曾琳.基于SAC算法的无人机自主空战决策算法[J].指挥控制与仿真,2022,44(5):24-30. 被引量：7
6侯涛,唐丽,牛宏侠.基于数据驱动的高速列车速度复合控制研究[J].交通运输系统工程与信息,2023,23(3):145-152. 被引量：3
7张强,陈德旺,于振宇.城市轨道交通ATO系统性能指标评价[J].都市快轨交通,2011,24(4):26-29. 被引量：26
8无.2022年中国内地城轨交通线路概况[J].城市轨道交通,2023(1):10-11. 被引量：4
9Anjukan Kathirgamanathan,Eleni Mangina,Donal P.Finn.Development of a Soft Actor Critic deep reinforcement learning approach for harnessing energy flexibility in a Large Office building[J].Energy and AI,2021,5(3):228-241. 被引量：2

二级参考文献50

1宿帅,朱擎阳,魏庆来,唐涛,阴佳腾.基于DQN的列车节能驾驶控制方法[J].智能科学与技术学报,2020(4):372-384. 被引量：3
2王龙达,王兴成,刘罡,徐传芳.城市轨道列车速度曲线预测函数控制改进算法[J].仪器仪表学报,2022,43(2):273-283. 被引量：6
3宗明,郜春海,何燕.基于CBTC控制的全自动驾驶系统[J].都市快轨交通,2006,19(3):34-36. 被引量：22
4杨光,唐祯敏.基于MATLAB的磁浮列车自动驾驶控制系统的仿真[J].铁路计算机应用,2007,16(6):49-51. 被引量：10
5Chang C S, Sim S S. Optimising train movements through coast control using genetic algorithms [ J]. Electric Power Application, lEE Proc. , 1997,144( 1 ) :65 - 73.
6刘正敏,昂亮,姜长生,吴庆宪.多级影响图在无人机群协同空战机动决策中的应用[J].电光与控制,2010,17(10):10-13. 被引量：10
7郜春海,唐涛,张建明.高速铁路列车运行控制系统车载设备的软件设计[J].北方交通大学学报,1999,23(5):77-82. 被引量：8
8张强,杨任农,俞利新,张涛,左家亮.基于Q-network强化学习的超视距空战机动决策[J].空军工程大学学报（自然科学版）,2018,19(6):8-14. 被引量：19
9毛梦月,张安,周鼎,毕文豪.基于机动预测的强化学习无人机空中格斗研究[J].电光与控制,2019,26(2):5-10. 被引量：10
10宿帅,唐涛.城市轨道交通ATO的节能优化研究[J].铁道学报,2014,36(12):50-55. 被引量：30

共引文献60

1张友鹏,金煜翔,杨军霞,王东.高速列车分布式super-twisting滑模控制研究[J].电子测量与仪器学报,2023,37(11):187-196. 被引量：1
2王鹏.地铁列车ATO模式对标停车不准故障分析[J].铁道机车车辆,2015,35(1):118-120. 被引量：15
3石卫师.基于无模型自适应控制的城轨列车自动驾驶研究[J].铁道学报,2016,38(3):72-77. 被引量：18
4谭文举.南宁地铁1号线列车自动运行模式下列车停车精度优化设计[J].城市轨道交通研究,2017,20(5):50-53. 被引量：5
5李鑫.LM磨耗形踏面轮对全廓形等级镟修的实现方法[J].城市轨道交通研究,2017,20(5):153-157. 被引量：5
6崔亦博,焦怡博,孙旺,王壮锋.城市轨道交通CBTC系统仿真实验室设计[J].实验室研究与探索,2017,36(5):122-125. 被引量：3
7高翔.城市轨道交通列车停站定位精度随机误差研究[J].城市轨道交通研究,2014,17(B07):14-17. 被引量：1
8黄浩.城市轨道交通计算机联锁子系统的功能测试分析[J].城市轨道交通研究,2016,19(B07):48-50. 被引量：2
9路象群.广州地铁A2型车对标不准原因分析及改进[J].机电工程技术,2017,46(8):220-223. 被引量：3
10罗庆.广州地铁4号线直线电机车辆对标不准分析及改进[J].现代城市轨道交通,2019(4):5-9. 被引量：5

1尚东升,房延杰,李辉,郭超,李想,石晓伟.研制球窝垂直朝向碗头挂板带电取销器[J].企业管理,2023(S02):200-201.
2袁希文,何川,黄强,张新锐,黄瑞鹏,肖磊.智轨电车虚拟联挂系统架构与控制技术研究[J].控制与信息技术,2024(3):12-20.
3李城州,袁宝聚,陈美玲,赵文豪.基于机器视觉的智能送药小车设计[J].工业控制计算机,2024,37(7):152-154.
4刘绪斌,柳张杰,袁亮.“双一流”背景下“人工智能+电气工程”复合型人才培养探索[J].中国电力教育,2024(4):68-69.
5格日乐朝鲁,徐雷钧,白雪.基于物联网云平台智能开关与温控系统设计[J].自动化与仪器仪表,2024(5):83-87.
6福建省应急管理厅党委书记、厅长丘毅到基层调研应急救援力量建设[J].安全与健康,2024(4):7-8.
7阚子健.利用“智慧消防”优化火灾调查工作机制研究[J].消防界（电子版）,2024,10(4):107-109.
8张克诚,王彦文.基于大数据技术的电力调度准时性全流程管控系统设计与应用[J].今日自动化,2024(6):12-14.
9徐旭东,易洪波,何伊伦.基于ASPC-DA的假冒绿通车识别方法[J].自动化与仪器仪表,2024(5):88-92.
10焦宇清.氨燃料散货船总体设计关键技术[J].船舶设计通讯,2024(1):50-60.

铁道科学与工程学报

2024年第7期

浏览历史

内容加载中请稍等...

基于ASP-SAC算法的列车自动驾驶速度控制

参考文献9

二级参考文献50

共引文献60

相关作者

相关机构

相关主题

浏览历史