期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Q-learning的高速铁路列车动态调度方法
被引量:
12
1
作者
韩忻辰
俞胜平
+1 位作者
袁志明
程丽娟
《控制理论与应用》
EI
CAS
CSCD
北大核心
2021年第10期1511-1521,共11页
高速铁路作为国家综合交通运输体系的骨干核心,近十年来取得了飞速蓬勃的发展.其飞速发展的同时也引发了路网复杂化、分布区域广等现象,这些现象对高铁动态调度提出了更高的要求.突发事件的不确定性会对列车造成时间延误影响,甚者时间...
高速铁路作为国家综合交通运输体系的骨干核心,近十年来取得了飞速蓬勃的发展.其飞速发展的同时也引发了路网复杂化、分布区域广等现象,这些现象对高铁动态调度提出了更高的要求.突发事件的不确定性会对列车造成时间延误影响,甚者时间延误会沿路网传播,造成大面积列车到发晚点.而目前对于此问题的人工调度方式,前瞻性及针对性较差,难以对受影响列车进行迅速调整.针对上述问题,本文建立了以各列车在各车站延误时间总和最小为目标函数的高速铁路列车动态调度模型,在此基础上设计了用于与智能体交互的仿真环境,采用了强化学习中的Q-learning算法对模型进行求解.最后通过仿真实例验证了仿真环境的合理性以及Q-learning算法用于高铁动态调度的有效性,为高铁调度员做出优化决策提供了良好的依据.
展开更多
关键词
高速铁路列车
动态调度
强化学习
Q-LEARNING
下载PDF
职称材料
基于改进粒子群算法的高铁列车动态调度
被引量:
14
2
作者
林博
俞胜平
+3 位作者
刘子源
代学武
崔东亮
韩忻辰
《控制工程》
CSCD
北大核心
2021年第7期1334-1341,共8页
高铁列车易受到恶劣天气、设备故障、异物入侵等突发事件的影响,导致列车无法按照初始调度计划运行而出现列车晚点。针对高铁列车晚点动态调度问题,引入调整策略控制参数,以列车总晚点时间最小和列车总晚点数量最少之和为目标,建立了高...
高铁列车易受到恶劣天气、设备故障、异物入侵等突发事件的影响,导致列车无法按照初始调度计划运行而出现列车晚点。针对高铁列车晚点动态调度问题,引入调整策略控制参数,以列车总晚点时间最小和列车总晚点数量最少之和为目标,建立了高铁列车动态调度非线性规划模型。为提高求解效率,利用动态变化不可行解比例控制参数,提出基于双适值的改进粒子群算法。以南京南到沧州区段实际运行数据为例,将所提粒子群算法与基本粒子群算法、改进遗传算法进行了比较,仿真结果表明了所提算法的优越性。在此基础上深入研究了调整策略控制参数为固定值和动态变化值时的粒子群算法优化效果,仿真结果表明调整策略控制参数值在权重随迭代次数前增后减情况下的求解效果最好。
展开更多
关键词
突发事件
运行图
动态调度
粒子群算法
下载PDF
职称材料
基于策略梯度强化学习的高铁列车动态调度方法
被引量:
7
3
作者
俞胜平
韩忻辰
+1 位作者
袁志明
崔东亮
《控制与决策》
EI
CSCD
北大核心
2022年第9期2407-2417,共11页
高速铁路以其运输能力大、速度快、全天候等优势,取得了飞速蓬勃的发展.而恶劣天气等突发事件会导致列车延误晚点,更甚者延误会沿着路网不断传播扩散,其带来的多米诺效应将造成大面积列车无法按计划运行图运行.目前依靠人工经验的动态...
高速铁路以其运输能力大、速度快、全天候等优势,取得了飞速蓬勃的发展.而恶劣天气等突发事件会导致列车延误晚点,更甚者延误会沿着路网不断传播扩散,其带来的多米诺效应将造成大面积列车无法按计划运行图运行.目前依靠人工经验的动态调度方式难以满足快速优化调整的实际要求.因此,针对突发事件造成高铁列车延误晚点的动态调度问题,设定所有列车在各站到发时间晚点总和最小为优化目标,构建高铁列车可运行情况下的混合整数非线性规划模型,提出基于策略梯度强化学习的高铁列车动态调度方法,包括交互环境建立、智能体状态及动作集合定义、策略网络结构及动作选择方法和回报函数建立,并结合具体问题对策略梯度强化学习(REINFORCE)算法进行误差放大和阈值设定两种改进.最后对算法收敛性及算法改进后的性能提升进行仿真研究,并与Q-learning算法进行比较,结果表明所提出的方法可以有效地对高铁列车进行动态调度,将突发事件带来的延误影响降至最小,从而提高列车的运行效率.
展开更多
关键词
高铁列车
突发扰动
动态调度
强化学习
策略梯度
策略梯度强化学习
原文传递
题名
基于Q-learning的高速铁路列车动态调度方法
被引量:
12
1
作者
韩忻辰
俞胜平
袁志明
程丽娟
机构
东北大学
中国铁道科学研究院集团有限公司通信信号研究所
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2021年第10期1511-1521,共11页
基金
国家自然科学基金项目(U1834211,61790574,61603262,61773269)
辽宁省自然科学基金(2020–MS–093)资助。
文摘
高速铁路作为国家综合交通运输体系的骨干核心,近十年来取得了飞速蓬勃的发展.其飞速发展的同时也引发了路网复杂化、分布区域广等现象,这些现象对高铁动态调度提出了更高的要求.突发事件的不确定性会对列车造成时间延误影响,甚者时间延误会沿路网传播,造成大面积列车到发晚点.而目前对于此问题的人工调度方式,前瞻性及针对性较差,难以对受影响列车进行迅速调整.针对上述问题,本文建立了以各列车在各车站延误时间总和最小为目标函数的高速铁路列车动态调度模型,在此基础上设计了用于与智能体交互的仿真环境,采用了强化学习中的Q-learning算法对模型进行求解.最后通过仿真实例验证了仿真环境的合理性以及Q-learning算法用于高铁动态调度的有效性,为高铁调度员做出优化决策提供了良好的依据.
关键词
高速铁路列车
动态调度
强化学习
Q-LEARNING
Keywords
high-speed railway
dynamic scheduling
reinforcement learning
Q-learning
分类号
U284.59 [交通运输工程—交通信息工程及控制]
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于改进粒子群算法的高铁列车动态调度
被引量:
14
2
作者
林博
俞胜平
刘子源
代学武
崔东亮
韩忻辰
机构
东北大学流程工业综合自动化国家重点实验室
中国铁道科学研究院集团有限公司
出处
《控制工程》
CSCD
北大核心
2021年第7期1334-1341,共8页
基金
国家自然科学基金资助项目(U1834211,61790574,61603262,61773269)
辽宁省自然科学基金资助项目(2020-MS-093)
中央高校基本科研业务费(N2008001)。
文摘
高铁列车易受到恶劣天气、设备故障、异物入侵等突发事件的影响,导致列车无法按照初始调度计划运行而出现列车晚点。针对高铁列车晚点动态调度问题,引入调整策略控制参数,以列车总晚点时间最小和列车总晚点数量最少之和为目标,建立了高铁列车动态调度非线性规划模型。为提高求解效率,利用动态变化不可行解比例控制参数,提出基于双适值的改进粒子群算法。以南京南到沧州区段实际运行数据为例,将所提粒子群算法与基本粒子群算法、改进遗传算法进行了比较,仿真结果表明了所提算法的优越性。在此基础上深入研究了调整策略控制参数为固定值和动态变化值时的粒子群算法优化效果,仿真结果表明调整策略控制参数值在权重随迭代次数前增后减情况下的求解效果最好。
关键词
突发事件
运行图
动态调度
粒子群算法
Keywords
Emergency
operation diagram
dynamic scheduling
particle swarm optimization algorithm
分类号
U292.4 [交通运输工程—交通运输规划与管理]
下载PDF
职称材料
题名
基于策略梯度强化学习的高铁列车动态调度方法
被引量:
7
3
作者
俞胜平
韩忻辰
袁志明
崔东亮
机构
东北大学流程工业综合自动化国家重点实验室
中国铁道科学研究院集团有限公司通信信号研究所
出处
《控制与决策》
EI
CSCD
北大核心
2022年第9期2407-2417,共11页
基金
国家自然科学基金项目(U1834211,61790574,61603262,61773269)
辽宁省自然科学基金项目(2020-MS093)。
文摘
高速铁路以其运输能力大、速度快、全天候等优势,取得了飞速蓬勃的发展.而恶劣天气等突发事件会导致列车延误晚点,更甚者延误会沿着路网不断传播扩散,其带来的多米诺效应将造成大面积列车无法按计划运行图运行.目前依靠人工经验的动态调度方式难以满足快速优化调整的实际要求.因此,针对突发事件造成高铁列车延误晚点的动态调度问题,设定所有列车在各站到发时间晚点总和最小为优化目标,构建高铁列车可运行情况下的混合整数非线性规划模型,提出基于策略梯度强化学习的高铁列车动态调度方法,包括交互环境建立、智能体状态及动作集合定义、策略网络结构及动作选择方法和回报函数建立,并结合具体问题对策略梯度强化学习(REINFORCE)算法进行误差放大和阈值设定两种改进.最后对算法收敛性及算法改进后的性能提升进行仿真研究,并与Q-learning算法进行比较,结果表明所提出的方法可以有效地对高铁列车进行动态调度,将突发事件带来的延误影响降至最小,从而提高列车的运行效率.
关键词
高铁列车
突发扰动
动态调度
强化学习
策略梯度
策略梯度强化学习
Keywords
high-speed railway
unexpected disturbances
dynamic scheduling
reinforcement learning
policy gradient
REINFORCE
分类号
TP273 [自动化与计算机技术—检测技术与自动化装置]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于Q-learning的高速铁路列车动态调度方法
韩忻辰
俞胜平
袁志明
程丽娟
《控制理论与应用》
EI
CAS
CSCD
北大核心
2021
12
下载PDF
职称材料
2
基于改进粒子群算法的高铁列车动态调度
林博
俞胜平
刘子源
代学武
崔东亮
韩忻辰
《控制工程》
CSCD
北大核心
2021
14
下载PDF
职称材料
3
基于策略梯度强化学习的高铁列车动态调度方法
俞胜平
韩忻辰
袁志明
崔东亮
《控制与决策》
EI
CSCD
北大核心
2022
7
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部