期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
平衡主线和匝道交通运行的强化学习型匝道控制研究
1
作者
章立辉
余宏鑫
+2 位作者
熊满初
胡文琴
王亦兵
《重庆交通大学学报(自然科学版)》
CAS
CSCD
北大核心
2023年第4期87-97,107,共12页
考虑合流区域主线和匝道的交通流运行状态,提出了一种基于深度强化学习的鲁棒自适应匝道控制模型——DRLARM模型。根据交通流运行特征,构造了平衡主线交通效率和匝道排队长度的强化学习奖励函数;为适应动态变化的交通环境,采用多交通流...
考虑合流区域主线和匝道的交通流运行状态,提出了一种基于深度强化学习的鲁棒自适应匝道控制模型——DRLARM模型。根据交通流运行特征,构造了平衡主线交通效率和匝道排队长度的强化学习奖励函数;为适应动态变化的交通环境,采用多交通流场景混合训练控制模型,在不同拥堵成因、不同拥堵时长、不同需求分布等测试场景下开展仿真实验,对比分析了无控制及DRLARM、ALINEA和PI-ALINEA模型控制的车辆平均行程时间A、车道占有率o、匝道排队长度W和匝道损失时间比P等评价指标。研究表明:DRLARM模型控制的平均行程时间A相比无控工况节省了22%,略好于ALINEA模型,与PI-ALINEA模型控制效果相当;DRLARM模型在不同测试场景下产生的匝道损失时间比P较稳定,匝道排队长度W绝对值相较于ALINEA模型和PI-ALINEA模型均缩短了约16%;深度强化学习方法兼顾了通行效率和路权公平性,训练所得DRLARM模型在动态交通条件下表现出良好的鲁棒性。
展开更多
关键词
交通工程
自适应匝道控制
深度强化学习
高速公路
匝
道
排队管理
鲁棒性
下载PDF
职称材料
题名
平衡主线和匝道交通运行的强化学习型匝道控制研究
1
作者
章立辉
余宏鑫
熊满初
胡文琴
王亦兵
机构
浙江大学建筑工程学院智能交通研究所
浙江大学建筑设计研究院有限公司
浙江大学平衡建筑研究中心
出处
《重庆交通大学学报(自然科学版)》
CAS
CSCD
北大核心
2023年第4期87-97,107,共12页
基金
国家重点研发计划项目(2018YFB1600500)
浙江省重点研发计划项目(2021C01012)。
文摘
考虑合流区域主线和匝道的交通流运行状态,提出了一种基于深度强化学习的鲁棒自适应匝道控制模型——DRLARM模型。根据交通流运行特征,构造了平衡主线交通效率和匝道排队长度的强化学习奖励函数;为适应动态变化的交通环境,采用多交通流场景混合训练控制模型,在不同拥堵成因、不同拥堵时长、不同需求分布等测试场景下开展仿真实验,对比分析了无控制及DRLARM、ALINEA和PI-ALINEA模型控制的车辆平均行程时间A、车道占有率o、匝道排队长度W和匝道损失时间比P等评价指标。研究表明:DRLARM模型控制的平均行程时间A相比无控工况节省了22%,略好于ALINEA模型,与PI-ALINEA模型控制效果相当;DRLARM模型在不同测试场景下产生的匝道损失时间比P较稳定,匝道排队长度W绝对值相较于ALINEA模型和PI-ALINEA模型均缩短了约16%;深度强化学习方法兼顾了通行效率和路权公平性,训练所得DRLARM模型在动态交通条件下表现出良好的鲁棒性。
关键词
交通工程
自适应匝道控制
深度强化学习
高速公路
匝
道
排队管理
鲁棒性
Keywords
traffic engineering
adaptive ramp metering
deep reinforcement learning
freeway
ramp queue management
robustness
分类号
U495 [交通运输工程—交通运输规划与管理]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
平衡主线和匝道交通运行的强化学习型匝道控制研究
章立辉
余宏鑫
熊满初
胡文琴
王亦兵
《重庆交通大学学报(自然科学版)》
CAS
CSCD
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部