期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于WGAIL-DDPG(λ)的车辆自动驾驶决策模型
被引量:
2
1
作者
张明恒
吕新飞
+1 位作者
万星
吴增文
《大连理工大学学报》
CAS
CSCD
北大核心
2022年第1期77-84,共8页
优良的可靠性、学习效率和模型泛化能力是车辆自动驾驶系统研究的基本要求.基于深度强化学习理论框架提出了一种用于车辆自动驾驶决策的WGAIL-DDPG(λ)(Wasserstein generative adversarial nets-deep deterministic policy gradient(...
优良的可靠性、学习效率和模型泛化能力是车辆自动驾驶系统研究的基本要求.基于深度强化学习理论框架提出了一种用于车辆自动驾驶决策的WGAIL-DDPG(λ)(Wasserstein generative adversarial nets-deep deterministic policy gradient(λ))模型.其中,基于驾驶安全性、稳定性的车辆行驶性能要求,对强化学习模型中的奖励函数进行了针对性设计;通过引入模仿学习有效提升了强化学习过程中的学习效率;通过合理的增益调度器设计,保证了从模仿学习到强化学习的平稳过渡.实验结果表明,在稳定性上,智能体偏离道路中线的程度一直在30%内波动;在安全性上,智能体与周边其他车辆的安全距离基本保持在10 m以上;在模型泛化性方面,智能体在许多未训练过的复杂弯道也能很好地完成安全、平稳的驾驶任务;与原始DDPG(deep deterministic policy gradient)算法相比,该模型在学习速度上提升了约3.4倍,说明所提出的模型在保证自动驾驶系统可靠决策的同时有效提升了强化学习的效率,进一步实验证明其适用于不同的驾驶条件.
展开更多
关键词
自动驾驶决策
深度强化学习
模仿学习
深度确定性策略梯度算法
下载PDF
职称材料
基于CQL-SAC的自动驾驶防撞决策方法
2
作者
刘玉辉
于镝
《北京信息科技大学学报(自然科学版)》
2024年第3期16-24,共9页
针对深度强化学习在自动驾驶任务中存在价值函数过估计、学习效率低、安全性差等问题,提出了一种自动驾驶防撞决策方法。首先,将保守Q学习(conservative Q-learning, CQL)算法与软行动评论(soft actor-critic, SAC)算法融合,提出CQL-SA...
针对深度强化学习在自动驾驶任务中存在价值函数过估计、学习效率低、安全性差等问题,提出了一种自动驾驶防撞决策方法。首先,将保守Q学习(conservative Q-learning, CQL)算法与软行动评论(soft actor-critic, SAC)算法融合,提出CQL-SAC算法,以缓解价值过估计问题。然后,在算法训练过程中引入专家经验,实现算法快速收敛,以解决学习效率低的问题。最后,利用防撞模块对CQL-SAC算法输出的动作进行安全检查和矫正,避免车辆碰撞。在基于高速公路的仿真场景下对方法有效性进行验证。仿真结果表明,在训练阶段,CQL-SAC算法相比SAC算法和样本内行动评论(in-sample actor-critic, InAC)算法收敛速度分别提升12.5%、5.4%,引入专家经验后算法收敛速度进一步提升14.3%;在测试阶段,本文算法与SAC和InAC算法相比,成功率分别提升17、12百分点,平均回合奖励分别提升23.1%、10.7%。
展开更多
关键词
智慧交通
自动驾驶决策
保守Q学习算法
软行动评论算法
专家经验
防撞策略
下载PDF
职称材料
联合图像与单目深度特征的强化学习端到端自动驾驶决策方法
被引量:
2
3
作者
卢笑
竺一薇
+2 位作者
阳牡花
周炫余
王耀南
《武汉大学学报(信息科学版)》
EI
CAS
CSCD
北大核心
2021年第12期1862-1871,共10页
现有的基于深度强化学习(deep reinforcement learning,DRL)的端到端自动驾驶决策方法鲁棒性较低,存在安全隐患,且单纯依赖图像特征难以正确推断出复杂场景下的最优动作。对此,提出了一种联合图像与单目深度特征的强化学习端到端自动驾...
现有的基于深度强化学习(deep reinforcement learning,DRL)的端到端自动驾驶决策方法鲁棒性较低,存在安全隐患,且单纯依赖图像特征难以正确推断出复杂场景下的最优动作。对此,提出了一种联合图像与单目深度特征的强化学习端到端自动驾驶决策方案。首先,建立了基于竞争深度Q网络(dueling deep Q-network,Dueling DQN)的端到端决策模型,以提高模型的策略评估能力和鲁棒性。该模型根据观测数据获取当前状态,输出车辆驾驶动作(油门、转向和刹车)的离散控制量。然后,在二维图像特征的基础上提出了联合单目深度特征的状态感知方法,在自监督情况下有效提取场景深度特征,结合图像特征共同训练智能体网络,协同优化智能体的决策。最后,在模拟仿真环境下对不同的行驶环境和任务进行算法验证。结果表明,该模型可以实现鲁棒的端到端无人驾驶决策,且与仅依赖图像特征的方法相比,所提出的方法具有更强的状态感知能力与更准确的决策能力。
展开更多
关键词
端到端
自动驾驶决策
竞争深度Q网络
图像特征
单目深度特征
原文传递
场景复杂度评估在轨迹预测和驾驶决策中的应用
4
作者
李道飞
潘豪
《汽车工程》
EI
2024年第9期1556-1563,共8页
场景复杂度的评估对于提升自动驾驶车辆应对多变环境的能力以及增强算法的适用性至关重要。本文中设计了基于图模型的复杂度评估算法,充分考虑场景中的交互拓扑,将场景划分为3类不同复杂度。在匝道汇流场景下,验证了该算法的合理性与有...
场景复杂度的评估对于提升自动驾驶车辆应对多变环境的能力以及增强算法的适用性至关重要。本文中设计了基于图模型的复杂度评估算法,充分考虑场景中的交互拓扑,将场景划分为3类不同复杂度。在匝道汇流场景下,验证了该算法的合理性与有效性。为说明复杂度评估算法的拓展性,将其应用于自动驾驶的轨迹预测与决策算法开发中。通过结合自然驾驶数据集和实车在环试验,对提出算法进行测试,结果表明:场景复杂度评估可预先估计预测的不确定性,显著提升自动驾驶决策算法的实时性与最优性。在数据回放测试中,复杂度评估模块可帮助降低并道失败率、并道剐蹭率分别为38%、92%,具有潜在的应用前景。
展开更多
关键词
场景复杂度
自动驾驶决策
轨迹预测
图模型
实车在环试验
下载PDF
职称材料
题名
基于WGAIL-DDPG(λ)的车辆自动驾驶决策模型
被引量:
2
1
作者
张明恒
吕新飞
万星
吴增文
机构
大连理工大学工业装备结构分析国家重点实验室
大连理工大学汽车工程学院
出处
《大连理工大学学报》
CAS
CSCD
北大核心
2022年第1期77-84,共8页
基金
国家自然科学基金资助项目(51675077)
中国博士后科学基金资助项目(2015M581329,2017T100178).
文摘
优良的可靠性、学习效率和模型泛化能力是车辆自动驾驶系统研究的基本要求.基于深度强化学习理论框架提出了一种用于车辆自动驾驶决策的WGAIL-DDPG(λ)(Wasserstein generative adversarial nets-deep deterministic policy gradient(λ))模型.其中,基于驾驶安全性、稳定性的车辆行驶性能要求,对强化学习模型中的奖励函数进行了针对性设计;通过引入模仿学习有效提升了强化学习过程中的学习效率;通过合理的增益调度器设计,保证了从模仿学习到强化学习的平稳过渡.实验结果表明,在稳定性上,智能体偏离道路中线的程度一直在30%内波动;在安全性上,智能体与周边其他车辆的安全距离基本保持在10 m以上;在模型泛化性方面,智能体在许多未训练过的复杂弯道也能很好地完成安全、平稳的驾驶任务;与原始DDPG(deep deterministic policy gradient)算法相比,该模型在学习速度上提升了约3.4倍,说明所提出的模型在保证自动驾驶系统可靠决策的同时有效提升了强化学习的效率,进一步实验证明其适用于不同的驾驶条件.
关键词
自动驾驶决策
深度强化学习
模仿学习
深度确定性策略梯度算法
Keywords
automatic driving decision
deep reinforcement learning
imitation learning
deep deterministic policy gradient algorithm
分类号
U46 [机械工程—车辆工程]
下载PDF
职称材料
题名
基于CQL-SAC的自动驾驶防撞决策方法
2
作者
刘玉辉
于镝
机构
北京信息科技大学自动化学院
出处
《北京信息科技大学学报(自然科学版)》
2024年第3期16-24,共9页
文摘
针对深度强化学习在自动驾驶任务中存在价值函数过估计、学习效率低、安全性差等问题,提出了一种自动驾驶防撞决策方法。首先,将保守Q学习(conservative Q-learning, CQL)算法与软行动评论(soft actor-critic, SAC)算法融合,提出CQL-SAC算法,以缓解价值过估计问题。然后,在算法训练过程中引入专家经验,实现算法快速收敛,以解决学习效率低的问题。最后,利用防撞模块对CQL-SAC算法输出的动作进行安全检查和矫正,避免车辆碰撞。在基于高速公路的仿真场景下对方法有效性进行验证。仿真结果表明,在训练阶段,CQL-SAC算法相比SAC算法和样本内行动评论(in-sample actor-critic, InAC)算法收敛速度分别提升12.5%、5.4%,引入专家经验后算法收敛速度进一步提升14.3%;在测试阶段,本文算法与SAC和InAC算法相比,成功率分别提升17、12百分点,平均回合奖励分别提升23.1%、10.7%。
关键词
智慧交通
自动驾驶决策
保守Q学习算法
软行动评论算法
专家经验
防撞策略
Keywords
smart transportation
autonomous driving decision-making
conservative Q-learning(CQL)algorithm
soft actor-critic(SAC)algorithm
expert experience
collision prevention strategy
分类号
U463.6 [机械工程—车辆工程]
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
联合图像与单目深度特征的强化学习端到端自动驾驶决策方法
被引量:
2
3
作者
卢笑
竺一薇
阳牡花
周炫余
王耀南
机构
湖南师范大学工程与设计学院
湖南师范大学基础教育大数据研究与应用重点实验室
湖南大学机器人视觉感知与控制技术国家工程实验室
出处
《武汉大学学报(信息科学版)》
EI
CAS
CSCD
北大核心
2021年第12期1862-1871,共10页
基金
国家自然科学基金(62007007,61703155)
湖南省自然科学基金(2018JJ3350,2018JJ3352)。
文摘
现有的基于深度强化学习(deep reinforcement learning,DRL)的端到端自动驾驶决策方法鲁棒性较低,存在安全隐患,且单纯依赖图像特征难以正确推断出复杂场景下的最优动作。对此,提出了一种联合图像与单目深度特征的强化学习端到端自动驾驶决策方案。首先,建立了基于竞争深度Q网络(dueling deep Q-network,Dueling DQN)的端到端决策模型,以提高模型的策略评估能力和鲁棒性。该模型根据观测数据获取当前状态,输出车辆驾驶动作(油门、转向和刹车)的离散控制量。然后,在二维图像特征的基础上提出了联合单目深度特征的状态感知方法,在自监督情况下有效提取场景深度特征,结合图像特征共同训练智能体网络,协同优化智能体的决策。最后,在模拟仿真环境下对不同的行驶环境和任务进行算法验证。结果表明,该模型可以实现鲁棒的端到端无人驾驶决策,且与仅依赖图像特征的方法相比,所提出的方法具有更强的状态感知能力与更准确的决策能力。
关键词
端到端
自动驾驶决策
竞争深度Q网络
图像特征
单目深度特征
Keywords
end-to-end automatic driving decision-making
dueling deep Q-learning network
image features
monocular depth features
分类号
P237 [天文地球—摄影测量与遥感]
原文传递
题名
场景复杂度评估在轨迹预测和驾驶决策中的应用
4
作者
李道飞
潘豪
机构
浙江大学动力机械及车辆工程研究所
出处
《汽车工程》
EI
2024年第9期1556-1563,共8页
基金
国家自然科学基金面上项目(52372421)
浙江省科技厅领雁研发攻关计划项目(2023C01238,2022C01241)资助。
文摘
场景复杂度的评估对于提升自动驾驶车辆应对多变环境的能力以及增强算法的适用性至关重要。本文中设计了基于图模型的复杂度评估算法,充分考虑场景中的交互拓扑,将场景划分为3类不同复杂度。在匝道汇流场景下,验证了该算法的合理性与有效性。为说明复杂度评估算法的拓展性,将其应用于自动驾驶的轨迹预测与决策算法开发中。通过结合自然驾驶数据集和实车在环试验,对提出算法进行测试,结果表明:场景复杂度评估可预先估计预测的不确定性,显著提升自动驾驶决策算法的实时性与最优性。在数据回放测试中,复杂度评估模块可帮助降低并道失败率、并道剐蹭率分别为38%、92%,具有潜在的应用前景。
关键词
场景复杂度
自动驾驶决策
轨迹预测
图模型
实车在环试验
Keywords
scenario complexity
autonomous driving decision making
trajectory prediction
graph model
vehicle-in-the-loop experiment
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于WGAIL-DDPG(λ)的车辆自动驾驶决策模型
张明恒
吕新飞
万星
吴增文
《大连理工大学学报》
CAS
CSCD
北大核心
2022
2
下载PDF
职称材料
2
基于CQL-SAC的自动驾驶防撞决策方法
刘玉辉
于镝
《北京信息科技大学学报(自然科学版)》
2024
0
下载PDF
职称材料
3
联合图像与单目深度特征的强化学习端到端自动驾驶决策方法
卢笑
竺一薇
阳牡花
周炫余
王耀南
《武汉大学学报(信息科学版)》
EI
CAS
CSCD
北大核心
2021
2
原文传递
4
场景复杂度评估在轨迹预测和驾驶决策中的应用
李道飞
潘豪
《汽车工程》
EI
2024
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部