期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进DDPG的无人驾驶避障跟踪控制
被引量:
2
1
作者
李新凯
虎晓诚
+1 位作者
马萍
张宏立
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023年第11期44-55,共12页
无人驾驶汽车在跟踪避障控制过程中,被控对象具有非线性特征且被控参数多变,线性模型及固定的无人驾驶车辆数学模型难以保证车辆在复杂环境下的安全性和稳定性,并且无人驾驶离散化控制过程增加了控制难度。针对此类问题,为提高无人驾驶...
无人驾驶汽车在跟踪避障控制过程中,被控对象具有非线性特征且被控参数多变,线性模型及固定的无人驾驶车辆数学模型难以保证车辆在复杂环境下的安全性和稳定性,并且无人驾驶离散化控制过程增加了控制难度。针对此类问题,为提高无人驾驶汽车实时控制跟踪轨迹的精度,同时降低整个控制过程的难度,文中提出了一种基于蒙特卡洛-深度确定性策略梯度(MC-DDPG)的无人驾驶汽车避障跟踪控制算法。该算法基于深度强化学习网络搭建控制系统模型,在策略学习采样过程中采用优秀的训练样本,使用蒙特卡洛方法优化网络训练梯度,对算法的训练样本采取优劣区分,使用优异的样本通过梯度算法寻找最优的网络参数,从而增强网络算法的学习能力,实现无人驾驶汽车的更优连续控制。在计算机模拟环境TORCS中对该算法进行仿真实验,结果表明,应用MC-DDPG算法可以有效地实现无人驾驶汽车的避障跟踪控制,其控制的无人驾驶汽车的跟踪精度及避障效果均优于深度Q网络算法和DDPG算法。
展开更多
关键词
无人驾驶
动态避障
深度确定性策略梯度
轨迹跟踪
梯度优化
下载PDF
职称材料
题名
基于改进DDPG的无人驾驶避障跟踪控制
被引量:
2
1
作者
李新凯
虎晓诚
马萍
张宏立
机构
新疆大学电气工程学院
出处
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023年第11期44-55,共12页
基金
国家自然科学基金资助项目(62263030)
新疆维吾尔自治区自然科学基金青年科学基金资助项目(2022D01C86)。
文摘
无人驾驶汽车在跟踪避障控制过程中,被控对象具有非线性特征且被控参数多变,线性模型及固定的无人驾驶车辆数学模型难以保证车辆在复杂环境下的安全性和稳定性,并且无人驾驶离散化控制过程增加了控制难度。针对此类问题,为提高无人驾驶汽车实时控制跟踪轨迹的精度,同时降低整个控制过程的难度,文中提出了一种基于蒙特卡洛-深度确定性策略梯度(MC-DDPG)的无人驾驶汽车避障跟踪控制算法。该算法基于深度强化学习网络搭建控制系统模型,在策略学习采样过程中采用优秀的训练样本,使用蒙特卡洛方法优化网络训练梯度,对算法的训练样本采取优劣区分,使用优异的样本通过梯度算法寻找最优的网络参数,从而增强网络算法的学习能力,实现无人驾驶汽车的更优连续控制。在计算机模拟环境TORCS中对该算法进行仿真实验,结果表明,应用MC-DDPG算法可以有效地实现无人驾驶汽车的避障跟踪控制,其控制的无人驾驶汽车的跟踪精度及避障效果均优于深度Q网络算法和DDPG算法。
关键词
无人驾驶
动态避障
深度确定性策略梯度
轨迹跟踪
梯度优化
Keywords
self-driving
dynamic obstacle avoidance
depth deterministic policy gradient
trajectory tracking
gradient optimization
分类号
TP273.5 [自动化与计算机技术—检测技术与自动化装置]
U461.1 [机械工程—车辆工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进DDPG的无人驾驶避障跟踪控制
李新凯
虎晓诚
马萍
张宏立
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部