-
题名基于深度强化学习的自动驾驶车控制算法研究
被引量:19
- 1
-
-
作者
王丙琛
司怀伟
谭国真
-
机构
大连理工大学计算机科学与技术学院
-
出处
《郑州大学学报(工学版)》
CAS
北大核心
2020年第4期41-45,80,共6页
-
基金
国家自然科学基金委员会与辽宁省联合基金重点支持项目(U1808206)。
-
文摘
为了提高基于强化学习的自动驾驶车控制算法的学习效率,提出了一种结合专家经验的自动驾驶策略学习算法(deep deterministic policy gridient with expert,DDPGwE)。DDPGwE采用基于DDPG的强化学习框架进行模型在线训练,使用真实的人类驾驶数据对actor网络进行预训练,同时在actor网络中加入LSTM预测机制,提升自动驾驶车对将要发生状况的预判。在仿真平台TORCS中的实验结果表明,所提算法相较于原始DDPG算法,训练时间大大缩短,收敛速度加快,提高了模型的稳定性和泛化能力。
-
关键词
神经网络
强化学习
自动驾驶
DDPG算法
actor-critic网络
LSTM
-
Keywords
neural network
reinforcement learning
autopilot
DDPG algorithm
actor-critic network
LSTM
-
分类号
TB183
[一般工业技术]
-