期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习算法的车辆行为决策研究
1
作者 陈名松 张泽功 +1 位作者 吴冉冉 吴泳蓉 《桂林电子科技大学学报》 2022年第1期29-35,共7页
针对传统的DDPG算法训练时间长和收敛速度慢的问题,提出一种将引导式学习和优选经验回放机制相结合融入DDPG的算法。改进的DDPG算法在训练初期的动作输出为引导式学习和策略网络共同作用的结果,后期引导式学习不再参与控制。同时引入经... 针对传统的DDPG算法训练时间长和收敛速度慢的问题,提出一种将引导式学习和优选经验回放机制相结合融入DDPG的算法。改进的DDPG算法在训练初期的动作输出为引导式学习和策略网络共同作用的结果,后期引导式学习不再参与控制。同时引入经验池分离技术,将优势经验样本和劣势经验样本分开存储和固定比例随机抽取。在TORCS平台上进行车辆决策测试,结果表明,改进后的DDPG离,提高算法效率。 展开更多
关键词 深度确定性策略梯度算法 引导式学习 优选经验回放 TORCS
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部