期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于考虑状态分布的深度确定性策略梯度算法的端到端自动驾驶策略 被引量:5
1
作者 王庭晗 罗禹贡 +1 位作者 刘金鑫 李克强 《清华大学学报(自然科学版)》 CSCD 北大核心 2021年第9期881-888,共8页
端到端方法是实现自动驾驶的方法之一,而自动驾驶的场景较为丰富,不同场景的特征差别较大,这使得基于强化学习的端到端自动驾驶方法训练时的随机性衰减速度难以确定,若衰减过快,在面对新场景时无法获得较好的自动驾驶效果,反之则会使得... 端到端方法是实现自动驾驶的方法之一,而自动驾驶的场景较为丰富,不同场景的特征差别较大,这使得基于强化学习的端到端自动驾驶方法训练时的随机性衰减速度难以确定,若衰减过快,在面对新场景时无法获得较好的自动驾驶效果,反之则会使得算法难以快速收敛。针对这一问题,该文提出了一种基于输入状态分布筛选的随机策略和经验回放方法,将当前输入的状态数据和已保存的状态数据之间的距离进行对比,根据不同的距离选择不同的随机策略参数,同时在经验回放时提高出现频率较低场景的回放概率。仿真结果表明:该算法在训练后期面对与前期数据分布差异较大的场景时仍有足够的探索能力,提高了基于深度确定性策略梯度算法的端到端自动驾驶策略在全新工况下的车道保持能力。 展开更多
关键词 端到端自动驾驶 强化学习 随机策略 经验回放
原文传递
端到端自动驾驶方法的发展现状
2
作者 王庭晗 罗禹贡 李克强 《中国基础科学》 2019年第S01期36-46,F0002,共12页
端到端自动驾驶方法作为卖现自动驾驶的方法之-',相对于“感知-决策-栓制”方法,有着思路简单、感知信息利用克分、工况过渡平滑的优点,目裔越来越多的学者对其开展研老。本丈青先讨论了卖现自动驾驶的两种方法;第二,呵顾了端到端... 端到端自动驾驶方法作为卖现自动驾驶的方法之-',相对于“感知-决策-栓制”方法,有着思路简单、感知信息利用克分、工况过渡平滑的优点,目裔越来越多的学者对其开展研老。本丈青先讨论了卖现自动驾驶的两种方法;第二,呵顾了端到端旨动驾驶方法发展的易史幷将其分为3个阶段,即1989-2005年、2006-2015年和2016年至今;第三,总体概述了研老现状,卖现算法主要为谦度神经网络和深度增强学习等,并对基于不同算法的相关研老进行了详细论述.;最后,对端到端自动驾飒研老进行了总结。 展开更多
关键词 端到端自动驾驶方法 发展现状 深度神经网络 深度增强学习
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部