期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于改进人工势场法的路径规划决策一体化算法研究 被引量:19
1
作者 袁朝春 翁烁丰 +3 位作者 何友国 SHENJie 陈龙 王桐 《农业机械学报》 EI CAS CSCD 北大核心 2019年第9期394-403,共10页
车辆路径规划与决策算法是无人驾驶汽车的重要研究方向之一。现有的路径规划与路径跟踪决策算法中规划层与决策层存在时滞现象,往往会引起检测信息与真实行驶环境信息的偏差,使得规划的局部路径不能反映当前真实状态,是无人驾驶汽车安... 车辆路径规划与决策算法是无人驾驶汽车的重要研究方向之一。现有的路径规划与路径跟踪决策算法中规划层与决策层存在时滞现象,往往会引起检测信息与真实行驶环境信息的偏差,使得规划的局部路径不能反映当前真实状态,是无人驾驶汽车安全行驶的不稳定因素。本文综合考虑了环境交通参与者与车辆自身运动学特征,建立了横纵向安全模型,对车辆目前行驶环境的风险特征进行了综合评估。在行驶环境特征与车辆动力学特征的基础上对传统人工势场法进行了改进,设计了基于虚拟力的局部路径规划与控制决策一体化算法,提升了算法在复杂动态环境下控制的可靠性。最后,利用Carsim/Simulink建立了联合仿真环境,分别对传统路径规划算法、路径跟踪算法与本文提出的路径决策规划一体化算法在典型工况下进行仿真。仿真结果表明,该算法能减小路径规划决策环节的时滞影响,为复杂动态环境下的无人驾驶车辆提供更加合理的控制方法。 展开更多
关键词 无人驾驶车辆 安全距离模型 改进人工势场法 路径规划决策一体化算法
下载PDF
基于时序差分学习模型预测控制的一体化自动驾驶换道策略
2
作者 杨硕 李时珍 +2 位作者 赵中原 黄小鹏 黄岩军 《机械工程学报》 EI CAS CSCD 北大核心 2024年第10期329-338,共10页
具有自进化能力的自动驾驶换道策略有望在复杂开放的交通环境中提升性能,以应对更多的未知场景。时序差分学习模型预测控制(Temporal difference learning for model predictive control,TD-MPC)结合有模型和无模型强化学习方法的优势,... 具有自进化能力的自动驾驶换道策略有望在复杂开放的交通环境中提升性能,以应对更多的未知场景。时序差分学习模型预测控制(Temporal difference learning for model predictive control,TD-MPC)结合有模型和无模型强化学习方法的优势,具有学习效率高、性能优异的特点。基于此,为了提高自动驾驶换道策略的整体性能,提出基于TD-MPC的自动驾驶一体化换道策略。具体来说,针对自动换道问题,提出基于驾驶倾向网络的一体化自动驾驶换道策略架构,构建强化学习问题并设计完备的奖励函数,对决策规划优化问题进行统一求解。应用TD-MPC算法设计内部模型来预测未来状态和奖励,实现短时域内的局部轨迹优化,同时使用时序差分学习实现对长期汇报的估计,以得到驾驶倾向网络参数。所提出方法在高保真仿真环境中被验证,结果表明,所提出方法相比规则方案保证行驶效率,并且提高安全性和舒适性。同时与软演员-评论家算法(Soft actor critic,SAC)相比,实现了7~9倍的学习效率提升。 展开更多
关键词 自动驾驶 强化学习 一体化决策规划
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部