轨迹规划是自动驾驶汽车的基本功能。随着车用无线通信技术(Vehicle to everything,V2X)技术的发展,自动驾驶汽车具备智能网联功能,这些汽车被称为智能网联汽车。智能网联技术可以为自动驾驶汽车带来大量信息,增强不同自动驾驶汽车之间...轨迹规划是自动驾驶汽车的基本功能。随着车用无线通信技术(Vehicle to everything,V2X)技术的发展,自动驾驶汽车具备智能网联功能,这些汽车被称为智能网联汽车。智能网联技术可以为自动驾驶汽车带来大量信息,增强不同自动驾驶汽车之间的合作,并为轨迹规划提供额外的优化空间,以减少驾驶时间,提高驾驶舒适性和安全性。与传统的单车轨迹规划相比,多车轨迹规划可以充分利用智能网联汽车的技术优势,为多个自动驾驶汽车规划合适的轨迹。以结构化场景和非结构化场景的分类综述典型的多车轨迹规划应用场景,总结不同的多车轨迹规划合作规划策略和特点。总结用于多车轨迹规划的各种方法,包括传统的流水线规划方法和端到端方法,并对多车轨迹规划的试验进行归纳。基于当前研究现状,提出多车轨迹规划面临的挑战和未来的研究方向,为智能交通系统领域的研究人员提供启发和参考。展开更多
具有自进化能力的自动驾驶换道策略有望在复杂开放的交通环境中提升性能,以应对更多的未知场景。时序差分学习模型预测控制(Temporal difference learning for model predictive control,TD-MPC)结合有模型和无模型强化学习方法的优势,...具有自进化能力的自动驾驶换道策略有望在复杂开放的交通环境中提升性能,以应对更多的未知场景。时序差分学习模型预测控制(Temporal difference learning for model predictive control,TD-MPC)结合有模型和无模型强化学习方法的优势,具有学习效率高、性能优异的特点。基于此,为了提高自动驾驶换道策略的整体性能,提出基于TD-MPC的自动驾驶一体化换道策略。具体来说,针对自动换道问题,提出基于驾驶倾向网络的一体化自动驾驶换道策略架构,构建强化学习问题并设计完备的奖励函数,对决策规划优化问题进行统一求解。应用TD-MPC算法设计内部模型来预测未来状态和奖励,实现短时域内的局部轨迹优化,同时使用时序差分学习实现对长期汇报的估计,以得到驾驶倾向网络参数。所提出方法在高保真仿真环境中被验证,结果表明,所提出方法相比规则方案保证行驶效率,并且提高安全性和舒适性。同时与软演员-评论家算法(Soft actor critic,SAC)相比,实现了7~9倍的学习效率提升。展开更多
文摘轨迹规划是自动驾驶汽车的基本功能。随着车用无线通信技术(Vehicle to everything,V2X)技术的发展,自动驾驶汽车具备智能网联功能,这些汽车被称为智能网联汽车。智能网联技术可以为自动驾驶汽车带来大量信息,增强不同自动驾驶汽车之间的合作,并为轨迹规划提供额外的优化空间,以减少驾驶时间,提高驾驶舒适性和安全性。与传统的单车轨迹规划相比,多车轨迹规划可以充分利用智能网联汽车的技术优势,为多个自动驾驶汽车规划合适的轨迹。以结构化场景和非结构化场景的分类综述典型的多车轨迹规划应用场景,总结不同的多车轨迹规划合作规划策略和特点。总结用于多车轨迹规划的各种方法,包括传统的流水线规划方法和端到端方法,并对多车轨迹规划的试验进行归纳。基于当前研究现状,提出多车轨迹规划面临的挑战和未来的研究方向,为智能交通系统领域的研究人员提供启发和参考。
文摘具有自进化能力的自动驾驶换道策略有望在复杂开放的交通环境中提升性能,以应对更多的未知场景。时序差分学习模型预测控制(Temporal difference learning for model predictive control,TD-MPC)结合有模型和无模型强化学习方法的优势,具有学习效率高、性能优异的特点。基于此,为了提高自动驾驶换道策略的整体性能,提出基于TD-MPC的自动驾驶一体化换道策略。具体来说,针对自动换道问题,提出基于驾驶倾向网络的一体化自动驾驶换道策略架构,构建强化学习问题并设计完备的奖励函数,对决策规划优化问题进行统一求解。应用TD-MPC算法设计内部模型来预测未来状态和奖励,实现短时域内的局部轨迹优化,同时使用时序差分学习实现对长期汇报的估计,以得到驾驶倾向网络参数。所提出方法在高保真仿真环境中被验证,结果表明,所提出方法相比规则方案保证行驶效率,并且提高安全性和舒适性。同时与软演员-评论家算法(Soft actor critic,SAC)相比,实现了7~9倍的学习效率提升。