摘要
在自动驾驶决策层的换道行为中,针对换道决策行为需要在复杂且不稳定的交通环境中保持高速率和高安全性的问题,提出一种以深度强化学习为核心的自动驾驶换道决策模型。该模型使用DQN算法将环境感知层的数据传入用神经网络表示的Q函数,神经网络输出最优策略,然后根据当前策略预测自动驾驶车辆与环境车辆的行驶轨迹,使自动驾驶车辆与环境车辆的距离始终大于最小安全距离,以此来减少当前决策在后续行驶途中潜在的危险。仿真实验结果表明,相较于DQN换道模型,改进的换道决策模型在保持车辆高速行驶的同时,换道决策成功率也提高了11.89%。
出处
《信息技术与信息化》
2023年第6期198-202,共5页
Information Technology and Informatization