-
题名改进深度Q网络的无人车换道决策算法研究
被引量:1
- 1
-
-
作者
张鑫辰
张军
刘元盛
路铭
谢龙洋
-
机构
北京联合大学北京市信息服务工程重点实验室
北京联合大学机器人学院
北京联合大学应用科技学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2022年第7期266-275,共10页
-
基金
国家自然科学基金(61871038,61871039)
北京联合大学科研项目(ZK130202002)
+2 种基金
北京联合大学人才强校优选-拔尖计划(BPHR2020BZ01)
北京联合大学研究生科研创新项目(YZ2020K001)
低速无人驾驶关键技术研究与成果转化项目(XP202017)。
-
文摘
深度Q网络(deep Q network,DQN)模型已被广泛应用于高速公路场景中无人车换道决策,但传统的DQN存在过估计且收敛速度较慢的问题。针对此问题提出了基于改进深度Q网络的无人车换道决策模型。将得到的状态值分别输入到两个结构相同而参数更新频率不同的神经网络中,以此来减少经验样本之间的相关性,然后将隐藏层输出的无人车状态信息同时输入到状态价值函数(state value function)流和动作优势函数(action advantage function)流中,从而更准确地得到模型中每个动作对应的Q值,再采用优先级经验回放(prioritized experience replay,PER)的方式从经验回放单元中抽取经验样本,增加经验回放单元中重要样本的利用率。在NGSIM数据集搭建的实验场景中进行模型的训练和测试,实验结果表明,改进的深度Q网络模型可以使无人车更好地理解环境中的状态变化,提高了换道决策成功率的同时网络的收敛速度也得到提升。
-
关键词
无人车
换道决策
状态价值函数
动作优势函数
优先级经验回放
-
Keywords
autonomous vehicle
lane change strategy
state value function
action advantage function
prioritized experience replay
-
分类号
U463.6
[机械工程—车辆工程]
TP39
[自动化与计算机技术—计算机应用技术]
-