期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度强化学习与扩展卡尔曼滤波相结合的交通信号灯配时方法
1
作者
吴兰
吴元明
+1 位作者
孔凡士
李斌全
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2022年第8期1353-1363,共11页
深度Q学习网络(DQN)因具有强大的感知能力和决策能力而成为解决交通信号灯配时问题的有效方法,然而外部环境扰动和内部参数波动等原因导致的参数不确定性问题限制了其在交通信号灯配时系统领域的进一步发展。基于此,提出了一种DQN与扩...
深度Q学习网络(DQN)因具有强大的感知能力和决策能力而成为解决交通信号灯配时问题的有效方法,然而外部环境扰动和内部参数波动等原因导致的参数不确定性问题限制了其在交通信号灯配时系统领域的进一步发展。基于此,提出了一种DQN与扩展卡尔曼滤波(EKF)相结合(DQN-EKF)的交通信号灯配时方法。以估计网络的不确定性参数值作为状态变量,包含不确定性参数的目标网络值作为观测变量,结合过程噪声、包含不确定性参数的估计网络值和系统观测噪声构造EKF系统方程,通过EKF的迭代更新求解,得到DQN模型中的最优真实参数估计值,解决DQN模型中的参数不确定性问题。实验结果表明:DQN-EKF配时方法适用于不同的交通环境,并能够有效提高车辆的通行效率。
展开更多
关键词
深度Q学习网络(DQN)
感知能力
决策能力
交通信号灯配时系统
参数不确定性
扩展卡尔曼滤波(EKF)
下载PDF
职称材料
题名
基于深度强化学习与扩展卡尔曼滤波相结合的交通信号灯配时方法
1
作者
吴兰
吴元明
孔凡士
李斌全
机构
河南工业大学电气工程学院
郑州铁路职业技术学院电气工程学院
出处
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2022年第8期1353-1363,共11页
基金
国家自然科学基金(61973103)
河南省软科学研究计划(212400410005)。
文摘
深度Q学习网络(DQN)因具有强大的感知能力和决策能力而成为解决交通信号灯配时问题的有效方法,然而外部环境扰动和内部参数波动等原因导致的参数不确定性问题限制了其在交通信号灯配时系统领域的进一步发展。基于此,提出了一种DQN与扩展卡尔曼滤波(EKF)相结合(DQN-EKF)的交通信号灯配时方法。以估计网络的不确定性参数值作为状态变量,包含不确定性参数的目标网络值作为观测变量,结合过程噪声、包含不确定性参数的估计网络值和系统观测噪声构造EKF系统方程,通过EKF的迭代更新求解,得到DQN模型中的最优真实参数估计值,解决DQN模型中的参数不确定性问题。实验结果表明:DQN-EKF配时方法适用于不同的交通环境,并能够有效提高车辆的通行效率。
关键词
深度Q学习网络(DQN)
感知能力
决策能力
交通信号灯配时系统
参数不确定性
扩展卡尔曼滤波(EKF)
Keywords
deep Q-learning network(DQN)
perception ability
decision making ability
traffic signal timing system
parameter uncertainty
extended Kalman filter(EKF)
分类号
V221.3 [航空宇航科学与技术—飞行器设计]
TB553 [理学—声学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度强化学习与扩展卡尔曼滤波相结合的交通信号灯配时方法
吴兰
吴元明
孔凡士
李斌全
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2022
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部