-
题名基于加权密集连接卷积网络的深度强化学习方法
被引量:9
- 1
-
-
作者
夏旻
宋稳柱
施必成
刘佳
-
机构
南京信息工程大学信息与控制学院
-
出处
《计算机应用》
CSCD
北大核心
2018年第8期2141-2147,共7页
-
基金
国家自然科学基金资助项目(61503192
61773219)
+2 种基金
江苏省自然科学基金资助项目(BK20161533)
江苏省六大人才高峰项目(2014-XXRJ-007)
江苏省青蓝工程项目~~
-
文摘
针对深度强化学习中卷积神经网络(CNN)层数过深导致的梯度消失问题,提出一种将密集连接卷积网络应用于强化学习的方法。首先,利用密集连接卷积网络中的跨层连接结构进行图像特征的有效提取;然后,在密集连接卷积网络中加入权重系数,加权密集连接卷积网络中的每一层都接收到前面几层产生的所有特征图,且之前所有层在跨层连接中被赋予不同的初始权重;最后,在训练中动态调整每层的权重,从而更加有效地提取特征。与常规深度强化学习方法相比,在GridWorld仿真实验中,在相同训练步数内的平均奖励值提升了85.67%;在FlappyBird仿真中,平均奖励值提升了55.05%。实验结果表明所提方法能在不同难度的游戏仿真实验中获得更好的性能。
-
关键词
密集连接卷积网络
深度强化学习
GridWorld
FlappyBird
跨层连接
-
Keywords
Densely Connected Convolutional Network (DenseNet)
deep reinforcement learning
gridwodd
FlappyBird
skip-connection
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-