期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
改进GA3C求解POMDP的深度强化学习网络模型
1
作者 陈晓军 康士伟 《电脑编程技巧与维护》 2019年第4期24-26,共3页
针对GA3C求解视频游戏中POMDP问题的特点,通过引入长短期记忆(Long-Short Term Memory, LSTM)保留游戏过程中多时间步的历史状态信息,与当前状态信息一同作为输入状态信息,该网络仅需对当前的1幅游戏截图进行预处理,网络输入状态空间的... 针对GA3C求解视频游戏中POMDP问题的特点,通过引入长短期记忆(Long-Short Term Memory, LSTM)保留游戏过程中多时间步的历史状态信息,与当前状态信息一同作为输入状态信息,该网络仅需对当前的1幅游戏截图进行预处理,网络输入状态空间的规模在每个训练时间步都得以缩小,只有原来传统网络的1/4,从而可以减小更新网络所需的计算量及存储要求,加快学习速度。同时LSTM有记忆机制,改进的网络模型将有利于加强求解POMDP问题的性能。 展开更多
关键词 ga3c求解 POMDP问题 学习网络模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部