期刊文献+

深度强化学习算法与应用研究现状综述 被引量:35

An overview on algorithms and applications of deep reinforcement learning
下载PDF
导出
摘要 深度强化学习主要被用来处理感知-决策问题,已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习算法,详细阐述了深度Q网络、深度策略梯度及相关改进算法的原理,并综述了深度强化学习在视频游戏、导航、多智能体协作以及推荐系统等领域的应用研究进展。最后,对深度强化学习的算法和应用进行展望,针对一些未来的研究方向和研究热点给出了建议。 Deep reinforcement learning(DRL)is mainly applied to solve the perception-decision problem,and has become an important research branch in the field of artificial intelligence.Two kinds of DRL algorithms based on value function and policy gradient were summarized,including deep Q network,policy gradient as well as related developed algorithms.In addition,the applications of DRL in video games,navigation,multi-agent cooperation and recommendation field were intensively reviewed.Finally,a prospect for the future research of DRL was made,and some research suggestions were given.
作者 刘朝阳 穆朝絮 孙长银 LIU Zhaoyang;MU Chaoxu;SUN Changyin(School of Electrical and Information Engineering,Tianjin University,Tianjin 300072,China;School of Automation,Southeast University,Nanjing 210096,China)
出处 《智能科学与技术学报》 2020年第4期314-326,共13页 Chinese Journal of Intelligent Science and Technology
基金 国家自然科学基金资助项目(No.61773284)
关键词 人工智能 深度强化学习 值函数 策略梯度 导航 协作 复杂环境 泛化性 鲁棒性 artificial intelligence deep reinforcement learning value function policy gradient navigation cooperation complex environment generalization robustness
  • 相关文献

参考文献6

二级参考文献140

共引文献699

同被引文献304

引证文献35

二级引证文献109

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部