期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
模仿学习综述:传统与新进展
1
作者 张超 白文松 +3 位作者 杜歆 柳伟杰 周晨浩 钱徽 《中国图象图形学报》 CSCD 北大核心 2023年第6期1585-1607,共23页
模仿学习是强化学习与监督学习的结合,目标是通过观察专家演示,学习专家策略,从而加速强化学习。通过引入任务相关的额外信息,模仿学习相较于强化学习,可以更快地实现策略优化,为缓解低样本效率问题提供了解决方案。模仿学习已成为解决... 模仿学习是强化学习与监督学习的结合,目标是通过观察专家演示,学习专家策略,从而加速强化学习。通过引入任务相关的额外信息,模仿学习相较于强化学习,可以更快地实现策略优化,为缓解低样本效率问题提供了解决方案。模仿学习已成为解决强化学习问题的一种流行框架,涌现出多种提高学习性能的算法和技术。通过与图形图像学的最新研究成果相结合,模仿学习已经在游戏人工智能(artificial intelligence,AI)、机器人控制和自动驾驶等领域发挥了重要作用。本文围绕模仿学习的年度发展,从行为克隆、逆强化学习、对抗式模仿学习、基于观察量的模仿学习和跨领域模仿学习等多个角度进行深入探讨,介绍了模仿学习在实际应用上的最新情况,比较了国内外研究现状,并展望了该领域未来的发展方向。旨在为研究人员和从业人员提供模仿学习的最新进展,从而为开展工作提供参考与便利。 展开更多
关键词 模仿学习(il) 强化学习 基于观察量的模仿学习(ilfO) 跨领域模仿学习(CDil) 模仿学习应用
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部