-
题名模仿学习综述:传统与新进展
- 1
-
-
作者
张超
白文松
杜歆
柳伟杰
周晨浩
钱徽
-
机构
浙江大学计算机科学与技术学院
浙江大学信息与电子工程学院
-
出处
《中国图象图形学报》
CSCD
北大核心
2023年第6期1585-1607,共23页
-
基金
国家自然科学基金项目(62206248)
国家重点研发计划资助(2020AAA0107400)。
-
文摘
模仿学习是强化学习与监督学习的结合,目标是通过观察专家演示,学习专家策略,从而加速强化学习。通过引入任务相关的额外信息,模仿学习相较于强化学习,可以更快地实现策略优化,为缓解低样本效率问题提供了解决方案。模仿学习已成为解决强化学习问题的一种流行框架,涌现出多种提高学习性能的算法和技术。通过与图形图像学的最新研究成果相结合,模仿学习已经在游戏人工智能(artificial intelligence,AI)、机器人控制和自动驾驶等领域发挥了重要作用。本文围绕模仿学习的年度发展,从行为克隆、逆强化学习、对抗式模仿学习、基于观察量的模仿学习和跨领域模仿学习等多个角度进行深入探讨,介绍了模仿学习在实际应用上的最新情况,比较了国内外研究现状,并展望了该领域未来的发展方向。旨在为研究人员和从业人员提供模仿学习的最新进展,从而为开展工作提供参考与便利。
-
关键词
模仿学习(il)
强化学习
基于观察量的模仿学习(ilfO)
跨领域模仿学习(CDil)
模仿学习应用
-
Keywords
imitation learning(il)
reinforcement learning
imitation learning form observation(ilfO)
cross domain imitation learning(CDil)
application of imitation learning
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-