期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
回报函数学习的学徒学习综述 被引量:2
1
作者 金卓军 钱徽 +1 位作者 陈沈轶 朱淼良 《智能系统学报》 2009年第3期208-212,共5页
通过研究基于回报函数学习的学徒学习的发展历史和目前的主要工作,概述了基于回报函数学习的学徒学习方法.分别在回报函数为线性和非线性条件下讨论,并且在线性条件下比较了2类方法——基于逆向增强学习(IRL)和最大化边际规划(MMP)的学... 通过研究基于回报函数学习的学徒学习的发展历史和目前的主要工作,概述了基于回报函数学习的学徒学习方法.分别在回报函数为线性和非线性条件下讨论,并且在线性条件下比较了2类方法——基于逆向增强学习(IRL)和最大化边际规划(MMP)的学徒学习.前者有较为快速的近似算法,但对于演示的最优性作了较强的假设;后者形式上更易于扩展,但计算量大.最后,提出了该领域现在还存在的问题和未来的研究方向,如把学徒学习应用于POMDP环境下,用PBVI等近似算法或者通过PCA等降维方法对数据进行学习特征的提取,从而减少高维度带来的大计算量问题. 展开更多
关键词 学徒学习 回报函数 逆向增强学习 最大化边际规划
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部