检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

回报函数学习的学徒学习综述被引量：2: 1; 作者金卓军钱徽 +1 位作者陈沈轶朱淼良《智能系统学报》 2009年第3期208-212,共5页; 通过研究基于回报函数学习的学徒学习的发展历史和目前的主要工作,概述了基于回报函数学习的学徒学习方法.分别在回报函数为线性和非线性条件下讨论,并且在线性条件下比较了2类方法——基于逆向增强学习(IRL)和最大化边际规划(MMP)的学... 展开更多; 关键词学徒学习回报函数逆向增强学习最大化边际规划; 下载PDF 职称材料

基于倾向性分析的轨迹评测技术被引量：1: 2; 作者金卓军钱徽朱淼良《浙江大学学报（工学版）》 EI CAS CSCD 北大核心 2011年第10期1732-1737,共6页; 通过逆向增强学习和策略不变条件下的回报函数变形原理,研究已有标准轨迹前提下的车辆轨迹评测问题,提出基于倾向性分析的轨迹评测技术.对于标准轨迹和评测轨迹应用逆向增强学习算法,分别求出两者相对应的特征权重,将特征权重在策略不... 展开更多; 关键词轨迹评测倾向性分析回报函数变形逆向增强学习马尔可夫决策过程; 下载PDF 职称材料

基于回报函数逼近的学徒学习综述被引量：2: 3; 作者金卓军钱徽 +1 位作者陈沈轶朱淼良《华中科技大学学报（自然科学版）》 EI CAS CSCD 北大核心 2008年第S1期288-290,294,共4页; 回顾了基于回报函数逼近的学徒学习的发展历史,介绍了目前的主要工作,总结了学徒学习的一般方法,讨论了线性和非线性假设条件下的回报函数求解,比较了逆向增强学习(IRL)和边际最大化(MMP)两类逼近方法.基于IRL的学徒学习是一种通过迭代... 展开更多; 关键词学徒学习回报函数综述逆向增强学习边际最大化; 原文传递

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部