检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

机器学习中加速强化学习的一种函数方法: 1; 作者宋炯金钊杨维和《云南大学学报（自然科学版）》 CAS CSCD 北大核心 2011年第S2期176-181,共6页; 机器学习中值函数需要反复更新直至其收敛是造成强化学习速度慢的根本原因.提出一种可实现批量更新值函数的学习方法,从加快值函数收敛的角度来加速强化学习.通过在训练情节中记录下从初始状态到达当前状态的状态转换序列,从中求出其它... 展开更多; 关键词强化学习值函数最短状态路径加速学习栅格环境; 原文传递

	题名	作者	出处	发文年	被引量	操作
1	机器学习中加速强化学习的一种函数方法	宋炯金钊杨维和	《云南大学学报（自然科学版）》 CAS CSCD 北大核心	2011	0	原文传递

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部