检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于内部结构MPoMDP模型的策略梯度学习算法被引量：1: 1; 作者张润梅王浩 +2 位作者张佑生姚宏亮方长胜《计算机工程与应用》 CSCD 北大核心 2009年第7期20-23,共4页; 为了提高MPOMDP模型的知识表示能力和推理效率,提出一种基于Agent内部结构的MPOMDP模型。该模型能表示Agent的内部结构及其时间演化,并通过将系统联合概率分布表示成每个Agent内部变量集的局部因式形式,以提高模型的推理效率。将GPI-PO... 展开更多; 关键词马尔可夫决策过程强化学习 mpomdp模型策略梯度算法; 下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于内部结构MPoMDP模型的策略梯度学习算法	张润梅王浩张佑生姚宏亮方长胜	《计算机工程与应用》 CSCD 北大核心	2009	1	下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部