期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
交互式动态影响图及其精确求解算法 被引量:1
1
作者 李波 曹浪财 庄进发 《解放军理工大学学报(自然科学版)》 EI 北大核心 2011年第2期119-124,共6页
为了表示部分可观察马尔可夫环境下,多Agent决策中各Agent之间的动态结构关系,对影响图(IDs)在结构和时间上进行扩展,形成一种能够对其他Agent建模的决策模型:交互式动态影响图(I-DIDs)。I-DIDs是不确定环境下多Agent进行序贯决策的图... 为了表示部分可观察马尔可夫环境下,多Agent决策中各Agent之间的动态结构关系,对影响图(IDs)在结构和时间上进行扩展,形成一种能够对其他Agent建模的决策模型:交互式动态影响图(I-DIDs)。I-DIDs是不确定环境下多Agent进行序贯决策的图模型。该模型的解是在对其Agent行为概率分布的预测下提供给该Agent的最优决策,能更有效地解决多Agent的决策问题。但I-DIDs状态空间太大,Agents候选模型空间随着时间片的增加成指数级增长,使计算变得复杂。因此,提出了一种基于行为等价的最小化模型集合的方法,通过限制模型增长来缓解模型空间不断扩大的趋势,以达到简化计算的目的。在模型实例上的仿真实验结果显示了该算法的有效性。 展开更多
关键词 多AGENT决策 交互式动态影响图 行为等价 最小模型更新集
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部