期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
多Agent动态影响图及其一种近似推理算法研究 被引量:14
1
作者 姚宏亮 王浩 +1 位作者 张佑生 汪荣贵 《计算机学报》 EI CSCD 北大核心 2008年第2期236-244,共9页
针对多Agent影响图不能建模动态环境和多Agent马尔可夫决策过程难以表示Agents之间结构关系的问题,提出一种新决策模型——多Agent动态影响图(MADIDs).为了能有效地对MADIDs进行推理,提出一种扩展的BK(EBK)近似推理算法,其扩展体现在三... 针对多Agent影响图不能建模动态环境和多Agent马尔可夫决策过程难以表示Agents之间结构关系的问题,提出一种新决策模型——多Agent动态影响图(MADIDs).为了能有效地对MADIDs进行推理,提出一种扩展的BK(EBK)近似推理算法,其扩展体现在三个方面:在BK算法中加入效用结点的边际化操作,加入分割团来减小BK算法的推理误差,使用MADIDs分层分解所生成的联合树来降低推理的复杂性.在模型实例上的实验结果显示了MADIDs模型和EBK算法的有效性. 展开更多
关键词 多agent影响 多agent动态影响 联合树 BK算法
下载PDF
多Agent动态影响图的近似计算方法 被引量:4
2
作者 姚宏亮 王浩 +1 位作者 汪荣贵 李俊照 《计算机研究与发展》 EI CSCD 北大核心 2008年第3期487-495,共9页
由于复杂系统具有高维性和不确定性常难以表示处理,因而知识表示和计算方法是复杂系统研究中的公开难题.当前,多Agent影响图不能建模动态环境和多Agent,马尔可夫决策过程难以表示A-gents之间结构关系的问题,因而提出一种用局部概率因式... 由于复杂系统具有高维性和不确定性常难以表示处理,因而知识表示和计算方法是复杂系统研究中的公开难题.当前,多Agent影响图不能建模动态环境和多Agent,马尔可夫决策过程难以表示A-gents之间结构关系的问题,因而提出一种用局部概率因式表示动态环境中多Agent之间关系的新决策模型——多Agent动态影响图(MADIDs).针对MADIDs模型的联合概率分布和联合效用函数在计算上的高维问题,研究该模型的近似计算方法.给出MADIDs概率结构部分的一种分层分解的分布近似方法,并通过对该近似方法的误差和复杂性的分析,给出一个可对近似分布的精度和复杂性进行均衡的函数δ(k);给出一种BP神经网络通过局部效用的学习来近似计算MADIDs的联合效用.在模型实例上的实验结果显示了MADIDs模型近似计算方法的有效性. 展开更多
关键词 影响 多agent动态影响 KL差分 联合树 EBK算法
下载PDF
多Agent动态影响图的一种混合近似推理算法 被引量:2
3
作者 姚宏亮 王秀芳 +2 位作者 胡大伟 王浩 茆美琴 《计算机研究与发展》 EI CSCD 北大核心 2011年第4期584-591,共8页
多Agent动态影响图模型适合于对动态环境中多Agent问题进行建模,Agent之间结构关系被表示成局部的概率因式形式.概率图模型推理所面临的一个主要问题是难以实现近似推理的精度和复杂性之间的均衡.近似推理方法可提高推理精度,但同时也... 多Agent动态影响图模型适合于对动态环境中多Agent问题进行建模,Agent之间结构关系被表示成局部的概率因式形式.概率图模型推理所面临的一个主要问题是难以实现近似推理的精度和复杂性之间的均衡.近似推理方法可提高推理精度,但同时也会带来推理精度的损失.BK和粒子滤波(PF)是动态概率模型两种重要的近似推理算法,BK算法有较高的计算效率但会引入较大的误差,PF可以近似任意分布但存在计算的高维问题.结合BK和PF的优点,提出多Agent动态影响图(MADIDs)的一种混合近似推理算法.根据概率图模型的可分解性,将MADIDs分解生成用于推理的原型联合树,混合近似推理算法在规模复杂度较小的团上执行PF推理以达到局部最佳估计,而在其他的团上执行BK推理,为了减小推理误差引入了分割团.仿真实验表明混合近似推理算法是MADIDs模型的一种有效推理方法,与BK和PF算法相比,该算法显著提高了推理精度,且可以实现推理精度和时间复杂性之间的均衡. 展开更多
关键词 BK算法 粒子滤波 多agent动态影响 联合树 混合近似推理算法
下载PDF
基于多Agent动态影响图的协作实现 被引量:1
4
作者 姚宏亮 王浩 +2 位作者 张佑生 汪荣贵 方宝富 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第14期3270-3275,共6页
将MAIDs在时间上进行扩展,提出一种新决策模型——多Agent动态影响图(MADIDs),对动态环境中的协作关系进行建模;给出MADIDs的一种分层分解的分布近似方法,进而通过将决策结点和效用结点的推理引入到BK算法中,给出MADIDs环境模型的一种扩... 将MAIDs在时间上进行扩展,提出一种新决策模型——多Agent动态影响图(MADIDs),对动态环境中的协作关系进行建模;给出MADIDs的一种分层分解的分布近似方法,进而通过将决策结点和效用结点的推理引入到BK算法中,给出MADIDs环境模型的一种扩展BK(EBK)近似推理算法;引入一种BP神经网络学习MADIDs的局部效用函数。最后,针对一个表示协作关系的MADID模型,进行算法比较和仿真实验,实验结果显示了MADIDs模型的有效性。 展开更多
关键词 多agent影响 多agent动态影响 联合树 BK算法
下载PDF
基于多Agent的交互式动态影响图研究、应用与展望 被引量:1
5
作者 罗键 李波 +2 位作者 潘颖慧 尹华一 吴长庆 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第2期253-260,共8页
交互式动态影响图(I-DIDs)是不确定环境下多Agent序贯决策的图模型.该模型突破传统基于公共知识的纳什均衡点的假设,使得该模型具备解决大规模动态决策问题的能力,具有更为广泛的应用前景.在总结、分析动态影响图研究成果的基础上,针对... 交互式动态影响图(I-DIDs)是不确定环境下多Agent序贯决策的图模型.该模型突破传统基于公共知识的纳什均衡点的假设,使得该模型具备解决大规模动态决策问题的能力,具有更为广泛的应用前景.在总结、分析动态影响图研究成果的基础上,针对多Agent的I-DIDs状态空间随时间片的增长呈指数级增长问题,提出了基于行为等价和动作等价的两种新型算法并进行算法分析;此外,探讨应用I-DIDs模型解决自动小车存取系统中的路径规划、避免环路死锁问题,扩展了I-DIDs的应用范围. 展开更多
关键词 交互式动态影响 多agent 动态决策 自动小车
下载PDF
多Agent交互式动态影响图的建模方法 被引量:2
6
作者 潘颖慧 罗键 曾一锋 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第6期985-990,共6页
交互式动态影响图是一种以动态影响图为基础,利用有向图构造Agent之间交互作用的决策概率模型,目前只能解决2个Agent的问题.根据概率图模型理论、交互式部分可观测马尔可夫决策过程性质、最大奖励期望值原理等以3个Agent为例建立多Agen... 交互式动态影响图是一种以动态影响图为基础,利用有向图构造Agent之间交互作用的决策概率模型,目前只能解决2个Agent的问题.根据概率图模型理论、交互式部分可观测马尔可夫决策过程性质、最大奖励期望值原理等以3个Agent为例建立多Agent交互式动态影响图(I-MADIDs)模型,探讨除建模Agent之外,其他非建模Agent之间存在稳定关系时,如何简化I-MADIDs模型.最后对老虎问题进行建模,利用HUGIN7.0对其进行求解,分别讨论了建模A-gent和其他Agent的决策情况,对比了精确方法和简化模型中贝叶斯参数学习近似方法中Agent的决策情况,证明了近似方法的有效性. 展开更多
关键词 交互式动态影响 多agent建模 概率模型
下载PDF
交互式动态影响图及其精确求解算法 被引量:1
7
作者 李波 曹浪财 庄进发 《解放军理工大学学报(自然科学版)》 EI 北大核心 2011年第2期119-124,共6页
为了表示部分可观察马尔可夫环境下,多Agent决策中各Agent之间的动态结构关系,对影响图(IDs)在结构和时间上进行扩展,形成一种能够对其他Agent建模的决策模型:交互式动态影响图(I-DIDs)。I-DIDs是不确定环境下多Agent进行序贯决策的图... 为了表示部分可观察马尔可夫环境下,多Agent决策中各Agent之间的动态结构关系,对影响图(IDs)在结构和时间上进行扩展,形成一种能够对其他Agent建模的决策模型:交互式动态影响图(I-DIDs)。I-DIDs是不确定环境下多Agent进行序贯决策的图模型。该模型的解是在对其Agent行为概率分布的预测下提供给该Agent的最优决策,能更有效地解决多Agent的决策问题。但I-DIDs状态空间太大,Agents候选模型空间随着时间片的增加成指数级增长,使计算变得复杂。因此,提出了一种基于行为等价的最小化模型集合的方法,通过限制模型增长来缓解模型空间不断扩大的趋势,以达到简化计算的目的。在模型实例上的仿真实验结果显示了该算法的有效性。 展开更多
关键词 多agent决策 交互式动态影响 行为等价 最小模型更新集
下载PDF
基于博弈动态影响图的股市趋势推理算法
8
作者 姚宏亮 尹致远 +1 位作者 杨静 俞奎 《计算机科学》 CSCD 北大核心 2023年第S02期593-599,共7页
股票市场是一个复杂非线性动态系统,具有高度不确定性和多变性,股市趋势预测是数据挖掘领域的一个研究热点。针对基于数据驱动方法所生成的模型鲁棒性差,训练良好的模型不适应实际需要的问题,提出了一种多Agent博弈动态影响图模型(Mulit... 股票市场是一个复杂非线性动态系统,具有高度不确定性和多变性,股市趋势预测是数据挖掘领域的一个研究热点。针对基于数据驱动方法所生成的模型鲁棒性差,训练良好的模型不适应实际需要的问题,提出了一种多Agent博弈动态影响图模型(Mulit-Agent Game Dynamic Influence Diagrams,MAGDIDs)。首先,从博弈的角度引入多方和空方作为股市的行为主体(Agent),提取行为主体的相关特征;然后,利用能量表示博弈主体的力量大小,并对行为主体特征进行量化融合;进而引入博弈策略,构建多Agent博弈动态影响图模型,对于股市行为主体的博弈过程进行建模;最后,利用联合树的自动推理技术,预测股市趋势。在实际数据上进行实验,实验结果表明多空博弈趋势预测算法具有良好性能。 展开更多
关键词 博弈 多agent 鲁棒性 联合树 动态影响
下载PDF
基于KL距离的交互式动态影响图近似算法 被引量:2
9
作者 田乐 罗键 +1 位作者 曹浪财 陈志平 《系统工程与电子技术》 EI CSCD 北大核心 2013年第1期207-211,共5页
交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)状态空间太大,候选模型的数量随时间变化而呈指数倍增长。针对其备受计算量困扰的问题,提出一种利用近似行为等价原理与区别模型更新算法(discriminative model update... 交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)状态空间太大,候选模型的数量随时间变化而呈指数倍增长。针对其备受计算量困扰的问题,提出一种利用近似行为等价原理与区别模型更新算法(discriminative model updates,DMU)相结合的近似算法。首先给出了基于Kullback-Leibler(KL)距离模型行为等价和近似行为等价的定义,然后基于KL距离和候选模型的动作对候选模型聚类,自上而下合并策略树形成策略图,最后利用DMU算法进行求解。仿真结果表明,相对于传统的DMU算法,所提近似算法能显著降低候选模型的数量,提高I-DIDs的效率,对I-DIDs的理论及应用研究具有参考价值。 展开更多
关键词 多agent决策 交互式动态影响 行为等价 近似行为等价 Kullback—Leibler(KL)距离
下载PDF
基于lookahead的交互式动态影响图的DMU改进算法
10
作者 田乐 曹浪财 《系统工程与电子技术》 EI CSCD 北大核心 2014年第6期1201-1206,共6页
区别模型更新(discriminative model update,DMU)是一种常用的求解交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)问题的算法。结合lookahead思想提出了一种判断模型近似行为等价的改进DMU方法。所提方法首先将满足... 区别模型更新(discriminative model update,DMU)是一种常用的求解交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)问题的算法。结合lookahead思想提出了一种判断模型近似行为等价的改进DMU方法。所提方法首先将满足近似行为等价的模型聚类形成代表模型集合,然后自上而下对代表模型进行更新,在模型更新过程中,只更新那些与其他模型预测行为不同的模型。结合lookahead思想提出了一种判断模型近似行为等价的方法。与DMU算法相比,该算法能迅速有效地减少模型的数量,从而减少了计算机的存储空间和运行时间,提高了算法的效率。最后通过对多Agent老虎问题及机器维修问题实验来验证所提方法的有效性。 展开更多
关键词 多agent 决策 交互式动态影响 行为等价 近似行为等价 前瞻
下载PDF
基于动态贝叶斯网络的多Agent交互的模型表示 被引量:6
11
作者 姚宏亮 王浩 胡学刚 《计算机工程》 CAS CSCD 北大核心 2003年第16期57-59,共3页
动态贝叶斯网络(Dynamic Bayesian Networks,DBNs)是对具有随机过程性质的不确定性问题进行建模和处理的一个有力工具。该文将Agents技术和DBNs相结合来对两个以上的人的行为进行建模。提出一种分解和合并的方法来解决两个以上的Agent... 动态贝叶斯网络(Dynamic Bayesian Networks,DBNs)是对具有随机过程性质的不确定性问题进行建模和处理的一个有力工具。该文将Agents技术和DBNs相结合来对两个以上的人的行为进行建模。提出一种分解和合并的方法来解决两个以上的Agents构成的DBNs的模型表示在计算上的难以处理性,同时还提高了模型的表示能力,且能表示变量之间互为因果的关系。 展开更多
关键词 动态贝叶斯网络 多agent系统 隐含马尔可夫模型 影响
下载PDF
多Agent动态影响图及其概率分布的近似方法 被引量:2
12
作者 姚宏亮 王浩 +1 位作者 张佑生 俞奎 《模式识别与人工智能》 EI CSCD 北大核心 2007年第4期525-532,共8页
将多 Agent 影响图(MAIDs)在时间上进行扩展,提出一种决策模型:多 Agent 动态影响图(MADIDs),用于表示动态环境中多 Agent 协作的结构关系.为了有效计算 MADIDs 的概率分布,以 Agents 之间的策略偏序关系为指导,给出概率分布的一种分解... 将多 Agent 影响图(MAIDs)在时间上进行扩展,提出一种决策模型:多 Agent 动态影响图(MADIDs),用于表示动态环境中多 Agent 协作的结构关系.为了有效计算 MADIDs 的概率分布,以 Agents 之间的策略偏序关系为指导,给出概率分布的一种分解近似方法,进而讨论概率分布在推理中的近似.对 MADIDs 概率分布计算的复杂性、误差以及误差在时间上的传播进行分析,进而基于 KL 差分,给出一个可对近似分布的精度和复杂性进行均衡的函数.最后,针对一个表示协作关系的 MADID 模型,进行实验和算法比较,实验结果显示该概率分布近似方法的有效性. 展开更多
关键词 多agent动态影响(madids) KL差分 联合树 扩展BK(EBK)算法
原文传递
交互式动态影响图的一种近似求解算法 被引量:3
13
作者 李波 罗键 +1 位作者 庄进发 尹华一 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第10期64-68,共5页
提出一种基于行为等价原理分段处理交互式动态影响图(I-DID)的近似算法:先将底层I-DID模型分解成包含若干时间片的子片段,求解首片段,获得各模型的策略树,并依行为等价原理合并策略树,形成策略图,其结果作为下一片段的初始模型,再进行求... 提出一种基于行为等价原理分段处理交互式动态影响图(I-DID)的近似算法:先将底层I-DID模型分解成包含若干时间片的子片段,求解首片段,获得各模型的策略树,并依行为等价原理合并策略树,形成策略图,其结果作为下一片段的初始模型,再进行求解.重复这个过程,直到最后片段结束,获得完全策略图,用来指导agent是否进行模型更新.最后,针对多agent老虎问题进行试验和算法比较,试验结果从模型解的质量和模型空间大小2个方面验证了所提算法的有效性. 展开更多
关键词 多agent系统 agent建模 动态决策 交互式动态影响 行为等价 最小模型集
原文传递
一种交互式动态影响图的改进算法
14
作者 李波 罗键 +1 位作者 尹华一 田乐 《模式识别与人工智能》 EI CSCD 北大核心 2011年第4期506-513,共8页
交互式动态影响图(I-DIDs)是基于概率图形理论的多智能体动态交互决策的图模型.为缓解该模型状态空间随时间片增加呈指数级增长的趋势,文中基于行为等价的基本思想压缩状态空间,提出构建Epsilon行为等价类的方法:利用有向无环图表示其它... 交互式动态影响图(I-DIDs)是基于概率图形理论的多智能体动态交互决策的图模型.为缓解该模型状态空间随时间片增加呈指数级增长的趋势,文中基于行为等价的基本思想压缩状态空间,提出构建Epsilon行为等价类的方法:利用有向无环图表示其它Agent可能的信度和行为,把信度在空间上接近的模型聚为一类,实现自顶向下合并行为等价模型.该过程避免求解状态空间中的所有候选模型,节省了存储空间和计算时间.模型实例上的仿真结果显示了该算法的有效性. 展开更多
关键词 agent建模 交互式动态影响 动态决策 ε-行为等价 信度-行为
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部