期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
交互式动态影响图的一种近似求解算法
被引量:
3
1
作者
李波
罗键
+1 位作者
庄进发
尹华一
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第10期64-68,共5页
提出一种基于行为等价原理分段处理交互式动态影响图(I-DID)的近似算法:先将底层I-DID模型分解成包含若干时间片的子片段,求解首片段,获得各模型的策略树,并依行为等价原理合并策略树,形成策略图,其结果作为下一片段的初始模型,再进行求...
提出一种基于行为等价原理分段处理交互式动态影响图(I-DID)的近似算法:先将底层I-DID模型分解成包含若干时间片的子片段,求解首片段,获得各模型的策略树,并依行为等价原理合并策略树,形成策略图,其结果作为下一片段的初始模型,再进行求解.重复这个过程,直到最后片段结束,获得完全策略图,用来指导agent是否进行模型更新.最后,针对多agent老虎问题进行试验和算法比较,试验结果从模型解的质量和模型空间大小2个方面验证了所提算法的有效性.
展开更多
关键词
多AGENT系统
AGENT建模
动态决策
交互式动态影响图
行为等价
最小模型集
原文传递
题名
交互式动态影响图的一种近似求解算法
被引量:
3
1
作者
李波
罗键
庄进发
尹华一
机构
厦门
大学自动化系
厦门东南融通系统工程有限公司博士后科研工作站
解放军信息
工程
大学通信与信息系
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第10期64-68,共5页
基金
国家自然科学基金资助项目(60975052)
文摘
提出一种基于行为等价原理分段处理交互式动态影响图(I-DID)的近似算法:先将底层I-DID模型分解成包含若干时间片的子片段,求解首片段,获得各模型的策略树,并依行为等价原理合并策略树,形成策略图,其结果作为下一片段的初始模型,再进行求解.重复这个过程,直到最后片段结束,获得完全策略图,用来指导agent是否进行模型更新.最后,针对多agent老虎问题进行试验和算法比较,试验结果从模型解的质量和模型空间大小2个方面验证了所提算法的有效性.
关键词
多AGENT系统
AGENT建模
动态决策
交互式动态影响图
行为等价
最小模型集
Keywords
multi-agent system
agent modeling
dynamic decision-making
interactive dynamic influence diagrams(I-DID)
behaviorally equivalence
minimal model set
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
原文传递
题名
作者
出处
发文年
被引量
操作
1
交互式动态影响图的一种近似求解算法
李波
罗键
庄进发
尹华一
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011
3
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部