-
题名对两种估计单属性关系大小方法的可信度讨论
- 1
-
-
作者
黄平
须德
张全寿
-
机构
北方交通大学计算机科学技术系
-
出处
《北方交通大学学报》
CSCD
北大核心
1993年第4期416-419,共4页
-
文摘
估计两个单属性关系在连接属性上取相同值的个数的方法有两种:静态估计法和动态估计法.本文利用不精确性推理模型对这两种方法的可信度定量地进行讨论,并用具体例子进行说明.
-
关键词
数据库
静态估计法
动态估计法
-
Keywords
data base
algorithm
statistics
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名不完美信息扩展式博弈中在线虚拟遗憾最小化
被引量:8
- 2
-
-
作者
胡裕靖
高阳
安波
-
机构
软件新技术国家重点实验室(南京大学)
中国科学院计算技术研究所智能信息处理重点实验室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第10期2160-2170,共11页
-
基金
国家自然科学基金项目(61035003
61175042
+3 种基金
61321491
61202212)
江苏省自然科学基金重点项目(BK2011005)
江苏省普通高校研究生科研创新计划基金项目(CXLX13_049)
-
文摘
研究在不完美信息扩展式博弈中对次优对手弱点的利用.针对该领域中一种常用方法——对手建模方法——的不足,提出了从遗憾最小化的角度来利用次优对手弱点的思想,并基于一种离线的均衡计算方法——虚拟遗憾最小化方法——将其扩展到在线博弈的场景中,实现对次优对手弱点的利用.提出了从博弈结果中估计各个信息集的虚拟价值的方法,给出2种估计手段:静态估计法和动态估计法.静态估计法直接从博弈结果的分布中进行估计,并对每个结果给以相等的估计权重;而动态估计法则对新产生的博弈结果给以较高的估计权重,以便快速地适应对手的策略变化.基于2种估计方法,提出在线博弈中虚拟遗憾最小化的算法,并在基于单牌扑克的实验中,与4种在线学习算法(DBBR,MCCFR-os,Q-learning,Sarsa)进行了对比.实验结果显示所提出的算法不仅对较弱对手的利用效果最好,还能在与4种对比算法的比赛中取得最高的胜率.
-
关键词
扩展式博弈
不完美信息
遗憾最小化
虚拟遗憾最小化
静态估计法
动态估计法
-
Keywords
extensive games
minimization
static estimator
imperfect information
regret minimization
counterfactual regret dynamic estimator
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-