期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于手牌拆分的“斗地主”蒙特卡洛树搜索
被引量:
5
1
作者
彭啟文
王以松
+2 位作者
于小民
刘满义
徐方婧
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2019年第3期107-114,共8页
“斗地主”是典型的多人合作非完全信息博弈,蒙特卡洛树搜索是求解博弈(围棋、国际象棋等)问题的重要工具.本文首先提出基于“斗地主”规则的手牌拆分算法,通过选择较小拆分以解决其动作空间较大问题;其次,通过蒙特卡洛抽样法,对“斗地...
“斗地主”是典型的多人合作非完全信息博弈,蒙特卡洛树搜索是求解博弈(围棋、国际象棋等)问题的重要工具.本文首先提出基于“斗地主”规则的手牌拆分算法,通过选择较小拆分以解决其动作空间较大问题;其次,通过蒙特卡洛抽样法,对“斗地主”非完全合作博弈进行不断抽样模拟,在满足一定预设条件后,选择收益最佳的节点作为本次最佳决策.实验结果表明,基于手牌拆分的“斗地主”蒙特卡洛树搜索能较好地实现“斗地主”自动博弈.
展开更多
关键词
斗地主
计算机博弈
强化学习
蒙特卡洛树搜索
下载PDF
职称材料
题名
基于手牌拆分的“斗地主”蒙特卡洛树搜索
被引量:
5
1
作者
彭啟文
王以松
于小民
刘满义
徐方婧
机构
贵州大学计算机科学与技术学院
出处
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2019年第3期107-114,共8页
基金
国家自然科学基金联合基金重点项目(U1836205)
文摘
“斗地主”是典型的多人合作非完全信息博弈,蒙特卡洛树搜索是求解博弈(围棋、国际象棋等)问题的重要工具.本文首先提出基于“斗地主”规则的手牌拆分算法,通过选择较小拆分以解决其动作空间较大问题;其次,通过蒙特卡洛抽样法,对“斗地主”非完全合作博弈进行不断抽样模拟,在满足一定预设条件后,选择收益最佳的节点作为本次最佳决策.实验结果表明,基于手牌拆分的“斗地主”蒙特卡洛树搜索能较好地实现“斗地主”自动博弈.
关键词
斗地主
计算机博弈
强化学习
蒙特卡洛树搜索
Keywords
dou di zhu
computer game
reinforcement learning
Monte Carlo tree search
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于手牌拆分的“斗地主”蒙特卡洛树搜索
彭啟文
王以松
于小民
刘满义
徐方婧
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2019
5
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部