期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于卷积神经网络的“斗地主”策略 被引量:3
1
作者 徐方婧 魏鲲鹏 +2 位作者 王以松 彭啟文 于小民 《计算机与现代化》 2020年第11期28-32,共5页
深度神经网络已经在国外的各种博弈中取得了惊人的成就,近几年,卷积神经网络因为其独特的单元结构获得了极大的关注,被频频运用到博弈AI智能体中,例如AlphaGo、冷扑大师等。而“斗地主”是典型的基于非完备信息的合作对抗博弈。本文设... 深度神经网络已经在国外的各种博弈中取得了惊人的成就,近几年,卷积神经网络因为其独特的单元结构获得了极大的关注,被频频运用到博弈AI智能体中,例如AlphaGo、冷扑大师等。而“斗地主”是典型的基于非完备信息的合作对抗博弈。本文设计一种7层卷积神经网络DDZ-CNN,用基于蒙特卡洛树“斗地主”自我博弈的近30万条数据来训练该网络以学习“斗地主”策略,训练过程中采用基于权重的方式对训练数据进行下采样以克服其分布不均的问题,而且网络能较快收敛。最后将训练好的模型与智能MCTS模型和真人进行了实战对抗,取得了不错的胜率,验证了本文算法的有效性与可行性。 展开更多
关键词 非完备信息博弈 卷积神经网络 “斗地主”策略 非均匀分布
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部