期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种大众麻将计算机博弈的快速出牌方法
1
作者 张小川 严明珠 +2 位作者 涂飞 陈俊宇 魏乐天 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期102-107,共6页
麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果。但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何... 麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果。但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何在对弈中快速出牌就成为主要问题。针对以上问题,对出牌动作进行研究,以启发式快速出牌为思路,提出了面向敌方胡牌牌张的蒙特卡洛评估法,将启发式快速出牌方法和蒙特卡洛评估法相结合,对每张手牌进行估值计算,通过估值分数决定每轮出牌牌张。以历史出牌次数为分界点,以此分界将博弈过程时序化为前后2个决策时段,前段采用启发式快速出牌方法,后段采用蒙特卡洛评估法。通过前后时段法分层递进决策处理过程,给出最佳出牌着法,能有效减少出牌的决策时间并降低点炮率。采用所提方法的程序在中国计算机博弈锦标赛中获得了一等奖,证明了该方法的有效性。 展开更多
关键词 计算机博弈 不完美信息博弈 麻将 启发式快速出牌 蒙特卡洛评估法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部