检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

给定预算下基于相对熵置信区间的蒙特卡洛树搜索最优动作识别算法: 1; 作者刘郭庆钱宇华 +1 位作者张亚宇王婕婷《计算机研究与发展》 EI CSCD 北大核心 2023年第8期1780-1794,共15页; 蒙特卡洛树搜索(Monte Carlo tree search, MCTS)将强化学习的反馈优化与生长树的动态规划相结合,在输出当前状态的最佳动作的同时极大地减少了计算量,因此成为开放环境下众多领域智能系统的关键通用方法.但由于计算资源匮乏或者计算成... 展开更多; 关键词蒙特卡洛树搜索最优动作识别多臂赌博机误差最小化强化学习; 下载PDF 职称材料

基于三元多臂赌博机的树结构最优动作识别: 2; 作者刘郭庆王婕婷 +1 位作者胡治国钱宇华《计算机应用》 CSCD 北大核心 2019年第8期2252-2260,共9页; 蒙特卡罗树搜索(MCTS)在棋类博弈问题中展现出卓越的性能,但目前多数研究仅考虑胜负两种反馈从而假设博弈结果服从伯努利分布,然而这种设定忽略了常出现的平局结果,导致不能准确地评估盘面状态甚至错失最优动作。针对这个问题,首先构建... 展开更多; 关键词蒙特卡罗树搜索三元多臂赌博机最优臂确认序列决策纯探索; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部