期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的双置换表优化算法研究
1
作者 王栋年 王军伟 +2 位作者 薛世超 汪超 徐长明 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期145-153,共9页
基于深度强化学习的计算机博弈程序(如AlphaGo)已在围棋上战胜了人类世界冠军。这些算法利用可学习的价值神经网络和策略神经网络指导蒙特卡洛树的探索。为提高蒙特卡洛树的搜索性能,已提出多种改进方法,其中置换表已被证明可提高搜索... 基于深度强化学习的计算机博弈程序(如AlphaGo)已在围棋上战胜了人类世界冠军。这些算法利用可学习的价值神经网络和策略神经网络指导蒙特卡洛树的探索。为提高蒙特卡洛树的搜索性能,已提出多种改进方法,其中置换表已被证明可提高搜索效率。在此基础上,提出一种新的基于置换表的方法——基于深度强化学习的双置换表优化算法。该方法使用不同的替换策略管理双层置换表,并将六子棋的两步落子解耦为2个独立的神经网络。这不仅减小了动作空间规模,也更易于神经网络训练。以六子棋为例进行的实验结果表明,在有限的计算资源下,该方法能显著提升棋局哈希命中率和程序棋力水平。 展开更多
关键词 深度强化学习 置换表 计算机博弈 AlphaGo 蒙特卡洛树
下载PDF
初中英语教学中分层教学的实践探索 被引量:1
2
作者 王栋年 《学周刊》 2021年第22期23-24,共2页
分层教学是我国古代"因材施教"理论在现代教学实践中的应用,在初中英语教学中实施分层教学不仅能有效地调动各层次学生的学习积极性,还能大幅度提高教学质量,促进课程改革的深化。本文主要分析了初中英语教学中实施分层教学... 分层教学是我国古代"因材施教"理论在现代教学实践中的应用,在初中英语教学中实施分层教学不仅能有效地调动各层次学生的学习积极性,还能大幅度提高教学质量,促进课程改革的深化。本文主要分析了初中英语教学中实施分层教学的必要性,探讨了分层教学的实施过程和措施,并指出分层教学过程中应注意的问题,以期给广大同仁提供借鉴。 展开更多
关键词 初中英语 分层教学 教学目标 教学内容 教学评价
下载PDF
维护全局博弈图的蒙特卡洛图搜索
3
作者 徐长明 周其磊 +3 位作者 王一川 王栋年 金张根 王军伟 《重庆理工大学学报(自然科学)》 CAS 2024年第5期130-136,共7页
AlphaGo系列算法利用具备学习价值神经网络和策略神经网络主导蒙特卡洛树搜索的方法,成功地推动了棋类游戏人工智能的迅速发展。而最近,已有成果表明采用蒙特卡洛图搜索替代蒙特卡洛树搜索能够进一步提高程序的对弈水平。在此基础上,提... AlphaGo系列算法利用具备学习价值神经网络和策略神经网络主导蒙特卡洛树搜索的方法,成功地推动了棋类游戏人工智能的迅速发展。而最近,已有成果表明采用蒙特卡洛图搜索替代蒙特卡洛树搜索能够进一步提高程序的对弈水平。在此基础上,提出了一种新的基于蒙特卡洛图搜索的方法——维护全局博弈图的蒙特卡洛图搜索算法。该方法通过维护一个全局的博弈图,采用过期结点删除算法清除无价值的结点和边,并利用对手的时间进行推理计算等措施,提高了程序的博弈水平。以海克斯棋为实验对象,结果证明,在计算资源受限情况下相比其他搜索算法胜率有所提升。 展开更多
关键词 AlphaGo系列算法 计算机博弈 蒙特卡洛图搜索 计算资源
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部