期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度强化学习的双置换表优化算法研究
1
作者
王栋年
王军伟
+2 位作者
薛世超
汪超
徐长明
《重庆理工大学学报(自然科学)》
CAS
北大核心
2024年第5期145-153,共9页
基于深度强化学习的计算机博弈程序(如AlphaGo)已在围棋上战胜了人类世界冠军。这些算法利用可学习的价值神经网络和策略神经网络指导蒙特卡洛树的探索。为提高蒙特卡洛树的搜索性能,已提出多种改进方法,其中置换表已被证明可提高搜索...
基于深度强化学习的计算机博弈程序(如AlphaGo)已在围棋上战胜了人类世界冠军。这些算法利用可学习的价值神经网络和策略神经网络指导蒙特卡洛树的探索。为提高蒙特卡洛树的搜索性能,已提出多种改进方法,其中置换表已被证明可提高搜索效率。在此基础上,提出一种新的基于置换表的方法——基于深度强化学习的双置换表优化算法。该方法使用不同的替换策略管理双层置换表,并将六子棋的两步落子解耦为2个独立的神经网络。这不仅减小了动作空间规模,也更易于神经网络训练。以六子棋为例进行的实验结果表明,在有限的计算资源下,该方法能显著提升棋局哈希命中率和程序棋力水平。
展开更多
关键词
深度强化学习
置换表
计算机博弈
AlphaGo
蒙特卡洛树
下载PDF
职称材料
初中英语教学中分层教学的实践探索
被引量:
1
2
作者
王栋年
《学周刊》
2021年第22期23-24,共2页
分层教学是我国古代"因材施教"理论在现代教学实践中的应用,在初中英语教学中实施分层教学不仅能有效地调动各层次学生的学习积极性,还能大幅度提高教学质量,促进课程改革的深化。本文主要分析了初中英语教学中实施分层教学...
分层教学是我国古代"因材施教"理论在现代教学实践中的应用,在初中英语教学中实施分层教学不仅能有效地调动各层次学生的学习积极性,还能大幅度提高教学质量,促进课程改革的深化。本文主要分析了初中英语教学中实施分层教学的必要性,探讨了分层教学的实施过程和措施,并指出分层教学过程中应注意的问题,以期给广大同仁提供借鉴。
展开更多
关键词
初中英语
分层教学
教学目标
教学内容
教学评价
下载PDF
职称材料
维护全局博弈图的蒙特卡洛图搜索
3
作者
徐长明
周其磊
+3 位作者
王一川
王栋年
金张根
王军伟
《重庆理工大学学报(自然科学)》
CAS
2024年第5期130-136,共7页
AlphaGo系列算法利用具备学习价值神经网络和策略神经网络主导蒙特卡洛树搜索的方法,成功地推动了棋类游戏人工智能的迅速发展。而最近,已有成果表明采用蒙特卡洛图搜索替代蒙特卡洛树搜索能够进一步提高程序的对弈水平。在此基础上,提...
AlphaGo系列算法利用具备学习价值神经网络和策略神经网络主导蒙特卡洛树搜索的方法,成功地推动了棋类游戏人工智能的迅速发展。而最近,已有成果表明采用蒙特卡洛图搜索替代蒙特卡洛树搜索能够进一步提高程序的对弈水平。在此基础上,提出了一种新的基于蒙特卡洛图搜索的方法——维护全局博弈图的蒙特卡洛图搜索算法。该方法通过维护一个全局的博弈图,采用过期结点删除算法清除无价值的结点和边,并利用对手的时间进行推理计算等措施,提高了程序的博弈水平。以海克斯棋为实验对象,结果证明,在计算资源受限情况下相比其他搜索算法胜率有所提升。
展开更多
关键词
AlphaGo系列算法
计算机博弈
蒙特卡洛图搜索
计算资源
下载PDF
职称材料
题名
基于深度强化学习的双置换表优化算法研究
1
作者
王栋年
王军伟
薛世超
汪超
徐长明
机构
东北大学研究生院
东北大学秦皇岛分校计算机与通信工程学院
出处
《重庆理工大学学报(自然科学)》
CAS
北大核心
2024年第5期145-153,共9页
基金
河北省自然科学基金面上项目(F2023501006)。
文摘
基于深度强化学习的计算机博弈程序(如AlphaGo)已在围棋上战胜了人类世界冠军。这些算法利用可学习的价值神经网络和策略神经网络指导蒙特卡洛树的探索。为提高蒙特卡洛树的搜索性能,已提出多种改进方法,其中置换表已被证明可提高搜索效率。在此基础上,提出一种新的基于置换表的方法——基于深度强化学习的双置换表优化算法。该方法使用不同的替换策略管理双层置换表,并将六子棋的两步落子解耦为2个独立的神经网络。这不仅减小了动作空间规模,也更易于神经网络训练。以六子棋为例进行的实验结果表明,在有限的计算资源下,该方法能显著提升棋局哈希命中率和程序棋力水平。
关键词
深度强化学习
置换表
计算机博弈
AlphaGo
蒙特卡洛树
Keywords
deep reinforcement learning
transposition table
computer game
AlphaGo
MCTS
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
初中英语教学中分层教学的实践探索
被引量:
1
2
作者
王栋年
机构
甘肃省武威市凉州区张义镇中路九年制学校
出处
《学周刊》
2021年第22期23-24,共2页
文摘
分层教学是我国古代"因材施教"理论在现代教学实践中的应用,在初中英语教学中实施分层教学不仅能有效地调动各层次学生的学习积极性,还能大幅度提高教学质量,促进课程改革的深化。本文主要分析了初中英语教学中实施分层教学的必要性,探讨了分层教学的实施过程和措施,并指出分层教学过程中应注意的问题,以期给广大同仁提供借鉴。
关键词
初中英语
分层教学
教学目标
教学内容
教学评价
分类号
G63 [文化科学—教育学]
下载PDF
职称材料
题名
维护全局博弈图的蒙特卡洛图搜索
3
作者
徐长明
周其磊
王一川
王栋年
金张根
王军伟
机构
东北大学秦皇岛分校计算机与通信工程学院
出处
《重庆理工大学学报(自然科学)》
CAS
2024年第5期130-136,共7页
基金
河北省自然科学基金面上项目(F2023501006)。
文摘
AlphaGo系列算法利用具备学习价值神经网络和策略神经网络主导蒙特卡洛树搜索的方法,成功地推动了棋类游戏人工智能的迅速发展。而最近,已有成果表明采用蒙特卡洛图搜索替代蒙特卡洛树搜索能够进一步提高程序的对弈水平。在此基础上,提出了一种新的基于蒙特卡洛图搜索的方法——维护全局博弈图的蒙特卡洛图搜索算法。该方法通过维护一个全局的博弈图,采用过期结点删除算法清除无价值的结点和边,并利用对手的时间进行推理计算等措施,提高了程序的博弈水平。以海克斯棋为实验对象,结果证明,在计算资源受限情况下相比其他搜索算法胜率有所提升。
关键词
AlphaGo系列算法
计算机博弈
蒙特卡洛图搜索
计算资源
Keywords
AlphaGo series algorithms
computer-based game
Monte Carlo graph search
computational resources
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度强化学习的双置换表优化算法研究
王栋年
王军伟
薛世超
汪超
徐长明
《重庆理工大学学报(自然科学)》
CAS
北大核心
2024
0
下载PDF
职称材料
2
初中英语教学中分层教学的实践探索
王栋年
《学周刊》
2021
1
下载PDF
职称材料
3
维护全局博弈图的蒙特卡洛图搜索
徐长明
周其磊
王一川
王栋年
金张根
王军伟
《重庆理工大学学报(自然科学)》
CAS
2024
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部