期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
解决ICRA RoboMaster AI挑战与深度学习的研究
1
作者
陈明阳
刘博
茆意风
《科学技术创新》
2020年第29期104-105,共2页
本项目提出了机器人战斗强化学习的模型。通过引入PyGame的虚拟环境,在预先定义的环境中开展训练模型,核心模型是神经网络在深度Q学习中应用模拟决策过程的功能。除了DQN之外,还在训练过程中应用了角色评判方法。通过比较两个模型输出...
本项目提出了机器人战斗强化学习的模型。通过引入PyGame的虚拟环境,在预先定义的环境中开展训练模型,核心模型是神经网络在深度Q学习中应用模拟决策过程的功能。除了DQN之外,还在训练过程中应用了角色评判方法。通过比较两个模型输出的差异,进行了深入讨论研究和改进。
展开更多
关键词
强化学习
DQN
深度学习
改进
下载PDF
职称材料
基于强化学习的ICRA RoboMaster AI策略研究
2
作者
陈明阳
刘博
茆意风
《中阿科技论坛(中英文)》
2020年第9期170-173,共4页
本文使用蒙特卡洛树搜索(MCTS)算法代替传统Alpha-Beta搜索算法,采用改变其他对称方面来训练非对称情况下的策略,研究对比和分析,认为确实可以找到一种通用的自我强化学习方法。
关键词
ICRA
RoboMaster比赛
强化学习
DQN
Actor-critic算法
下载PDF
职称材料
题名
解决ICRA RoboMaster AI挑战与深度学习的研究
1
作者
陈明阳
刘博
茆意风
机构
美国宾夕法尼亚大学
出处
《科学技术创新》
2020年第29期104-105,共2页
文摘
本项目提出了机器人战斗强化学习的模型。通过引入PyGame的虚拟环境,在预先定义的环境中开展训练模型,核心模型是神经网络在深度Q学习中应用模拟决策过程的功能。除了DQN之外,还在训练过程中应用了角色评判方法。通过比较两个模型输出的差异,进行了深入讨论研究和改进。
关键词
强化学习
DQN
深度学习
改进
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于强化学习的ICRA RoboMaster AI策略研究
2
作者
陈明阳
刘博
茆意风
机构
宾夕法尼亚大学
出处
《中阿科技论坛(中英文)》
2020年第9期170-173,共4页
文摘
本文使用蒙特卡洛树搜索(MCTS)算法代替传统Alpha-Beta搜索算法,采用改变其他对称方面来训练非对称情况下的策略,研究对比和分析,认为确实可以找到一种通用的自我强化学习方法。
关键词
ICRA
RoboMaster比赛
强化学习
DQN
Actor-critic算法
Keywords
ICRA robomaster
Reinforce learning
DQN
Actor-critic
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
解决ICRA RoboMaster AI挑战与深度学习的研究
陈明阳
刘博
茆意风
《科学技术创新》
2020
0
下载PDF
职称材料
2
基于强化学习的ICRA RoboMaster AI策略研究
陈明阳
刘博
茆意风
《中阿科技论坛(中英文)》
2020
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部