期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
深度强化学习算法分析与对比研究
原文传递
导出
摘要
随着经济社会的发展,人工智能技术也得到了快速发展,深度强化学习融入了深度学习的感知能力和强化学习的决策能力,特别是在对运动控制问题的处理上,潜力非凡。本文分析了深度强化学习算法,通过分析探寻深度强化学习在现实生产中应用的可能性。
作者
程鑫瑶
机构地区
沈阳化工大学计算机科学与技术学院
出处
《网络安全技术与应用》
2021年第11期33-34,共2页
Network Security Technology & Application
基金
湖南省教育厅科学技术研究重点项目(20A450)
湖南省教育厅科学技术研究一般项目(19C1808)。
关键词
人工智能
深度强化学习
奖励机制
经验重放
对比
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
引文网络
相关文献
节点文献
二级参考文献
17
参考文献
3
共引文献
593
同被引文献
0
引证文献
0
二级引证文献
0
参考文献
3
1
刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.
深度强化学习综述[J]
.计算机学报,2018,41(1):1-27.
被引量:472
2
董豪,杨静,李少波,王军,段仲静.
基于深度强化学习的机器人运动控制研究进展[J]
.控制与决策,2022,37(2):278-292.
被引量:39
3
刘建伟,高峰,罗雄麟.
基于值函数和策略梯度的深度强化学习综述[J]
.计算机学报,2019,42(6):1406-1438.
被引量:131
二级参考文献
17
1
魏英姿 ,赵明扬 .
一种基于强化学习的作业车间动态调度方法[J]
.自动化学报,2005,31(5):765-771.
被引量:19
2
高阳,周如益,王皓,曹志新.
平均奖赏强化学习算法研究[J]
.计算机学报,2007,30(8):1372-1378.
被引量:38
3
陈宗海,杨志华,王海波,盛捷.
从知识的表达和运用综述强化学习研究[J]
.控制与决策,2008,23(9):961-968.
被引量:14
4
王皓,高阳,陈兴国.
强化学习中的迁移:方法和进展[J]
.电子学报,2008,36(B12):39-43.
被引量:27
5
孙志军,薛磊,许阳明,王正.
深度学习研究综述[J]
.计算机应用研究,2012,29(8):2806-2810.
被引量:623
6
余凯,贾磊,陈雨强,徐伟.
深度学习的昨天、今天和明天[J]
.计算机研究与发展,2013,50(9):1799-1804.
被引量:610
7
傅启明,刘全,王辉,肖飞,于俊,李娇.
一种基于线性函数逼近的离策略Q(λ)算法[J]
.计算机学报,2014,37(3):677-686.
被引量:26
8
王珂,卜祥津,李瑞峰,赵立军.
景深约束下的深度强化学习机器人路径规划[J]
.华中科技大学学报(自然科学版),2018,46(12):77-82.
被引量:19
9
黎亚雄,张坚强,潘登,胡惮.
基于RNN-RBM语言模型的语音识别研究[J]
.计算机研究与发展,2014,51(9):1936-1944.
被引量:27
10
杨钊,陶大鹏,张树业,金连文.
大数据下的基于深度神经网的相似汉字识别[J]
.通信学报,2014,35(9):184-189.
被引量:28
共引文献
593
1
傅汇乔,唐开强,邓归洲,王鑫鹏,陈春林.
基于深度强化学习的六足机器人运动规划[J]
.智能科学与技术学报,2020(4):361-371.
被引量:3
2
刘朝阳,穆朝絮,孙长银.
深度强化学习算法与应用研究现状综述[J]
.智能科学与技术学报,2020(4):314-326.
被引量:45
3
韩志豪,汪益兵,张宇,郝永志.
基于深度强化学习的船舶航线自动规划[J]
.中国航海,2021,44(1):100-105.
被引量:9
4
张磊,母亚双,潘泉.
基于改进深度双Q网络的移动机器人路径规划算法[J]
.信息与控制,2024,53(3):365-376.
5
李茹杨,彭慧民,李仁刚,赵坤.
强化学习算法与应用综述[J]
.计算机系统应用,2020,29(12):13-25.
被引量:45
6
刘峰波,党飞飞,杨满囤,马平,赵俊达.
井下防淤积清仓机器人行走机构纠偏控制研究[J]
.煤炭工程,2022,54(S01):195-199.
7
周瑶瑶,李烨.
基于排序优先经验回放的竞争深度Q网络学习[J]
.计算机应用研究,2020,37(2):486-488.
被引量:7
8
李逊,李俊超,邓林忠,康旭云,欧启捷,劳恒辉.
人工智能优化技术在钢筋混凝土结构的应用[J]
.建筑结构,2023,53(S02):1425-1430.
被引量:1
9
王雪鉴,文永明,石晓荣,张宁宁,刘洁玺.
多智能体多耦合任务混合式智能决策架构设计[J]
.航空学报,2023,44(S02):418-425.
10
刘洋,李建军.
深度确定性策略梯度算法优化[J]
.辽宁工程技术大学学报(自然科学版),2020(6):545-549.
被引量:2
网络安全技术与应用
2021年 第11期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部