检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

高级检索
期刊导航

共找到53篇文章

< 1 2 3 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

	题名	作者	出处	发文年	被引量	操作
1	Deep reinforcement learning using least-squares truncated temporal-difference	Junkai Ren Yixing Lan Xin Xu Yichuan Zhang Qiang Fang Yujun Zeng	《CAAI Transactions on Intelligence Technology》 SCIE EI	2024	0	下载PDF 职称材料
2	Efficient Temporal Difference Learning with Adaptive λ	毕金波吴沧浦	《Journal of Beijing Institute of Technology》 EI CAS	1999	0	下载PDF 职称材料
3	A Collaborative Machine Learning Scheme for Traffic Allocation and Load Balancing for URLLC Service in 5G and Beyond	Andreas G. Papidas George C. Polyzos	《Journal of Computer and Communications》	2023	0	下载PDF 职称材料
4	基于生成模型的Q-learning二分类算法	尚志刚徐若灏乔康加杨莉芳李蒙蒙	《计算机应用研究》 CSCD 北大核心	2020	1	下载PDF 职称材料
5	Incremental Multi Step R Learning	胡光华吴沧浦	《Journal of Beijing Institute of Technology》 EI CAS	1999	0	下载PDF 职称材料
6	Balance Control of a Biped Robot on a Rotating Platform Based on Efficient Reinforcement Learning	Ao Xi Thushal Wijekoon Mudiyanselage Dacheng Tao Chao Chen	《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD	2019	7	下载PDF 职称材料
7	An Adaptive Strategy via Reinforcement Learning for the Prisoner＇s Dilemma Game	Lei Xue Changyin Sun Donald Wunsch Yingjiang Zhou Fang Yu	《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD	2018	8	下载PDF 职称材料
8	TD再励学习在卫星姿态控制中的应用	刘向东崔晓婷王华张宇河	《北京理工大学学报》 EI CAS CSCD 北大核心	2006	1	下载PDF 职称材料
9	基于优先采样模型的离线强化学习	顾扬程玉虎王雪松	《自动化学报》 EI CAS CSCD 北大核心	2024	1	下载PDF 职称材料
10	梯级水库深度强化学习长期随机优化调度研究	李文武周佳妮裴本林张一凡	《水力发电学报》 CSCD 北大核心	2023	1	下载PDF 职称材料
11	基于深度强化学习的动态装配算法	王竣禾姜勇	《智能系统学报》 CSCD 北大核心	2023	2	下载PDF 职称材料
12	基于时序差分的动态信道分配算法	王娟史冬阳邵浚哲	《移动通信》	2023	0	下载PDF 职称材料
13	基于深度强化学习的非置换流水车间调度问题	肖鹏飞张超勇孟磊磊洪辉戴稳	《计算机集成制造系统》 EI CSCD 北大核心	2021	29	下载PDF 职称材料
14	增强型深度确定策略梯度算法	陈建平何超刘全吴宏杰胡伏原傅启明	《通信学报》 EI CSCD 北大核心	2018	8	下载PDF 职称材料
15	强化学习的模型、算法及应用	战忠丽王强陈显亭	《电子科技》	2011	8	下载PDF 职称材料
16	面向机器博弈的即时差分学习研究	徐长明马宗民徐心和李新星	《计算机科学》 CSCD 北大核心	2010	4	下载PDF 职称材料
17	基于递推最小二乘法的多步时序差分学习算法	陈学松杨宜民	《计算机工程与应用》 CSCD 北大核心	2010	5	下载PDF 职称材料
18	基于二阶时序差分误差的双网络DQN算法	陈建平周鑫傅启明高振付保川吴宏杰	《计算机工程》 CAS CSCD 北大核心	2020	3	下载PDF 职称材料
19	加强学习主要算法的比较研究	郭茂祖刘扬黄梯云	《计算机工程与应用》 CSCD 北大核心	2001	4	下载PDF 职称材料
20	基于时间差分和局部加权偏最小二乘算法的过程自适应软测量建模	袁小锋葛志强宋执环	《化工学报》 EI CAS CSCD 北大核心	2016	17	下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部