1
|
基于输出反馈逆强化Q学习的线性二次型最优控制方法 |
刘文
范家璐
薛文倩
|
《控制理论与应用》
EI
CAS
CSCD
北大核心
|
2024 |
0 |
|
2
|
基于实时反馈强化学习神经网络的船舶艏摇智能控制研究 |
宋伟伟
徐跃宾
段学静
巩方超
崔英明
|
《现代信息科技》
|
2024 |
0 |
|
3
|
反馈负波的强化学习和情绪/动机的分离 |
刘春雷
贾磊
高树玲
张庆林
|
《西南大学学报(自然科学版)》
CAS
CSCD
北大核心
|
2010 |
1
|
|
4
|
基于强化学习的个性化学习路径推荐算法研究 |
陈耀东
|
《科技风》
|
2023 |
1
|
|
5
|
基于参考模型的输出反馈强化学习控制 |
郝钏钏
方舟
李平
|
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
|
2013 |
1
|
|
6
|
强化学习中异构反馈信号的分析与集成 |
余雪丽
李志
周昌能
崔倩
胡坤
|
《计算机科学与探索》
CSCD
|
2012 |
0 |
|
7
|
基于消息反馈与强化学习的节能路由算法 |
王桐
龚续
常远
薛书钰
陈奕霏
|
《应用科技》
CAS
|
2022 |
1
|
|
8
|
基于强化学习的相关反馈图像检索算法 |
孙惠萍
龚声蓉
王朝晖
刘全
|
《计算机工程与应用》
CSCD
北大核心
|
2008 |
1
|
|
9
|
基于人类先验知识的强化学习综述 |
国子婧
冯旸赫
姚晨蝶
许乃夫
|
《计算机应用》
CSCD
北大核心
|
2021 |
2
|
|
10
|
基于选址机制与深度强化学习的WRSN移动能量补充 |
王倩
|
《现代电子技术》
|
2023 |
0 |
|
11
|
连续风险决策中先前结果反馈的作用机制 |
张静芝
|
《心理学进展》
|
2024 |
0 |
|
12
|
基于深度强化学习的查询扩展模型研究 |
余传明
胡莎莎
叶鹏昊
安璐
|
《情报理论与实践》
CSSCI
北大核心
|
2019 |
5
|
|
13
|
自反馈学习理论的最新研究——个性化学习体系的整体设计和改革实践 |
宋家鳌
贾军平
张长泉
|
《广西社会科学》
|
2004 |
3
|
|
14
|
欠驱动船舶路径跟踪的强化学习迭代滑模控制 |
沈智鹏
代昌盛
|
《哈尔滨工程大学学报》
EI
CAS
CSCD
北大核心
|
2017 |
20
|
|
15
|
多智能体强化学习在城市交通网络信号控制方法中的应用综述 |
杨文臣
张轮
Zhu Feng
|
《计算机应用研究》
CSCD
北大核心
|
2018 |
30
|
|
16
|
基于深度强化学习的服务功能链跨域映射算法 |
朱国晖
李庆
梁申麟
|
《计算机应用研究》
CSCD
北大核心
|
2021 |
3
|
|
17
|
基于深度强化学习的云软件服务自适应资源分配方法 |
傅德泉
杨立坚
陈哲毅
|
《计算机应用》
CSCD
北大核心
|
2022 |
3
|
|
18
|
基于负反馈修正的多轮对话推荐系统 |
朱立玺
黄晓雯
赵梦媛
桑基韬
|
《计算机学报》
EI
CAS
CSCD
北大核心
|
2023 |
1
|
|
19
|
教育人工智能支持人类学习机制的两种效应 |
刘欣
李怀龙
|
《中国教育信息化》
|
2020 |
0 |
|
20
|
最新无模型深度强化学习研究:从零开始训练机器人“玩乐高” |
Tuomas Haarnoja
Vitchyr Pong
Aurick Zhou
Murtaza Dalal
Pieter Abbeel
Sergey Levine
|
《机器人产业》
|
2018 |
2
|
|