1
基于SARSA学习的跳频系统智能抗干扰决策算法
陈一波
赵知劲
《现代电子技术》
2023
0
2
基于模糊神经网络Sarsa学习的多机器人任务分配
陈夏冰
刘国栋
《计算机应用与软件》
CSCD
北大核心
2012
3
3
基于SARSA学习的单交叉口配时优化仿真与设计
白静静
任安虎
李珊
《国外电子测量技术》
2020
3
4
基于Sarsa学习的基站休眠策略研究
杨海
吴静
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2020
2
5
一种用于机器人电池电量预测的Sarsa强化学习混合集成方法
彭飞
刘辉
郑力
《Journal of Central South University》
SCIE
EI
CAS
CSCD
2023
1
6
一种基于状态聚类的SARSA(λ)强化学习算法
李春贵
吴沧浦
刘永信
《计算机工程》
CAS
CSCD
北大核心
2003
3
7
一种集成规划的SARSA(λ)强化学习算法
李春贵
吴沧浦
刘永信
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2002
2
8
改进的模糊Sarsa学习
陈学松
杨宜民
《北京邮电大学学报》
EI
CAS
CSCD
北大核心
2011
0
9
基于蚁群优化的模糊Sarsa学习算法
陈学松
杨宜民
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011
0
10
一个因素化SARSA(λ)激励学习算法
陈焕文
谢建平
谢丽娟
《计算机研究与发展》
EI
CSCD
北大核心
2001
8
11
多步截断SARSA强化学习算法
李春贵
林海涛
刘永信
《广西工学院学报》
CAS
2002
5
12
一种状态集结因子化SARSA(λ)强化学习算法
李春贵
刘永信
《内蒙古大学学报(自然科学版)》
CAS
CSCD
北大核心
2001
1
13
移动机器人模糊Sarsa(λ)学习导航研究
陈卫东
关永贞
朱奇光
赵成龙
《小型微型计算机系统》
CSCD
北大核心
2013
0
14
基于CMAC网络Sarsa(λ)学习的RoboCup守门员策略
刘云龙
吉国力
《北京工业大学学报》
EI
CAS
CSCD
北大核心
2012
0
15
基于节点生长k-均值聚类算法的强化学习方法
陈宗海
文锋
聂建斌
吴晓曙
《计算机研究与发展》
EI
CSCD
北大核心
2006
13
16
连续状态自适应离散化基于K-均值聚类的强化学习方法
文锋
陈宗海
卓睿
周光明
《控制与决策》
EI
CSCD
北大核心
2006
7
17
求解部分可观测马氏决策过程的强化学习算法
王学宁
贺汉根
徐昕
《控制与决策》
EI
CSCD
北大核心
2004
5
18
一种新的基于蚁群优化的模糊强化学习算法
谢光强
陈学松
《计算机应用研究》
CSCD
北大核心
2011
2
19
基于强化学习的无人坦克对战仿真研究
徐志雄
曹雷
陈希亮
《计算机工程与应用》
CSCD
北大核心
2018
13
20
基于Sarsa算法的无人直升机悬停控制
蔡文澜
王俊生
税海涛
马宏绪
《兵工自动化》
2007
1