1
|
基于柔性演员-评论家算法的决策规划协同研究 |
唐斌
刘光耀
江浩斌
田宁
米伟
王春宏
|
《交通运输系统工程与信息》
EI
CSCD
北大核心
|
2024 |
1
|
|
2
|
基于优势演员-评论家算法的强化自动摘要模型 |
杜嘻嘻
程华
房一泉
|
《计算机应用》
CSCD
北大核心
|
2021 |
7
|
|
3
|
带最大熵修正的行动者评论家算法 |
姜玉斌
刘全
胡智慧
|
《计算机学报》
EI
CSCD
北大核心
|
2020 |
5
|
|
4
|
基于改进柔性演员评论家算法的研究 |
胡仕柯
赵海军
|
《太原师范学院学报(自然科学版)》
|
2021 |
2
|
|
5
|
基于优势演员-评论家算法的危险货物集装箱堆场安全堆存空间分配 |
沈阳
黄诚
宓为建
|
《上海海事大学学报》
北大核心
|
2022 |
0 |
|
6
|
一种用于连续动作空间的最小二乘行动者-评论家方法 |
朱斐
刘全
傅启明
伏玉琛
|
《计算机研究与发展》
EI
CSCD
北大核心
|
2014 |
9
|
|
7
|
基于A3C的认知物联网通信干扰消除算法 |
刘新梦
谢健骊
李翠然
王亦鸣
|
《计算机工程》
CAS
CSCD
北大核心
|
2024 |
0 |
|
8
|
基于多域联合的无人机集群认知抗干扰算法 |
刘春玲
刘敏提
丁元明
|
《计算机工程》
CAS
CSCD
北大核心
|
2020 |
11
|
|
9
|
移动边缘计算辅助智能驾驶中基于高效联邦学习的碰撞预警算法 |
唐伦
文明艳
单贞贞
陈前斌
|
《电子与信息学报》
EI
CSCD
北大核心
|
2023 |
2
|
|
10
|
一种针对坦克速度控制的深度强化学习算法 |
崔新悦
阳周明
赵彦东
杨霄
范玲瑜
|
《火力与指挥控制》
CSCD
北大核心
|
2022 |
1
|
|
11
|
基于随机加权三重Q学习的异策略最大熵强化学习算法 |
范静宇
刘全
|
《计算机科学》
CSCD
北大核心
|
2022 |
2
|
|
12
|
基于多层注意力机制—柔性AC算法的机器人路径规划 |
韩金亮
任海菁
吴淞玮
蒋欣欣
刘凤凯
|
《计算机应用研究》
CSCD
北大核心
|
2020 |
5
|
|
13
|
基于最大熵深度强化学习的双足机器人步态控制方法 |
李源潮
陶重犇
王琛
|
《计算机应用》
CSCD
北大核心
|
2024 |
1
|
|
14
|
基于深度强化学习的电子政务云动态化任务调度方法 |
龙宇杰
修熙
黄庆
黄晓勉
李莹
吴维刚
|
《计算机应用研究》
CSCD
北大核心
|
2024 |
0 |
|
15
|
基于强化学习的多无人车协同围捕方法 |
苏牧青
王寅
濮锐敏
余萌
|
《工程科学学报》
EI
CSCD
北大核心
|
2024 |
0 |
|
16
|
基于深度强化学习的机械臂多模混合控制 |
李家乐
张建锋
李彬
刘天琅
陈检
|
《计算机工程与设计》
北大核心
|
2024 |
0 |
|
17
|
深度强化学习驱动下的智能电网通信网业务路由分配方法研究 |
胡楠
张维
|
《通信电源技术》
|
2024 |
0 |
|
18
|
一种平衡探索和利用的优先经验回放方法 |
张佳能
李辉
吴昊霖
王壮
|
《计算机科学》
CSCD
北大核心
|
2022 |
1
|
|
19
|
基于改进强化学习的移动机器人动态避障方法 |
徐建华
邵康康
王佳惠
刘学聪
|
《中国惯性技术学报》
EI
CSCD
北大核心
|
2023 |
5
|
|
20
|
基于自适应多目标强化学习的服务集成方法 |
郭潇
李春山
张宇跃
初佃辉
|
《计算机应用》
CSCD
北大核心
|
2022 |
0 |
|