1
|
混合动作空间下的多设备边缘计算卸载方法 |
张冀
齐国梁
朵春红
龚雯雯
|
《计算机工程与应用》
CSCD
北大核心
|
2024 |
0 |
|
2
|
潜在空间中的策略搜索强化学习方法 |
赵婷婷
王莹
孙威
陈亚瑞
王嫄
杨巨成
|
《计算机科学与探索》
CSCD
北大核心
|
2024 |
0 |
|
3
|
基于动作空间求解二维矩形Packing问题的高效算法 |
何琨
黄文奇
金燕
|
《软件学报》
EI
CSCD
北大核心
|
2012 |
21
|
|
4
|
基于动作空间的三维装箱问题的确定性高效率求解算法 |
何琨
黄文奇
|
《计算机学报》
EI
CSCD
北大核心
|
2014 |
19
|
|
5
|
动作空间带平衡约束圆形Packing问题的拟物求解算法 |
何琨
杨辰凯
黄梦龙
黄文奇
|
《软件学报》
EI
CSCD
北大核心
|
2016 |
7
|
|
6
|
一种用于连续动作空间的最小二乘行动者-评论家方法 |
朱斐
刘全
傅启明
伏玉琛
|
《计算机研究与发展》
EI
CSCD
北大核心
|
2014 |
9
|
|
7
|
一类连续状态与动作空间下的加权Q学习 |
程玉虎
易建强
王雪松
赵冬斌
|
《电机与控制学报》
EI
CSCD
北大核心
|
2005 |
1
|
|
8
|
基于离散变量动作空间的多移动机器人对抗策略系统 |
薛方正
方帅
徐心和
|
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
|
2004 |
1
|
|
9
|
悖论与动作:讨论现实与图解弥合机制的教学实验 |
郦文曦
范舟
|
《华中建筑》
|
2023 |
0 |
|
10
|
二维Packing问题拟人型算法中的动作空间更新过程求解 |
胡文蓓
饶昊
|
《软件导刊》
|
2017 |
1
|
|
11
|
运用强化学习增强元宇宙环境中的导航和空间的感知 |
刘恋
|
《中文科技期刊数据库(全文版)社会科学》
|
2023 |
0 |
|
12
|
基于混合强化学习的主动配电网故障恢复方法 |
徐岩
陈嘉岳
马天祥
|
《电力系统及其自动化学报》
CSCD
北大核心
|
2024 |
0 |
|
13
|
基于贝叶斯网络强化学习的复杂装备维修排故策略生成 |
刘宝鼎
于劲松
韩丹阳
唐荻音
李鑫
|
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
|
2024 |
0 |
|
14
|
基于核方法的连续动作Actor-Critic学习 |
陈兴国
高阳
范顺国
俞亚君
|
《模式识别与人工智能》
EI
CSCD
北大核心
|
2014 |
8
|
|
15
|
应用在线随机森林投票的动作识别 |
王世刚
鲁奉军
赵文婷
赵晓琳
卢洋
|
《光学精密工程》
EI
CAS
CSCD
北大核心
|
2016 |
5
|
|
16
|
基于融合离散动作的双延迟深度确定性策略梯度算法的自动驾驶端到端行为决策方法 |
杨璐
王一权
刘佳琦
段玉林
张荣辉
|
《交通信息与安全》
CSCD
北大核心
|
2022 |
2
|
|
17
|
智能垃圾分类拾捡机器人抓取角度自动控制研究 |
李绘英
|
《太原学院学报(自然科学版)》
|
2024 |
0 |
|
18
|
基于DDQN改进方法的“斗地主”策略 |
孔燕
吴晓聪
芮烨锋
史鸿远
|
《信息技术》
|
2024 |
0 |
|
19
|
连续空间的递归最小二乘行动者—评论家算法 |
朱文文
金玉净
伏玉琛
宋绪文
|
《计算机应用研究》
CSCD
北大核心
|
2014 |
2
|
|
20
|
利用空间优化的增强学习Sarsa改进预取算法 |
梁媛
袁景凌
陈旻骋
|
《计算机科学》
CSCD
北大核心
|
2019 |
0 |
|