1
|
连续时间马尔可夫决策过程的折扣模型 |
郭先平
戴永隆
|
《数学学报(中文版)》
SCIE
CSCD
北大核心
|
2002 |
0 |
|
2
|
基于连续时间半马尔可夫决策过程的Option算法 |
唐昊
张晓艳
韩江洪
周雷
|
《计算机学报》
EI
CSCD
北大核心
|
2014 |
2
|
|
3
|
基于连续时间马尔可夫过程的证券投资策略 |
崔海波
赵希男
梁好
潘德惠
|
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
|
2003 |
1
|
|
4
|
基于马尔可夫决策过程的MES系统动态调度方法 |
赵海峰
姜兴宇
王贵和
王宛山
|
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
|
2007 |
2
|
|
5
|
连续时间部分可观Markov决策过程的策略梯度估计 |
唐波
李衍杰
殷保群
|
《控制理论与应用》
EI
CAS
CSCD
北大核心
|
2009 |
1
|
|
6
|
连续时间马氏决策过程——最优策略对折扣因子的灵敏度分析 |
朱益民
|
《浙江工业大学学报》
CAS
|
1999 |
1
|
|
7
|
半马氏环境连续时间马氏决策过程:平均准则 |
徐晨
甘小冰
|
《数学研究》
CSCD
|
1998 |
0 |
|
8
|
随机模型检测连续时间Markov过程 |
钮俊
曾国荪
吕新荣
徐畅
|
《计算机科学》
CSCD
北大核心
|
2011 |
2
|
|
9
|
Q(f)-过程非唯一时连续时间折扣目标MDP |
郭先平
|
《湖南师范大学自然科学学报》
CAS
|
1996 |
0 |
|
10
|
连续时间可重入生产系统调度策略灵敏度分析 |
王利存
郑应平
|
《计算机集成制造系统-CIMS》
EI
CSCD
北大核心
|
2001 |
2
|
|
11
|
基于深度强化学习的新能源配电网双时间尺度无功电压优化 |
李鹏
姜磊
王加浩
夏辉
潘有朋
|
《中国电机工程学报》
EI
CSCD
北大核心
|
2023 |
6
|
|
12
|
基于随机恢复时间的骨盆骨折创伤患者手术分配优化 |
李清
苏强
邓国英
|
《运筹与管理》
CSCD
北大核心
|
2023 |
0 |
|
13
|
火控相控阵雷达的时间资源管理算法 |
秦童
戴奉周
刘宏伟
方明
|
《系统工程与电子技术》
EI
CSCD
北大核心
|
2016 |
8
|
|
14
|
企业知识系统柔性战略的决策模型 |
张新武
刘仲英
|
《管理科学学报》
CSSCI
|
2002 |
14
|
|
15
|
耦合级联失效系统可靠性建模与分析 |
王琦
贾旭杰
翁宇如
田美玉
|
《运筹与管理》
CSCD
北大核心
|
2024 |
0 |
|
16
|
Polish空间上的折扣马氏过程量子化策略的渐近优化 |
吴晓
孔荫莹
郭圳滨
|
《数学物理学报(A辑)》
CSCD
北大核心
|
2022 |
0 |
|
17
|
连续时间马氏决策过程的基本假设 |
刘建庸
胡奇英
王军明
|
《应用数学学报》
CSCD
北大核心
|
2004 |
0 |
|
18
|
配电系统双时间尺度电压管理的深度强化学习方法 |
冯昌森
张瑜
谢路耀
文福拴
张凯怡
张有兵
|
《电力系统自动化》
EI
CSCD
北大核心
|
2022 |
5
|
|
19
|
考虑不确定因素的多模式城市交通网络路径决策 |
李浩楠
曹成铉
柳雨彤
冯紫嫣
|
《科学技术与工程》
北大核心
|
2019 |
4
|
|
20
|
基于强化学习方法的航班滑出时间预测研究 |
杜婧涵
胡明华
尹嘉男
张魏宁
|
《航空计算技术》
|
2022 |
0 |
|