在概率阈值准则下马尔可夫策略的最优化算法被引量：2

Optimum algorithm of Markov optimum policy under probability threshold rule

下载PDF

导出

摘要在一种新的概率阈值准则下讨论马尔可夫决策的最优解的算法问题.采用基于增益的过去累积值的方法,求解马尔可夫最优策略. The arithmetic problems of the Markov optimum solution are discussed under the new principle. The markov optimum policy is gained bared on the previous accumulation value.

作者姜峰郑兆青

机构地区菏泽师范专科学校教务科山东理工大学外事学院

出处《山东理工大学学报（自然科学版）》 CAS 2004年第1期62-65,共4页 Journal of Shandong University of Technology:Natural Science Edition

关键词概率阈值准则马尔可夫策略最优化算法 MARKOV决策过程 Markov最优策略 Markov decision processes Markov optimum policy probability threshold rule

分类号 O211.62 [理学—概率论与数理统计]

引文网络
相关文献

参考文献4

1Howard R A. Dynamic Programming and Markov Processes[M]. Cambridge: MII Press, 1960.
2Blackwell D. Discrete dynamic programming[J]. Ann Math Stat, 1962,33:719-726.
3Derman C. On Sequential decisions and Markov chains[J]. Man. Sci. 1962,9:719-726.
4Dynkin E B, Yushkevich A A. Controlled Markov Processes[M]. New York: Springer-Verla, 1979.

同被引文献14

1Ren-fang WANG,Wen-zhi CHEN,San-yuan ZHANG,Yin ZHANG,Xiu-zi YE.Similarity-based denoising of point-sampled surfaces[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2008,9(6):807-815. 被引量：5
2于传强,郭晓松,张宝生,陈德国.Bayes阈值选取准则中的实时加权先验概率算法[J].仪器仪表学报,2008,29(9):1951-1955. 被引量：1
3叶爱芬,龚声蓉,王朝晖,刘纯平.基于随机分布估计的点云密度提取[J].计算机工程,2009,35(4):183-186. 被引量：11
4葛宝臻,项晨,田庆国,彭博.基于曲率特征混合分类的高密度点云去噪方法[J].纳米技术与精密工程,2012,10(1):64-67. 被引量：15
5张民悦.教学质量评估的一类数学模型[J].甘肃工业大学学报,2000,26(2):92-97. 被引量：7
6朱宁,李竹梅.马尔可夫过程在教学管理中的应用[J].桂林电子工业学院学报,2000,20(2):74-77. 被引量：5
7宋大虎,李忠科,王忠,孙玉春.特征保持的点云光顺算法[J].中国机械工程,2014,25(11):1498-1501. 被引量：5
8张延安.试论马尔可夫模型及应用[J].沈阳大学学报,2001,13(2):44-46. 被引量：23
9夏秀芳,房圆圆.马尔可夫预测模型在人力资源预测方面的应用[J].青岛建筑工程学院学报,2001,22(2):75-77. 被引量：9
10李启东,李文龙,周莉萍.一种曲面特征保持的航空叶片点云精简方法[J].中国机械工程,2014,25(16):2204-2212. 被引量：7

引证文献2

1朱瑜馨,张锦宗,朱瑜莉.马尔可夫模型的教学效果演变研究[J].山东理工大学学报（自然科学版）,2004,18(5):78-80. 被引量：9
2张玉存,徐飞,付献斌.先验概率与曲线概率阈值分割相结合的消噪方法[J].中国机械工程,2017,28(8):936-940.

二级引证文献9

1孙道德.高等学校管理效果的Markov理论分析[J].阜阳师范学院学报（自然科学版）,2005,22(2):11-13. 被引量：1
2程向阳.马尔可夫链模型在教育评估中的应用[J].大学数学,2007,23(2):38-41. 被引量：1
3惠淑荣,董建国.马尔科夫链在教学评价中的应用[J].高等农业教育,2009(10):60-63. 被引量：13
4董建国,惠淑荣,陈忠维.数学教育评价的马尔科夫链模型应用[J].沈阳农业大学学报（社会科学版）,2010,12(4):468-471. 被引量：15
5刘焰余.基于马尔科夫链的启发式英语教学效果分析[J].教学与管理（理论版）,2013(3):112-114. 被引量：3
6赵丽芬,高飞,郭淼,项敏敏.游走过程的Markov链的Matlab仿真与分析[J].云南民族大学学报（自然科学版）,2013,22(S01):26-30.
7吴铁洲,熊金龙,曾艺师.模糊聚类和随机过程在教学评估中的综合应用[J].中国高等教育评估,2013(4):22-24.
8崔叶竹.基于马尔科夫链的发展性教学效果评价研究[J].知识经济,2020(3):150-151. 被引量：1
9程晓苏.马尔科夫链在教学评价中的应用[J].科技信息,2014(11):112-113. 被引量：6

1姜峰,回钰.基于未来阈值的马尔可夫策略的最优化算法[J].吉林化工学院学报,2004,21(2):97-99.
2周亚清.质量管理中的马尔可夫分析法[J].水利电力机械电子技术,1991,5(3):43-47.
3李江红,胡照文.一类Markov决策过程自适应决策的新方法[J].控制与决策,2001,16(4):415-419.
4沈宗宣.N阶段随机多目标决策的解法[J].天津轻工业学院学报,1992(2):43-47.
5曾庆宁.模糊多目标马尔可夫决策[J].桂林电子工业学院学报,1999,19(1):44-47.
6沈晋会.Markov决策过程在矿井通讯系统中的应用[J].煤炭技术,2013,32(11):218-219.
7黄民懿,马琰.平均场随机对策:单调成本函数与门限策略[J].中国科学：数学,2016,46(10):1445-1460.
8周亚平,奚宏生,殷保群,唐昊.连续时间Markov决策过程在呼叫接入控制中的应用[J].控制与决策,2001,16(B11):795-799. 被引量：3
9李江洪,韩正之.有限规划水平自适应Markov决策过程的参数决策[J].应用科学学报,2000,18(4):335-339. 被引量：1
10刘任河,郭光耀.“NCD”系统中保险双方的最优博弈[J].武汉工程大学学报,2008,30(3):124-126.

山东理工大学学报（自然科学版）

2004年第1期

浏览历史

内容加载中请稍等...

在概率阈值准则下马尔可夫策略的最优化算法被引量：2

参考文献4

同被引文献14

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

在概率阈值准则下马尔可夫策略的最优化算法 被引量：2

参考文献4

同被引文献14

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

在概率阈值准则下马尔可夫策略的最优化算法被引量：2