期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于贝叶斯网络强化学习的复杂装备维修排故策略生成
1
作者 刘宝鼎 于劲松 +2 位作者 韩丹阳 唐荻音 李鑫 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第4期1354-1364,共11页
为解决传统启发式维修排故决策方法决策时间长、生成策略总成本高的问题,提出一种基于贝叶斯网络(BN)结合强化学习(RL)进行复杂装备维修排故策略生成方法。为更好地利用复杂装备模型知识,使用BN进行维修排故知识表述,并且为更加贴近复... 为解决传统启发式维修排故决策方法决策时间长、生成策略总成本高的问题,提出一种基于贝叶斯网络(BN)结合强化学习(RL)进行复杂装备维修排故策略生成方法。为更好地利用复杂装备模型知识,使用BN进行维修排故知识表述,并且为更加贴近复杂装备实际情况,依据故障模式、影响和危害性分析(FMECA)的故障概率,经合理转化后作为BN的先验概率;为使用RL的决策过程生成维修排故策略,提出一种维修排故决策问题转化为RL问题的方法;为更好地求解转化得到的强化学习问题,引入观测-修复动作对(O-A)以减小问题规模,并设置动作掩码处理动态动作空间。仿真结果表明:在统一的性能指标下,所提BN-RL方法较传统方法获得更高的指标值,证明该方法的有效性和优越性。 展开更多
关键词 强化学习 贝叶斯网络 维修排故策略生成 复杂装备 动态动作空间
下载PDF
贝叶斯网络结合决策理论的向前多步排故策略 被引量:2
2
作者 于劲松 刘浩 +1 位作者 万九卿 张平 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2014年第3期298-303,共6页
针对序贯诊断、维修问题,提出基于贝叶斯网络和决策理论的向前多步排故策略生成算法.通过建立贝叶斯网络排故模型实现了不确定条件下排故知识的高效表达,同时使得推理算法与具体应用无关.采用决策影响图进行排故决策分析,充分利用观测... 针对序贯诊断、维修问题,提出基于贝叶斯网络和决策理论的向前多步排故策略生成算法.通过建立贝叶斯网络排故模型实现了不确定条件下排故知识的高效表达,同时使得推理算法与具体应用无关.采用决策影响图进行排故决策分析,充分利用观测操作间的相关性,选择合理的向前多步观测操作来降低维修盲目性.为了验证所提算法的有效性,采用随机排故策略、决策理论排故策略和理想排故策略的结果进行对比分析.仿真结果表明,所提算法通过增加合理观测操作,减少维修焦点和实际维修操作,使得总排故费用明显低于已有的启发式排故策略. 展开更多
关键词 贝叶斯网络 决策理论 影响图 排故策略生成 排故费用
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部