-
题名基于多Agent强化学习的流水线维护策略
被引量:5
- 1
-
-
作者
王潇
王红卫
祁超
-
机构
华中科技大学系统工程研究所
沈阳航空航天大学安全工程学院
-
出处
《系统工程学报》
CSCD
北大核心
2013年第5期702-708,共7页
-
基金
国家自然科学基金资助项目(60904075)
国家杰出青年科学基金资助项目(71125001)
-
文摘
在生产过程中,设备状态的衰变会影响产品质量,尽管设备仍能运行,但其成品率水平逐渐下降.针对由两台具有衰变质量状态的设备和一个库存缓冲组成的2M1B流水线系统,研究衰变设备的预防维护策略.每台设备可视为一个Agent,其预防维护问题被描述成半马氏决策过程模型,并与另一台设备的维护模型相关.以考虑系统全局即时成本为前提,提出了一种分布式的多Agent强化学习方法,获得两台设备在缓冲库存水平下的维护策略.学习所得的维护策略是典型的控制限型形式,即对于给定库存水平,当设备衰变至等于或劣于其相应的控制极限状态时,便触发维护行动.
-
关键词
预防维护
2M1B流水线
多Agent强化学习算法
半马氏决策过程
衰变的质量状态
-
Keywords
preventive maintenance
2M1B flow line
multi-agent reinforcement learning
semi-markov deci- sion process
deteriorating quality states
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-