目前OLTP系统架构设计的实际工作中,集群控制器是可靠性控制的薄弱环节,也是FMEA(Failure Mode and Effects Analysis)主要关注的可靠性评价及设计范围。改进的FMEA通过建立RPN评价指标体系和与IT服务管理中其他子系统联接的数据接口,...目前OLTP系统架构设计的实际工作中,集群控制器是可靠性控制的薄弱环节,也是FMEA(Failure Mode and Effects Analysis)主要关注的可靠性评价及设计范围。改进的FMEA通过建立RPN评价指标体系和与IT服务管理中其他子系统联接的数据接口,采用客观数据对IT组件(主要是集群控制器)的可靠性进行评价和改进,可以明显改善集群控制器的运行质量,并最终改善整个OLTP系统的可靠性。通过在国内某大型数据中心的实验表明,该方法在改进OLTP系统可靠性方面有较好的效果和较低的成本。展开更多
文摘目前OLTP系统架构设计的实际工作中,集群控制器是可靠性控制的薄弱环节,也是FMEA(Failure Mode and Effects Analysis)主要关注的可靠性评价及设计范围。改进的FMEA通过建立RPN评价指标体系和与IT服务管理中其他子系统联接的数据接口,采用客观数据对IT组件(主要是集群控制器)的可靠性进行评价和改进,可以明显改善集群控制器的运行质量,并最终改善整个OLTP系统的可靠性。通过在国内某大型数据中心的实验表明,该方法在改进OLTP系统可靠性方面有较好的效果和较低的成本。