期刊文献+

基于自主计算的集群故障管理系统结构

Cluster system fault management architecture based on autonomic computing
原文传递
导出
摘要 随着计算机技术的不断发展和系统规模的不断扩大,高可用集群系统的管理和维护变得越来越复杂。为了提供稳定的计算环境,并及时发现定位系统中的故障隐患,提出了故障的主动管理方法。该文首先分析了自主计算的相关概念和技术,在分析集群计算环境管理需求的基础上,提出了一种基于规则的自主故障管理软件结构。根据集群系统的特点,选择分级管理方式,设计了局部故障管理模块(LFM)和全局故障管理模块(GFM),并具体说明了二者内部的功能结构。 随着计算机技术的不断发展和系统规模的不断扩大,高可用集群系统的管理和维护变得越来越复杂。为了提供稳定的计算环境,并及时发现定位系统中的故障隐患,提出了故障的主动管理方法。该文首先分析了自主计算的相关概念和技术,在分析集群计算环境管理需求的基础上,提出了一种基于规则的自主故障管理软件结构。根据集群系统的特点,选择分级管理方式,设计了局部故障管理模块(LFM)和全局故障管理模块(GFM),并具体说明了二者内部的功能结构。
出处 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第S1期1397-1401,共5页 Journal of Tsinghua University(Science and Technology)
基金 国家"八六三"高技术项目(2006AA01A103)
关键词 集群故障管理 自主计算 分级管理 cluster fault management autonomic computing level management
  • 相关文献

参考文献6

二级参考文献27

共引文献46

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部