-
题名面向云计算平台的层次化性能问题诊断方法
被引量:1
- 1
-
-
作者
米海波
王怀民
蔡华
尹刚
周琦
孙廷韬
周扬帆
-
机构
国防科学技术大学并行与分布处理国家重点实验室
阿里巴巴云计算公司计算平台
香港中文大学深圳研究院
-
出处
《通信学报》
EI
CSCD
北大核心
2011年第7期114-124,共11页
-
基金
国家重点基础研究发展计划("973"计划)基金资助项目(2011CB302605)
国家高技术研究发展计划("863"计划)基金资助项目(2007AA010301)
+2 种基金
国家杰出青年科学基金资助项目(60625203)
国家自然科学基金资助项目(90818028
60903043)~~
-
文摘
提出一种层次式在线性能问题诊断方法——Magnifier,将用户请求执行路径划分为构件层、模块层和方法层3个层次,自顶向下逐层定位问题根源。基于阿里巴巴云计算平台的实验结果表明,Magnifier能够在调用方法种类多、执行路径复杂的条件下,快速定位出性能降级的主要原因。
-
关键词
性能问题
层次化诊断
云计算平台
-
Keywords
performance problem
hierarchical diagnostic
cloud computing platform
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名云计算系统中基于噪声模板跳表的日志过滤方法
- 2
-
-
作者
饶翔
王怀民
蔡华
周琦
孙廷韬
史殿习
尹刚
-
机构
国防科学技术大学计算机学院
阿里巴巴云计算公司计算平台
-
出处
《通信学报》
EI
CSCD
北大核心
2011年第7期103-113,共11页
-
基金
国家重点基础研究发展计划("973"计划)基金资助项目(2011CB302605)~~
-
文摘
提出了一种基于时间序列相似度的日志特征提取方法,通过将噪声采样信息按照特定类型标识建模为时间序列,使用Haar小波变换提取序列特征,基于跳表构造噪声模板库。目标日志时间序列通过与噪声模板进行相似度比较来确定其是否为噪声日志。基于真实云计算平台的实验表明,提出的方法能够有效提高故障特征的有效性。
-
关键词
事件日志
时间序列相似度
噪声过滤
跳表
云计算系统
-
Keywords
event log
time series similarity
noisy log filtering
skip list
cloud computing system
-
分类号
TP311.134.3
[自动化与计算机技术—计算机软件与理论]
-
-
题名云计算系统中基于伴随状态追踪的故障检测机制
被引量:23
- 3
-
-
作者
饶翔
王怀民
陈振邦
周扬帆
蔡华
周琦
孙廷韬
-
机构
国防科学技术大学并行与分布处理国家重点实验室
香港中文大学深圳研究院
阿里巴巴云计算公司计算平台部
-
出处
《计算机学报》
EI
CSCD
北大核心
2012年第5期856-870,共15页
-
基金
国家"九七三"重点基础研究发展规划项目基金(2011CB302600)
国家自然科学基金(90818028
+2 种基金
91018004
61100077)
国家杰出青年科学基金(60625203)资助~~
-
文摘
在运行时检测分布式系统内所产生的故障需要事先获得故障特征模型.构造故障特征模型的常见做法为将故障注入系统并根据随后系统内所产生的特征症状(如异常事件日志)建模.已有建模方法通常使用从故障发生到给定时间窗口之内的特征症状.然而,根据真实系统观察,不同故障的传播影响时间相差很大,且故障特征会在故障传播过程中发生改变.因此,已有方法对检测时间窗口之后发的故障特征症状不能识别或会产生大量错误报警.为了解决此问题,文中提出一种基于故障注入测试的故障特征提取方法,该方法主要由3步组成:(1)过滤噪声日志;(2)构造1个故障识别器识别不同故障的早期特征;(3)为每类故障构造限状态追踪器追踪该故障的后期传播状态,从而在故障被识别出来后持续跟踪故障传播状态.通过在企业级云计算系统中进行实验验证,与已有方法相比该文方法具备更高的故障检测精确度.
-
关键词
事件日志
故障检测
故障注入
故障特征提取
云计算系统
-
Keywords
event log
fault detection
fault injection
fault feature creation
cloud computing systems
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-