-
题名MicroAFL:一种云上微服务故障自动定位方法
- 1
-
-
作者
羊麟威
李静
饶涵宇
高颖
毛冬
乔宇杰
-
机构
南京航空航天大学计算机科学与技术学院
国网浙江省电力有限公司信息通信分公司
国家电网有限公司信息通信分公司
-
出处
《计算机技术与发展》
2023年第5期88-95,共8页
-
基金
国家电网有限公司科技项目(5700-202152169A-0-0-00)。
-
文摘
随着云上微服务系统规模的不断扩大,微服务之间的依赖关系变得更加紧密复杂,某个微服务的故障可能会通过微服务之间的互相调用传播至其他微服务,进而导致整个微服务系统发生异常。面对依赖关系复杂的微服务系统,考虑到故障的传播性,设计了一种云上微服务故障自动定位方法MicroAFL。首先,MicroAFL实时监测与收集微服务系统运行指标数据,基于自编码器模型对运行指标数据进行分析,判断微服务系统是否存在异常;一旦检测到异常,MicroAFL通过解析云上微服务运行实例之间的通讯数据获取微服务之间的调用关系,进而构建服务调用关系图以刻画故障传播途径;其次,将各个微服务的运行状态与系统资源利用率相关联从而计算服务调用关系图中每个节点的异常权重,并通过改进的加权PageRank算法推断和定位引发异常的故障微服务;最后,在华为云上搭建名为Sock-shop的微服务系统对MicroAFL的故障定位准确性进行评估,实验结果表明MicroAFL的故障定位准确率相较对比方法有所提升。
-
关键词
自编码器
微服务
云环境
故障自动定位
服务调用关系图
故障传播
-
Keywords
autoencoder
microservice
cloud environment
automatic fault location
service call diagram
fault propagation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-