论文标题丨MicroRCA: Root Cause Localization of Performance Issues in Microservices
论文来源丨NOMS 2020
论文链接丨https://ieeexplore.ieee.org/document/9110353
源码链接丨未公布

TL;DR

软件架构正在经历从单体架构到微服务的转变,以实现软件开发的弹性、敏捷性和可扩展性。然而,由于技术异构、大量微服务以及软件功能和基础设施的频繁更新,微服务很难诊断性能问题。本文介绍了 MicroRCA,这是一种用于定位微服务中性能问题根本原因的系统。 MicroRCA 通过将应用程序性能症状与相应的系统资源利用率相关联,实时推断根本原因,无需任何应用程序检测。根本原因定位基于对跨服务和机器的异常传播进行建模的属性图。我们将常见异常注入到在 Kubernetes 集群中运行的微服务基准测试的实验评估表明,MicroRCA 可以很好地定位根本原因,具有 89% 的精度和 97% 的平均精度,优于几种最先进的方法。

Algorithm/Model

主要想法:

  1. 已知图结构
  2. 基于异常属性图的根因定位,主要还是使用随机游走的方法,但考虑了服务的部署关系。
模型框架

主要针对边权进行赋值:

Experiments

实验结果

联系作者