Kubernetes 中的调用链跟踪和分析实践

在 Kubernetes 运行环境中,一次 HTTP 请求可能需要经过多个不同的 Pod,并且可能需要涉及多个服务之间的协作来完成。对于开发者来说,这样的请求链路复杂度增加会使得问题排查困难、性能优化变得复杂,因此需要引入调用链跟踪技术来帮助开发者更好地解决这些困难。

本文将介绍在 Kubernetes 中如何使用调用链跟踪技术,包括如何实现和使用 OpenTracing 和 Jaeger,并且展示如何在 Kubernetes 集群中进行链路跟踪和分析。在本文中,我们将会实现一个示例应用来演示如何使用这些技术。

什么是调用链跟踪技术?

调用链跟踪(Distributed Tracing)技术是一种可以追踪分布式系统中请求的传递路径和处理过程的技术。在微服务系统中,不同的服务、模块之间需要进行协作,而一个请求通常需要访问多个服务,请求的处理任务会在不同的服务上被执行。调用链跟踪技术可以在每一个服务中插入一个追踪点,用来记录请求的传递信息,并将这些信息重新组合成一条完整请求链路。

在调用链跟踪技术中,主要由两个角色组成:提供追踪信息的客户端和处理追踪信息的服务端。客户端通常会在发送请求时,在请求 Header 中添加一些标记,此标记会被路由器、负载均衡器、服务网格等网络中间件带上,并在整个请求链路中传递下去。服务端可以通过解析请求 Header 中的标记信息,来组织出一个完整的请求链路,并将这些信息可视化展示出来。

为什么需要调用链跟踪技术?

在线上环境中,发现问题的环节是非常复杂的。如果只是单单从上层应用的表象出发去分析一个故障,那么花费的时间和付出的代价必定是巨大的。通常我们需要结合其他的几个环节,以此来排查问题、调优表现和优化性能。其中,调用链技术可以非常完美地解决当前遇到的问题。

  • 莫衷一是的故障信息:一些故障现象很难直接识别哪些服务受到了影响,调用链技术可以提供可视化界面来看到服务间的依赖关系。

  • 难以排查过程:在分布式系统中,单个服务可能是多个微服务系统的组成部分,故障可能不是由单个系统引起的。调用链技术可以轻松地找到引起故障的一个或多个微服务系统或者其它问题。

  • 对性能问题缺少足够的数据支持:在微服务架构中,经常会出现因某个微服务系统的性能问题而引起整个应用性能问题的情况。使用调用链技术,可以方便地找到出现性能问题的微服务系统,并对这个系统进行优化。

OpenTracing 和 Jaeger

基于调用链的技术方案有很多,目前主要有三种实现:Zipkin、OpenTracing 和 Jaeger。在本次实践中我们将会使用 OpenTracing 和 Jaeger。

OpenTracing

OpenTracing 是一个针对跨进程追踪协议的规范,它提供了一种简单、标准化的方式来在分布式系统中收集追踪数据。OpenTracing 规范可用于任意编程语言和相互通信的系统。通过 OpenTracing 可以收集分布式系统的完整调用链路信息。OpenTracing 可以让开发者在客户端和服务端之间很容易地传递上下文信息。OpenTracing 提供了大量的语言库支持,如 Python、Java、.NET、PHP、C++ 等等。

Jaeger

Jaeger 是一个分布式系统中调用链跟踪的系统,它与 OpenTracing 协议兼容,而且内置支持的 OpenTracing API。同时,它还提供了一个 UI 来展示分布式系统中各个服务之间的关系,以及请求调用的情况。

在 Kubernetes 中实现调用链跟踪

以下是一个基于 Kubernetes 的微服务应用的架构示意图。本应用共有四个微服务,Gateway 接收所有 Http 请求并将请求转发到相应的微服务。微服务 A、B、C 为应用程序的后台服务,其中 A 调用服务 B 和 C,B 和 C 会向外部发起远程调用(例如访问数据库或其他微服务)。最后,服务 D 用于接收微服务 A 的消息通知。

以下是如何在 Kubernetes 中使用 OpenTracing 和 Jaeger 实现调用链跟踪:

安装 Jaeger

在 Kubernetes 中安装 Jaeger 可以使用 Helm 部署,我们将在本文中使用 Jaeger 的官方 Helm Chart。在部署之前,确保您已经安装了 Helm 客户端,并且连接到 Kubernetes 集群。

当 Helm 和 Tiller 安装好之后,应该可以看到 Jaeger is 等待部署。使用 kubectl 命令检查 pods 是否处于正常状态:

一旦所有的 jaeger-all-in-onejaeger-agent pod 处于「Running」状态,就说明 Jaeger 已经部署成功了。

实现调用链跟踪

将 Jaeger 部署到 Kubernetes 之后,我们需要在微服务中添加 OpenTracing 的客户端库,以便在服务运行期间生成和发送调用链信息。以下是使用 Python 的 Jaeger 客户端库在微服务 A 中实现调用链跟踪的示例。

在这个示例中,我们使用 Python 版本的 Jaeger 客户端库进行初始化,并使用服务名称 microservice_a 进行注册。接下来我们使用 opentracing.tracer.start_span() 方法:创建一个 span(描述请求链路中的一段处理)。

您需要确定一个逻辑父级 Span,然后在执行它的任何子任务时对其进行包装。在本示例中,逻辑上的父级 Span 是 process_request。在 process_request 任务内部,我们可以使用 span 对象来记录发生的任何事件。一般情况下,可以使用 set_tag() 方法为 Span 添加内容。对于耗时操作,可以使用start_time()finish_time() 方法测量。

最后,我们需要调用 tracer.close() 方法来结束 Span 的跟踪。将它们的数据发送给后端服务器。

当然,各个语言的 OpenTracing 客户端库支持的 API 不尽相同,但是这种实现方式大体相同。在这里推荐阅读 OpenTracing 官方文档 了解更多信息。

查看调用链跟踪信息

通过部署 Jaeger 并在 Python 代码中添加 Jaeger 客户端库之后,您就可以通过 Jaeger UI 来查看应用的调用链路了。

在完成 Jaeger 安装的网络之前,我们无法访问 Jaeger UI,因此使用以下 kubectl 命令将 Jaeger UI 暴露为 NodePort 服务:

在浏览器中访问:http://<node_ip>:<node_port> 来打开 Jaeger UI。在 Jaeger UI 上,您可以轻松地看到您的应用程序的调用链路。

请注意,在本示例中,每个服务都向 Jaeger 报告,而 Jaeger 是一个独立的服务本身。这种架构确保了系统拓扑关系的集中管理。此外,Jaeger 提供了非常有用的可视化工具,可以轻松地查看不同进程之间的依赖关系和调用时间。

总结

在本文中,我们介绍了在 Kubernetes 中使用调用链跟踪技术的必要性,通过使用 OpenTracing 和 Jaeger 实现分布式系统的调用链跟踪,包括如何在 Kubernetes 上安装 Jaeger,如何在 Python 应用程序的微服务中添加 Jaeger 客户端库,并查看调用链跟踪在 Jaeger UI 中的输出。调用链跟踪技术可以帮助开发者在分布式服务中更好地查找和解决问题,最终优化系统性能。

来源:JavaScript中文网 ,转载请注明来源 本文地址:https://www.javascriptcn.com/post/6543881d7d4982a6ebd5451e


纠错
反馈