Kubernetes 中的自动伸缩 ——Horizontal Pod Autoscaler

阅读时长 5 分钟读完

Kubernetes 是一个用于管理云端容器化的应用程序的强大平台。自动伸缩是 Kubernetes 一个非常实用的功能,可以自动根据资源使用情况增加或减少 Pod 的数量,以确保服务的可用性和高效性。

本文将介绍 Kubernetes 中的自动伸缩功能——Horizontal Pod Autoscaler (HPA),包括其定义、工作原理、使用方法和示例代码。

HPA 的定义和工作原理

Horizontal Pod Autoscaler,即 Pod 的水平自动伸缩器,是 Kubernetes 中的一个资源控制器,用于根据 Pod 的 CPU 使用率或其他指标自动调整 Pod 的数量。

HPA 工作原理如下所示:

  1. HPA 监控目标资源指标,例如 CPU 使用率。
  2. 当目标资源超过阈值时,HPA 将启动 Pod。
  3. 当目标资源低于阈值时,HPA 将删除 Pod。

HPA 根据用户指定的条件来增加或减少 Pod,以确保应用程序达到最佳性能和资源利用率。

HPA 的使用方法

下面是如何使用 HPA 实现自动伸缩。

步骤1:配置自动伸缩指标

要使用 HPA,必须指定自动伸缩指标,例如 CPU 使用率。

在 Deployment 中添加 resource 请求,HPA 将使用这些信息来计算 CPU 使用率。下面是一个 Deployment 的 YAML 配置文件样例:

-- -------------------- ---- -------
----------- -------
----- ----------
---------
  ----- -----
-----
  --------- -
  ---------
    ------------
      ---- -----
  ---------
    ---------
      -------
        ---- -----
    -----
      -----------
      - ----- ---------------
        ------ ------------
        ----------
          ---------
            ---- ------

在这个样例中,container 容器被分配了 100m 的 CPU 资源,这个信息将被 HPA 计算。

步骤2:创建 HPA

HPA 可以通过命令行或 YAML 文件创建。下面展示创建一个基于 CPU 使用率自动伸缩的 HPA 的命令行示例:

在这个示例中:

  1. --cpu-percent=50 指定 CPU 使用率超过 50% 时需要扩展 Pod 数量。
  2. --min=1 设置最小 Pod 数量为 1。
  3. --max=10 设置最大 Pod 数量为 10。

步骤3:验证 HPA

通过以下命令查看 HPA:

如果输出了创建的 HPA,HPA 创建成功。

步骤4:生成负载

为了测试 HPA 是否正常工作,需要生成负载。一个简单的测试是使用 Apache 服务器的负载工具 ab:

这个命令将生成 1000 个请求并且每秒只发送 10 个请求。当负载逐渐增加时,HPA 应该会增加 Pod 数量。

步骤5:验证 Pod 数量

检查 Pod 数量变化,使用以下命令:

应该看到 Pod 数量在应对负载变化时自动增加和减少。

HPA 示例代码

下面是一个基于 Node.js 的应用程序示例:

-- -------------------- ---- -------
--- ---- - ----------------
--- -- - --------------
--- -------------- - -----
--- ---------------------- - ----

--- ------------- - -------- --------- --------- -
  -- --------------- --- ----- -
    -------------- - -------------------
  - ---- -- --------------- -- ---- --
             ---------------------- -- ---------------------- - -------- -
    --- -------- - -------------------
    --- --------------- - ----------------- - ------------- - 
                            --------------------- - -------------------- -
                           ----------------------- - --------- - ----
    -------------- - ---------
  - ---- -
    ------------------- -- ------- ---- ---- ----------- --- ----- ---- ---- - - ---------------------- - --- -------
  -
  ------------------------
  ------------------- ----- ---- - - ------------- - 
               - -------- -- - - ---------------- - - -------- -
               ---- ------ - - --------------------------- - ---- - ---- - -----
--

--- --- - ---------------------------------
-----------------

这个应用程序监听一个端口并且在每个 HTTP 请求中都返回一个带有当前主机名、 CPU 数量和 CPU 使用率的简单响应。

结论

Kubernetes HPA 可以帮助自动管理 Pod 数量,以确保应用程序灵活地满足资源需求。通过上述方法,可以轻松配置、验证和测试自动伸缩。因此,我们建议在 Kubernetes 集群上使用 HPA 来管理应用程序。

来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/67199188ad1e889fe23183c2

纠错
反馈