Kubernetes 中的自动伸缩 ——Horizontal Pod Autoscaler-JavaScript中文网-JavaScript教程资源分享门户

Kubernetes 是一个用于管理云端容器化的应用程序的强大平台。自动伸缩是 Kubernetes 一个非常实用的功能，可以自动根据资源使用情况增加或减少 Pod 的数量，以确保服务的可用性和高效性。

本文将介绍 Kubernetes 中的自动伸缩功能——Horizontal Pod Autoscaler (HPA)，包括其定义、工作原理、使用方法和示例代码。

HPA 的定义和工作原理

Horizontal Pod Autoscaler，即 Pod 的水平自动伸缩器，是 Kubernetes 中的一个资源控制器，用于根据 Pod 的 CPU 使用率或其他指标自动调整 Pod 的数量。

HPA 工作原理如下所示：

HPA 监控目标资源指标，例如 CPU 使用率。
当目标资源超过阈值时，HPA 将启动 Pod。
当目标资源低于阈值时，HPA 将删除 Pod。

HPA 根据用户指定的条件来增加或减少 Pod，以确保应用程序达到最佳性能和资源利用率。

HPA 的使用方法

下面是如何使用 HPA 实现自动伸缩。

步骤1：配置自动伸缩指标

要使用 HPA，必须指定自动伸缩指标，例如 CPU 使用率。

在 Deployment 中添加 resource 请求，HPA 将使用这些信息来计算 CPU 使用率。下面是一个 Deployment 的 YAML 配置文件样例：

-- -------------------- ---- -------
----------- -------
----- ----------
---------
  ----- -----
-----
  --------- -
  ---------
    ------------
      ---- -----
  ---------
    ---------
      -------
        ---- -----
    -----
      -----------
      - ----- ---------------
        ------ ------------
        ----------
          ---------
            ---- ------展开代码

在这个样例中，container 容器被分配了 100m 的 CPU 资源，这个信息将被 HPA 计算。

步骤2：创建 HPA

HPA 可以通过命令行或 YAML 文件创建。下面展示创建一个基于 CPU 使用率自动伸缩的 HPA 的命令行示例：

kubectl autoscale deployment myapp --cpu-percent=50 --min=1 --max=10

在这个示例中：

--cpu-percent=50 指定 CPU 使用率超过 50% 时需要扩展 Pod 数量。
--min=1 设置最小 Pod 数量为 1。
--max=10 设置最大 Pod 数量为 10。

步骤3：验证 HPA

通过以下命令查看 HPA：

kubectl get hpa

如果输出了创建的 HPA，HPA 创建成功。

步骤4：生成负载

为了测试 HPA 是否正常工作，需要生成负载。一个简单的测试是使用 Apache 服务器的负载工具 ab：

ab -n 1000 -c 10 http://myapp-service

这个命令将生成 1000 个请求并且每秒只发送 10 个请求。当负载逐渐增加时，HPA 应该会增加 Pod 数量。

步骤5：验证 Pod 数量

检查 Pod 数量变化，使用以下命令：

kubectl get pods

应该看到 Pod 数量在应对负载变化时自动增加和减少。

HPA 示例代码

下面是一个基于 Node.js 的应用程序示例：

-- -------------------- ---- -------
--- ---- - ----------------
--- -- - --------------
--- -------------- - -----
--- ---------------------- - ----

--- ------------- - -------- --------- --------- -
  -- --------------- --- ----- -
    -------------- - -------------------
  - ---- -- --------------- -- ---- --
             ---------------------- -- ---------------------- - -------- -
    --- -------- - -------------------
    --- --------------- - ----------------- - ------------- - 
                            --------------------- - -------------------- -
                           ----------------------- - --------- - ----
    -------------- - ---------
  - ---- -
    ------------------- -- ------- ---- ---- ----------- --- ----- ---- ---- - - ---------------------- - --- -------
  -
  ------------------------
  ------------------- ----- ---- - - ------------- - 
               - -------- -- - - ---------------- - - -------- -
               ---- ------ - - --------------------------- - ---- - ---- - -----
--

--- --- - ---------------------------------
-----------------展开代码

这个应用程序监听一个端口并且在每个 HTTP 请求中都返回一个带有当前主机名、 CPU 数量和 CPU 使用率的简单响应。

结论

Kubernetes HPA 可以帮助自动管理 Pod 数量，以确保应用程序灵活地满足资源需求。通过上述方法，可以轻松配置、验证和测试自动伸缩。因此，我们建议在 Kubernetes 集群上使用 HPA 来管理应用程序。

来源：JavaScript中文网，转载请注明来源 https://www.javascriptcn.com/post/67199188ad1e889fe23183c2

Kubernetes 中的自动伸缩 ——Horizontal Pod Autoscaler