Kubernetes 是一个用于管理云端容器化的应用程序的强大平台。自动伸缩是 Kubernetes 一个非常实用的功能,可以自动根据资源使用情况增加或减少 Pod 的数量,以确保服务的可用性和高效性。
本文将介绍 Kubernetes 中的自动伸缩功能——Horizontal Pod Autoscaler (HPA),包括其定义、工作原理、使用方法和示例代码。
HPA 的定义和工作原理
Horizontal Pod Autoscaler,即 Pod 的水平自动伸缩器,是 Kubernetes 中的一个资源控制器,用于根据 Pod 的 CPU 使用率或其他指标自动调整 Pod 的数量。
HPA 工作原理如下所示:
- HPA 监控目标资源指标,例如 CPU 使用率。
- 当目标资源超过阈值时,HPA 将启动 Pod。
- 当目标资源低于阈值时,HPA 将删除 Pod。
HPA 根据用户指定的条件来增加或减少 Pod,以确保应用程序达到最佳性能和资源利用率。
HPA 的使用方法
下面是如何使用 HPA 实现自动伸缩。
步骤1:配置自动伸缩指标
要使用 HPA,必须指定自动伸缩指标,例如 CPU 使用率。
在 Deployment 中添加 resource 请求,HPA 将使用这些信息来计算 CPU 使用率。下面是一个 Deployment 的 YAML 配置文件样例:
-- -------------------- ---- ------- ----------- ------- ----- ---------- --------- ----- ----- ----- --------- - --------- ------------ ---- ----- --------- --------- ------- ---- ----- ----- ----------- - ----- --------------- ------ ------------ ---------- --------- ---- ------
在这个样例中,container 容器被分配了 100m 的 CPU 资源,这个信息将被 HPA 计算。
步骤2:创建 HPA
HPA 可以通过命令行或 YAML 文件创建。下面展示创建一个基于 CPU 使用率自动伸缩的 HPA 的命令行示例:
kubectl autoscale deployment myapp --cpu-percent=50 --min=1 --max=10
在这个示例中:
--cpu-percent=50
指定 CPU 使用率超过 50% 时需要扩展 Pod 数量。--min=1
设置最小 Pod 数量为 1。--max=10
设置最大 Pod 数量为 10。
步骤3:验证 HPA
通过以下命令查看 HPA:
kubectl get hpa
如果输出了创建的 HPA,HPA 创建成功。
步骤4:生成负载
为了测试 HPA 是否正常工作,需要生成负载。一个简单的测试是使用 Apache 服务器的负载工具 ab:
ab -n 1000 -c 10 http://myapp-service
这个命令将生成 1000 个请求并且每秒只发送 10 个请求。当负载逐渐增加时,HPA 应该会增加 Pod 数量。
步骤5:验证 Pod 数量
检查 Pod 数量变化,使用以下命令:
kubectl get pods
应该看到 Pod 数量在应对负载变化时自动增加和减少。
HPA 示例代码
下面是一个基于 Node.js 的应用程序示例:
-- -------------------- ---- ------- --- ---- - ---------------- --- -- - -------------- --- -------------- - ----- --- ---------------------- - ---- --- ------------- - -------- --------- --------- - -- --------------- --- ----- - -------------- - ------------------- - ---- -- --------------- -- ---- -- ---------------------- -- ---------------------- - -------- - --- -------- - ------------------- --- --------------- - ----------------- - ------------- - --------------------- - -------------------- - ----------------------- - --------- - ---- -------------- - --------- - ---- - ------------------- -- ------- ---- ---- ----------- --- ----- ---- ---- - - ---------------------- - --- ------- - ------------------------ ------------------- ----- ---- - - ------------- - - -------- -- - - ---------------- - - -------- - ---- ------ - - --------------------------- - ---- - ---- - ----- -- --- --- - --------------------------------- -----------------
这个应用程序监听一个端口并且在每个 HTTP 请求中都返回一个带有当前主机名、 CPU 数量和 CPU 使用率的简单响应。
结论
Kubernetes HPA 可以帮助自动管理 Pod 数量,以确保应用程序灵活地满足资源需求。通过上述方法,可以轻松配置、验证和测试自动伸缩。因此,我们建议在 Kubernetes 集群上使用 HPA 来管理应用程序。
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/67199188ad1e889fe23183c2