Kubernetes 如何使用 HPA 自动伸缩应用实例

面试官:小伙子,你的数组去重方式惊艳到我了

Kubernetes 作为一款高效的容器编排工具,在现代云计算领域得到了广泛应用。其中,HPA(Horizontal Pod Autoscaler)是 Kubernetes 内置的一个自动伸缩的控制器。它可以根据应用负载的变化来动态地调整容器的数量,确保应用能够健康运行。

本文将介绍 Kubernetes 中 HPA 的使用方法,并结合实际场景进行详细讲解。

HPA 的基本概念

在 Kubernetes 中,Pod 是最小的调度单元,它可以包含一个或多个容器,用于运行应用程序。HPA 的本质就是对 Pod 的水平扩展或收缩,以满足负载需求。

HPA 的工作原理如下:

  1. 通过 Kubernetes API Server,HPA 监控应用程序的指标(如 CPU 占用率、内存占用率等)。
  2. HPA 计算出当前应用程序的负载,并与用户设置的目标负载作比较。
  3. 如果当前负载超出了目标负载的上限,HPA 将自动增加 Pod 的数量,以提供更多的容量。
  4. 如果当前负载低于目标负载的下限,HPA 将自动减少 Pod 的数量,以节省资源。

配置 HPA

使用 HPA 时,需要以下配置:

  1. 应用程序必须支持自动扩展,在 POD 描述文件中明确声明自动扩展服务的监控指标(如 cpumemory)。
  2. 开启 K8S 集群的 metrics-server 插件,以收集应用的监控数据。
  3. 安装 HPA 控制器,并配置目标负载值。

配置应用程序

我们以一个简单的 nginx 镜像为例,来演示如何配置应用程序:

----------- -------
----- ----------
---------
  ----- ----------------
  -------
    ---- -----
-----
  --------- -
  ---------
    ------------
      ---- -----
  ---------
    ---------
      -------
        ---- -----
    -----
      -----------
      - ----- -----
        ------ -----
        ------
          - -------------- --
        ----------
          ---------
            ---- ----   - -- --- -------
        ---------------
          --------
            ----- -----------
            ----- --

resources 字段中,我们声明了 cpu 的请求为 100m。这意味着,当 Pod 对 CPU 的请求量超过 100m 时,HPA 将会启动自动扩展服务。

开启 metrics-server

metrics-server 是 Kubernetes 用于收集 Pod 监控数据的插件。要开启 metrics-server,我们需要执行以下命令:

- ------- ----- -- ------------------------------------------------------------------------------------------

安装 HPA

安装 HPA 控制器非常简单,只需要执行以下命令:

- ------- ----- ----------- ---------- ---------------- ------- -------- ----------------

这将会创建一个名为 nginx-deployment 的 HPA 控制器,并设置最小 Pod 数量为 1,最大 Pod 数量为 10,目标 CPU 占用率为 50%。当 CPU 占用率超过 50% 时,HPA 会自动扩展 nginx 实例数量。

示例场景

现在,我们可以通过一个示例场景,来演示 HPA 的自动伸缩功能。假设我们有一个基于 node.js 构建的 web 应用,需要支持高并发访问。以下是相关的 yaml 配置文件:

----------- -------
----- ----------
---------
  ----- ------------------
  -------
    ---- -------
-----
  --------- -
  ---------
    ------------
      ---- -------
  ---------
    ---------
      -------
        ---- -------
    -----
      -----------
      - ----- -------
        ------ --------------
        ------
        - -------------- ----
        ---------------
          ----------
            ----- ----
          -------------------- -
          -------------- --
        --------------
          --------
            ----- -
            ----- ----
          -------------------- -
          -------------- --
      -----------------
        - ----- ------------

---

----------- --
----- -------
---------
  ----- ---------------
-----
  ---------
    ---- -------
  ----- --------
  ------
    - ----- ----
      --------- ---
      ----- ----
      ----------- ----

这里我们需要说明的是,我们的 node 后端程序定义了两个探针,分别为 readinessProbelivenessProbe,用于监控程序运行状态。

启动应用

首先,我们需要使用下面的命令来启动应用:

- ------- ----- -- ------------

这会创建一个名为 nodeapp-deployment 的 deployment,ok!

开启 HPA

由于这个 web 应用具有高并发的特点,如果我们不手动增加容器,那么很容易出现请求超时的问题。为了解决这个问题,我们可以使用 HPA 自动伸缩功能。

下面是相应的命令:

- ------- --------- ---------- ------------------ ---------------- ------- --------

这会创建一个名为 nodeapp-deployment 的 HPA 控制器,并设置 CPU 占用率上限为 50%,最小 Pod 数量为 1,最大 Pod 数量为 10

测试应用

现在我们可以开始测试我们的应用程序了。使用以下命令来获取应用程序的服务地址:

- ------- --- ------- --------------- --------------------------------------------------------

访问该地址,我们可以通过 web 浏览器对应用进行压力测试。

增加负载

当我们模拟多用户同时访问应用程序时,可以看到 CPU 占用率已经超过了 50%。此时,HPA 会自动增加 Pod 数量,以扩展应用的容量。

使用以下命令监控 HPA 的变化:

- ------- --- ---

可以看到,当 CPU 占用率超过了 50% 时,HPA 在 5 秒内自动增加了一个 Pod 实例。

缩减负载

当负载降低时,HPA 会自动缩减容器数量,以节省资源。

使用以下命令,将 CPU 占用率降低至 30%:

- ------- ---- --- ---------------------- -- ------ ----- - --------- ---

这里,我们使用 stress 工具,模拟一个短时长的 CPU 占用率高峰。

使用以下命令检查 Pod 数量:

- ------- --- ----

可以看到,当 CPU 占用率降低至 30% 时,HPA 在 5 秒内自动缩减了一个 Pod 的数量。

总结

通过本文,我们深度学习了 Kubernetes 中 HPA 的使用方法,并针对实际服务器部署情况给出了详细的指导和展示。它可以帮助我们避免由于负载过重而导致的应用程序崩溃,从而确保应用程序可以持续运行。如果你打算构建一个可伸缩的应用程序,那么 HPA 将会是一个不错的选择。

来源:JavaScript中文网 ,转载请联系管理员! 本文地址:https://www.javascriptcn.com/post/64d4b07eb5eee0b525c829e0


猜你喜欢

  • 使用 Headless CMS 简化博客网站搭建

    在传统的博客网站搭建模式中,通常需要使用一个完整的 CMS 系统,如 WordPress 或 Joomla 等,它们提供了完整的前端和后端功能,包括用户管理、文章发布、样式自定义等。

    5 小时前
  • Cypress 错误解决:如何解决 No Such Element 错误

    Cypress 是一个基于 JavaScript 的前端自动化测试框架,它可以帮助我们高效地编写和运行自动化测试用例。然而,在使用 Cypress 进行测试的过程中,我们有时会遇到 No Such E...

    5 小时前
  • Mocha 测试中怎么样才能只执行部分测试用例?

    在使用 Mocha 进行测试时,你可能需要只运行部分测试用例而不是全部运行。这可能是因为你的测试套件非常大,或者你想只测试一部分代码。本文将介绍如何在 Mocha 中只执行部分测试用例,并提供一些示例...

    5 小时前
  • IOS 开发:如何优化本地存储

    本地存储是一种在移动应用程序和网站开发中常见的技术,它可以在用户离线时继续提供信息、内容和功能。在 IOS 开发中,使用本地存储的最佳方法是使用内置数据库 SQLite。

    5 小时前
  • TypeScript 中使用 let 和 const 定义变量和常量

    介绍 TypeScript 是一种静态类型检查器,它扩展了 JavaScript 并使其更易于使用和维护。在 TypeScript 中,我们可以使用 let 和 const 来定义变量和常量。

    5 小时前
  • 如何修复 CSS Reset 对滚动条样式的影响?

    在前端开发中,CSS Reset 是一个非常常见的技术。 它的原理是通过将浏览器的默认样式重置为一致的标准,以确保不同浏览器之间的样式相同。 但是 CSS Reset 常常会对浏览器滚动条样式造成影响...

    5 小时前
  • 在 Fastify 中构建 JWT 认证服务器

    引言 JWT(JSON Web Tokens)是一种用于安全交换信息的开放式标准,它可以在多个服务之间传递认证信息。在构建 Web 应用程序时,往往需要在请求和响应之间进行身份验证,JWT 作为一种有...

    5 小时前
  • 如何使用 ES6 中的数组方法简化代码

    如何使用 ES6 中的数组方法简化代码 随着 JavaScript 语言的发展,ES6 中新增的许多数组方法大大简化了开发人员的编程工作。这些方法可以让我们更容易地处理数据和操作数组,同时大大增加了代...

    5 小时前
  • SPA 开发中前后端分离的优缺点及应用实践

    单页应用(Single Page Application,SPA)是一种现代化的 Web 应用程序开发模式,它的一个特点就是前后端分离。本文将介绍 SPA 开发中前后端分离的优缺点,以及如何实践前后端...

    5 小时前
  • 使用 Enzyme + Jest 测试通过 HOC 形式创建的 React 组件

    在 React 中,高阶组件(Higher Order Component,简称 HOC)是一种非常常见的模式,它允许我们将组件逻辑重用在多个组件之间。使用 HOC 可以让我们更好地管理组件间的复杂度...

    5 小时前
  • PM2 与 Docker:构建可伸缩的 Node.js 应用程序

    前言 在开发现代 Web 应用程序时,Node.js 已成为最受欢迎的开发语言之一。Node.js 可以大力发挥其高度可扩展的架构,以构建高性能的 Web 应用程序。

    5 小时前
  • Material Design 中主题颜色的修改与自定义方法

    Material Design 是 Google 在 2014 年发布的一种全新的平面设计语言,旨在提供一个简洁、明晰、具有层次的用户界面设计风格。该设计语言使用明亮的色彩、深入的阴影效果、多种类型的...

    5 小时前
  • CSS Grid 布局问题集锦

    CSS Grid 布局是一种基于网格的布局系统,可以帮助前端开发人员更轻松地构建自适应、灵活且可复用的界面。尽管 CSS Grid 布局越来越普及,但是仍然存在一些问题需要面对和解决。

    5 小时前
  • 在 TailwindCSS 中实现无限滚动加载的技巧

    随着 Web 应用程序的普及,无限滚动加载成为了越来越流行的设计模式。它可以使用户感到更流畅,避免需要单击“下一页”按钮的情况。在 TailwindCSS 中实现无限滚动加载并不难,但是需要了解一些特...

    5 小时前
  • Redux 和 Immutable 数据结构的集成

    Redux 和 Immutable 数据结构的集成 储存和操作状态是前端应用程序的重要组成部分。Redux 和 Immutable 都是流行的前端技术,它们可以帮助处理状态,并提高应用程序的性能。

    5 小时前
  • ECMAScript 2021 和 React:优化性能的新方法

    前言 前端开发涉及到很多复杂的技术,而随着业界不断提升对用户体验的要求,性能优化也成为了前端开发的重点。ECMAScript 2021 和 React 的新功能在性能优化方面提供了一些新的方法,让开发...

    5 小时前
  • 10个ECMAScript 2019的新特性

    ECMAScript是JavaScript的标准规范,每年都会推出新的版本,提供新的特性和语法糖。2019版的ECMAScript已经发布,本篇文章将详细介绍10个新特性,对前端开发有指导意义。

    5 小时前
  • 如何实现无障碍访问依赖动态内容的应用程序?

    随着互联网技术的发展,越来越多的应用程序需要依赖动态内容来提供用户体验,例如 AJAX 加载、单页应用程序等。然而,这些应用程序往往会给残障人士造成访问困难,导致其无法充分利用这些服务。

    5 小时前
  • 构建高可用的 SPA 应用:浏览器兼容解决方案

    单页应用(Single Page Application,SPA)是现代 Web 开发技术的重要组成部分,它可以提供卓越的用户体验和高效的页面加载速度。但是,由于 Web 浏览器市场的多样性,有时候我...

    5 小时前
  • 在 SASS 中使用媒体查询的正确方法

    在SASS中使用媒体查询的正确方法 作为前端开发人员,我们经常需要针对不同的屏幕尺寸和设备类型来优化我们的网页布局和样式。这时候,媒体查询就成了我们必不可少的工具。

    5 小时前