如何在 Express.js 中使用 Cluster 进行负载均衡

阅读时长 8 分钟读完

在现代 Web 应用中,负载均衡是非常重要的一环。它可以实现多台服务器之间的分配负载,以此达到提高 Web 应用的访问速度、提高应用的可用性和可靠性的目的。在 Node.js 和 Express.js 实现负载均衡的一个比较好的方式就是使用 Cluster。本文将会介绍在 Express.js 中使用 Cluster 进行负载均衡的具体做法。

Cluster 的基础知识

Cluster 是 Node.js 集群模块,它允许在多个进程中共享一个网络端口,这使得 Node.js 服务器可以更有效地利用多核 CPU,从而实现了负载均衡。使用 Cluster 模块的形式一般为:

-- -------------------- ---- -------
----- ------- - -------------------
----- ------- - ----------------------------

-- ------------------ -
  -- ---- --------
  --- ---- - - -- - - -------- ---- -
    ---------------
  -
- ---- -
  -- ------- --- ----- --- --- ----------
  -- -- ---- ---- -- -- -- ---- ------
  -----------------
-

在这个例子中,我们首先通过 os.cpus().length 获取当前系统的 CPU 数量,然后 fork 出相应数量的子进程(即 worker),每个 worker 会监听同一个端口。当有请求进来时,master 进程会将请求分布到不同的 worker 进程中。这样我们就实现了负载均衡。值得注意的是,在 Cluster 中不会将请求平均分配给每个 worker,而是采用一个 round-robin 策略。

在 Express 中启用 Cluster

在 Express.js 中启用 Cluster 也很简单,只要把上面的例子组合起来即可。我们只需要修改一下 worker 进程监听的地址和端口即可,如下所示:

-- -------------------- ---- -------
----- ------- - -------------------
----- ------- - -------------------
----- -- - --------------

-- ------------------ -
  ----- ------- - -----------------

  --- ---- - - -- - - -------- ---- -
    ---------------
  -

  -------------------- -------- -------- -
    ------------------- - - ------------------ - - -- ---------
  ---

  ------------------ -------- -------- ----- ------- -
    ------------------- - - ------------------ - - ---- ---- ----- - - ---- - -- --- ------- - - --------
    --------------------- - --- ---------
    ---------------
  ---
- ---- -
  ----- --- - ----------

  ------------ -------- ----- ---- -
    --------------- ----- ---- ------ - - -------------------
  ---

  ---------------- -------- -- -
    ------------------- - - ----------------- - - --------- -- ---- -------
  ---
-

在这个例子中,我们首先让 master 进程启动出与 CPU 数量相等的 worker 进程,并监听这些 worker 进程的状态。当一个 worker 进程 crach 时,master 进程会 fork 出一个新的 worker 进程来取代它。而在 worker 进程中,我们只需要像之前一样创建 Express 应用和路由,和普通的应用完全一样。我们使用了 cluster.worker.id 来辨识每个 worker 进程,这个信息可以将负载分配到不同的进程中。当我们访问 localhost:3000 时,页面会返回 worker 进程的 id:

细节优化

实现了简单的负载均衡之后,我们可以看到工作正常,但是还有一些细节问题需要优化:

  1. Cluster 进程中的崩溃问题

    当一个 Cluster 进程崩溃时,Node.js 默认会退出主程序并终止所有进程。如果我们想维持负载均衡,我们需要让主进程重新 fork 一个新的 worker 进程来继续处理请求。因此我们需要在 master 进程中监听 worker 的 exit 事件,如下:

  2. 环境变量问题

    子进程的环境变量通常会继承父进程的环境变量,这会导致在部署时出现各种问题。例如,在进行日志记录时,我们需要根据不同的环境设置不同的文件名。因此我们需要手动设置 worker 进程对应的环境变量,如下:

    在主进程启动子进程之后,我们通过发送 environment 消息给子进程,让子进程根据自己的环境变量来进行相应地设置。

  3. 平滑重启问题

    由于 Node.js 中的长连接问题,一般需要在重启时避免所有连接全部关闭,以此避免用户端的连接错误问题。Express.js 推荐的做法是通过 server.close()server.listen() 来进行平滑重启,但是在 Cluster 中,这会导致同时启动多个监听服务,进而导致端口占用等问题。因此我们需要使用第三方模块 express-graceful-shutdown,如下:

    -- -------------------- ---- -------
    -----
    ----- ----------------- - -------------------------------------
    
    ----- --- - ----------
    
    ------------ -------- ----- ---- -
      --------------- ----- ---- ------ - - -------------------
    ---
    
    ----- ------ - ---------------- -------- -- -
      ------------------- - - ----------------- - - --------- -- ---- -------
    ---
    
    --------------------- -------- --------- -
      -- ------------- --- ----------- -
        ------------------------- -------- -- -
          ----------------
        ---
      -
    ---

    在这个例子中,我们使用 const gracefullShutdown = require('express-graceful-shutdown'); 导入了 express-graceful-shutdown 模块,这个模块可以让我们平滑地处理 server 关闭。当主进程接收到重启指令时,会发送一个 shutdown 消息给所有子进程,然后运行 gracefullShutdown() 函数来关闭每个子进程中的 server 对象,并在 server 完全关闭时执行回调函数。最后,当所有子进程都成功关闭时,主进程会退出自己。需要注意的是,因为我们已经在 worker 中的 server.listen() 函数中开启了 server 监听,所以我们不需要再在 master 进程中监听端口。

总结

在 Express.js 中使用 Cluster 进行负载均衡是一个非常优秀的选择。在使用 Cluster 进行负载均衡的时候,我们需要考虑到子进程的崩溃问题、环境变量问题、平滑重启问题等各种细节问题。本文介绍了在这些细节问题中的优秀解决方案,并且提供了完整的示例代码,希望对读者在实践中有所帮助。

来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/64c9ba625ad90b6d0417f115

纠错
反馈