在现代 Web 应用中,负载均衡是非常重要的一环。它可以实现多台服务器之间的分配负载,以此达到提高 Web 应用的访问速度、提高应用的可用性和可靠性的目的。在 Node.js 和 Express.js 实现负载均衡的一个比较好的方式就是使用 Cluster。本文将会介绍在 Express.js 中使用 Cluster 进行负载均衡的具体做法。
Cluster 的基础知识
Cluster 是 Node.js 集群模块,它允许在多个进程中共享一个网络端口,这使得 Node.js 服务器可以更有效地利用多核 CPU,从而实现了负载均衡。使用 Cluster 模块的形式一般为:
-- -------------------- ---- ------- ----- ------- - ------------------- ----- ------- - ---------------------------- -- ------------------ - -- ---- -------- --- ---- - - -- - - -------- ---- - --------------- - - ---- - -- ------- --- ----- --- --- ---------- -- -- ---- ---- -- -- -- ---- ------ ----------------- -
在这个例子中,我们首先通过 os.cpus().length
获取当前系统的 CPU 数量,然后 fork 出相应数量的子进程(即 worker),每个 worker 会监听同一个端口。当有请求进来时,master 进程会将请求分布到不同的 worker 进程中。这样我们就实现了负载均衡。值得注意的是,在 Cluster 中不会将请求平均分配给每个 worker,而是采用一个 round-robin 策略。
在 Express 中启用 Cluster
在 Express.js 中启用 Cluster 也很简单,只要把上面的例子组合起来即可。我们只需要修改一下 worker 进程监听的地址和端口即可,如下所示:
-- -------------------- ---- ------- ----- ------- - ------------------- ----- ------- - ------------------- ----- -- - -------------- -- ------------------ - ----- ------- - ----------------- --- ---- - - -- - - -------- ---- - --------------- - -------------------- -------- -------- - ------------------- - - ------------------ - - -- --------- --- ------------------ -------- -------- ----- ------- - ------------------- - - ------------------ - - ---- ---- ----- - - ---- - -- --- ------- - - -------- --------------------- - --- --------- --------------- --- - ---- - ----- --- - ---------- ------------ -------- ----- ---- - --------------- ----- ---- ------ - - ------------------- --- ---------------- -------- -- - ------------------- - - ----------------- - - --------- -- ---- ------- --- -
在这个例子中,我们首先让 master 进程启动出与 CPU 数量相等的 worker 进程,并监听这些 worker 进程的状态。当一个 worker 进程 crach 时,master 进程会 fork 出一个新的 worker 进程来取代它。而在 worker 进程中,我们只需要像之前一样创建 Express 应用和路由,和普通的应用完全一样。我们使用了 cluster.worker.id
来辨识每个 worker 进程,这个信息可以将负载分配到不同的进程中。当我们访问 localhost:3000
时,页面会返回 worker 进程的 id:
Hello World from worker 1
细节优化
实现了简单的负载均衡之后,我们可以看到工作正常,但是还有一些细节问题需要优化:
Cluster 进程中的崩溃问题
当一个 Cluster 进程崩溃时,Node.js 默认会退出主程序并终止所有进程。如果我们想维持负载均衡,我们需要让主进程重新 fork 一个新的 worker 进程来继续处理请求。因此我们需要在 master 进程中监听 worker 的
exit
事件,如下://... cluster.on('exit', function (worker, code, signal) { console.log('Worker ' + worker.process.pid + ' died with code: ' + code + ', and signal: ' + signal); console.log('Starting a new worker'); cluster.fork(); });
环境变量问题
子进程的环境变量通常会继承父进程的环境变量,这会导致在部署时出现各种问题。例如,在进行日志记录时,我们需要根据不同的环境设置不同的文件名。因此我们需要手动设置 worker 进程对应的环境变量,如下:
//... cluster.on('fork', function (worker) { worker.send({ type: 'environment', env: process.env.NODE_ENV }); });
在主进程启动子进程之后,我们通过发送
environment
消息给子进程,让子进程根据自己的环境变量来进行相应地设置。平滑重启问题
由于 Node.js 中的长连接问题,一般需要在重启时避免所有连接全部关闭,以此避免用户端的连接错误问题。Express.js 推荐的做法是通过
server.close()
和server.listen()
来进行平滑重启,但是在 Cluster 中,这会导致同时启动多个监听服务,进而导致端口占用等问题。因此我们需要使用第三方模块express-graceful-shutdown
,如下:-- -------------------- ---- ------- ----- ----- ----------------- - ------------------------------------- ----- --- - ---------- ------------ -------- ----- ---- - --------------- ----- ---- ------ - - ------------------- --- ----- ------ - ---------------- -------- -- - ------------------- - - ----------------- - - --------- -- ---- ------- --- --------------------- -------- --------- - -- ------------- --- ----------- - ------------------------- -------- -- - ---------------- --- - ---
在这个例子中,我们使用
const gracefullShutdown = require('express-graceful-shutdown');
导入了express-graceful-shutdown
模块,这个模块可以让我们平滑地处理 server 关闭。当主进程接收到重启指令时,会发送一个shutdown
消息给所有子进程,然后运行gracefullShutdown()
函数来关闭每个子进程中的 server 对象,并在 server 完全关闭时执行回调函数。最后,当所有子进程都成功关闭时,主进程会退出自己。需要注意的是,因为我们已经在 worker 中的server.listen()
函数中开启了 server 监听,所以我们不需要再在 master 进程中监听端口。
总结
在 Express.js 中使用 Cluster 进行负载均衡是一个非常优秀的选择。在使用 Cluster 进行负载均衡的时候,我们需要考虑到子进程的崩溃问题、环境变量问题、平滑重启问题等各种细节问题。本文介绍了在这些细节问题中的优秀解决方案,并且提供了完整的示例代码,希望对读者在实践中有所帮助。
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/64c9ba625ad90b6d0417f115