MongoDB 性能优化实践总结-JavaScript中文网-JavaScript教程资源分享门户

前言

MongoDB 是一款非常流行的 NoSQL 数据库，由于其高可扩展性、易扩展性和简单的数据架构，越来越多的公司开始在生产环境中使用它。然而，由于其灵活性也使得它成为一个性能调优的挑战。在本文中，我们将分享一些 MongoDB 性能优化的实践总结，以帮助您更好地理解如何优化 MongoDB 的性能。

索引优化

索引优化是 MongoDB 性能优化中最重要的一部分。索引是 MongoDB 查询优化的核心，并且在性能方面起着至关重要的作用。

创建索引

创建索引需要考虑数据量、操作数据的类型以及查询的类型等因素。在创建索引时需要考虑以下两个问题：

是否经常查询
是否过于频繁，可能影响写入性能

针对这两个问题，我们需要：

针对经常查询的属性建立索引，优先考虑区分度高的属性，以及排序或者分组操作频繁的属性。
对于写入性能的影响，可以开启后台索引创建工作mongoimport --numInsertionWorkers <n>。

系统内置索引方式

MongoDB 支持创建不同类型的索引，包括单键和多键索引、文本和地理位置索引等等。每种索引都有自己的优缺点，并且需要根据具体情况选择不同的索引类型。

单键和多键索引
文本索引

复合索引

复合索引由多个字段组成，可以大大提高查询的效率。然而，需要注意以下几点：

选择适合业务的字段组合创建复合索引，避免无必要的字段造成不必要的性能消耗；
首先考虑经常用于筛选的字段以及频繁配合排序或分页的字段；
不使用复合索引的字段不一定需要单独建立索引，具体场景具体分析。

查询优化

大多数性能问题都与查询操作有关，因此查询优化是 MongoDB 性能优化的另一个重要方面。可以通过以下几种方式优化查询：

范围查询改变方式

范围查询通常会影响性能，当查询结果数量很大时，对 MongoDB 特别是分片集群的性能影响更好重要。

解决方案：通过规避使用范围查询方式。

范围查询使用 $gt, $lt 替换 >=, <= 语句

// 原查询语句
db.inventory.find( { qty: { $gte: 20, $lte: 50 } } )

// 范围查询改变后的语句
db.inventory.find( { qty: { $gt: 19, $lt: 51 } } )

使用 ObjectId 顺序查询

当数据较大时，避免使用限制更多语句的 $or 语句。

解决方案：通过 ObjectId 的顺序查询方式代替 $or 查询。

原查询语句

db.inventory.find( { $or: [ { qty: { $lt: 20 } }, { sale: true } ] } )

可以改成如下语句

db.inventory.find( { _id: { $lt: ObjectId("60f8705c0724b8cf4b4f4ad4") }, qty: { $lt: 20 } })

优化操作超时时使用批量操作

当要多次执行操作，如写入或更新文档，可以通过 bulkWrite 批量操作的方式，将不同操作放在一个批次中一次性提交。

查询分片分散

分片集群的查询需要分散到不同分片上执行。为避免集中在一个分片上，大量 IO 操作导致性能瓶颈，需要避免使用 $where 和 $regex 语言的查询。

解决方案：使用 sharding 命令的智能路由用于灵活切分数据。

硬件和部署优化

内存调优

大内存可以提高读取效率；小内存可以提高写入效率。

硬件要求

磁盘 I/O 性能瓶颈可能影响整个系统性能；
硬件是否能满足存储数据的容量要求；
硬件环境调整优化尽量避免在高峰时使用 MongoDB。

部署到云环境

使用云环境需要对 MongoDB 的网络传输和数据存储策略做一定优化。

避免过度依赖 I/O 性能。
避免在云环境中降低网络速度。

总结

优化 MongoDB 性能是一个系统性的工作，需要系统的评估和具体规划，才能达到预期目的。本文总结了索引和查询优化、硬件和部署优化几个方面，希望对大家了解 MongoDB 性能优化有所帮助。

来源：JavaScript中文网，转载请注明来源 https://www.javascriptcn.com/post/645709e1968c7c53b09e449b