前言
Redis 是一种基于内存的 Key-Value 存储系统,被广泛应用于缓存、消息队列、计数器等场景。与传统的存储系统相比,Redis 的读写速度更快、拥有更好的可扩展性。
然而,Redis 还面临一个非常关键的问题:如果 Redis 进程崩溃或被杀死,那么内存中的数据将会全部丢失。因此,我们需要一种 Redis 持久化方案来解决这个问题。
本文将介绍一种 Redis 异步持久化方案的设计与实现,并提供示例代码。
Redis 的持久化机制
Redis 提供了两种数据持久化的方式:RDB 和 AOF。
RDB
RDB 是 Redis 数据库快照的简称。它可以将 Redis 内存中的数据以二进制的形式写入到硬盘上。RDB 快照有几种触发方式,例如手动执行 SAVE 命令、定期执行 BGSAVE 命令、在 Redis 进程退出时执行自动保存等。
在一个 Redis 数据库中,每个 RDB 文件对应一个特定的时间点的数据库快照。这个时点可以通过 SAVE 或 BGSAVE 命令手动触发,也可以在 Redis 配置文件中设置自动触发的时间点。RDB 文件里存储的是 Redis 数据库在某个时刻刻全部数据的快照。
现在我们需要考虑的是 RDB 的缺点,它只能做到全量备份,时间点上的增量备份难以实现。每次 RDB 执行 BGSAVE 的时候,Redis 会进行一次 fork 操作来创建出一个子进程,子进程会将当前 Redis 进程的内存数据写到硬盘上的一个 RDB 文件里。在写完 RDB 文件后,子进程会发一个信号给父进程,父进程在收到信号后会立刻将新的 RDB 文件重命名为老的 RDB 文件,以保证新的 RDB 文件与 Redis 交互时是有效的。
因此 RDB 的优点为:
- 整个过程不会影响 Redis 的正常操作;
- 快照文件是紧凑的,不管 Redis 中数据有多大,总是可以生成非常小的磁盘文件;
- 它基本可以通过调整 SAVE 或 BGSAVE 命令的执行时间来控制出现数据损失的时间长度。
但RDB的缺点主要在:
- 由于执行快照的时候需要 fork 出子进程,所以有一定的性能损失;
- 如果 Redis 在 BGSAVE 过程中崩溃,那么就会丢失这个时刻的数据。
AOF
AOF 是 Append Only File,即追加写日志文件的简称。当 Redis 的内存里的数据有修改时,Redis 会把这些修改操作以追加的方式写入到 AOF 文件中,这些操作都是有原子性的。
与 RDB 不同的是,AOF 是以追加的方式记录 Redis 内存中每个写操作,即每个被写到数据集的命令。这个文件是一个纯文本文件,而且它以 Redis 内存中命令的使用顺序的顺序一步步增长。因此,AOF 文件每次的大小和 Redis 运行时间成正比。
当 Redis 重启后,Redis 会根据 AOF 文件里的指令重新构建数据集,从而恢复数据。
因此,AOF 的优点为:
- 可以记录每次修改操作,因此不存在数据损失的问题;
- 不会存在类似于 RDB 在 BGSAVE 过程中失效的情况。
AOF存在的缺点为:
- AOF 文件通常比 RDB 文件大很多,随着时间的推移,AOF 文件会越来越大,对磁盘的消耗也越来越大;
- 写操作日志文件是有序的,因此读取速度较慢。
异步持久化方案设计
Redis 可以同时使用 RDB 和 AOF 这两种持久化方式,以达到更好的数据保障效果。异步持久化顾名思义是异步的,即当 Redis 内存中的数据发生变化时,Redis 不会立即将变化写入磁盘,而是通过变化的记录方式,异步的更新到日志文件或者快照文件中。这种方式将操作的数据存放到队列中,当队列满时会建立一个新队列,与此同时由后台线程去执行持久化操作,将日志文件或者快照文件中的操作进行写入到磁盘。这个过程可以通过多路复用机制进行实现,降低系统磁盘 IO 操作对于 Redis 的性能的最大化影响。
为了减少持久化过程对 Redis 的性能影响,我们可以选择异步的方式实现持久化方案。当出现数据修改异常时,使用 AOF 方式进行保障,以保证数据的强一致性。具体的,Redis 会将修改操作先记录到 AOF 日志文件中,然后再进行相应的操作,由后台线程来处理 AOF 数据,将修改的数据持久化到磁盘上。当 Redis 内存中的数据突然有大量更新时,这种方式的异步持久化能够让 Redis 可以非常平滑地来处理这些请求,一次性地将很多条命令打包在一起。
我们使用一个列表来存储日志文件中的操作记录,使用一个线程池来异步实现对文件的写入。实现完整的 AOF支持的同时保证了对Redis主流程的非阻塞调用,因为线程池中的线程与 Redis 主线程不是同一个线程。
在 Redis 的配置文件中,我们可以将 appendonly 参数置为 yes,则开启 AOF 的持久化机制。
异步持久化实现
我们实现使用 Redis 的异步持久化方案,需要按照以下步骤进行:
- 打开 AOF 文件,若文件存在,则读取文件中的内容作为 Redis 数据库的起始状态;
- Redis 处理每个命令前,将命令转化成 AOF 格式追加到 AOF 文件中,AOF 文件中每行是一条 Redis 命令;
- 每次数据修改时,会将修改记录保存到队列中,和其它日志合并成批量提交到持久化日志文件中;
- 同时,开启一个新的后台线程,将通过线程池异步地将日志写入到磁盘中。
我们来看一下是如何实现的:

在 Redis 的命令执行前,我们需要把命令以 AOF 的格式写入到持久化文件中。我们需要重写 Redis 命令的方法,将 Redis 命令写入 AOF 文件:
public abstract class RedisCommand { private final static String DELIMITER = " "; public abstract String toAOFString(); public abstract String execute(); }
我们随便实现一个 Redis 命令:
-- -------------------- ---- ------- ------ ----- --------------- ------- ------------ - ------- ----- ------ ---- ------ ------------------------ ----- - --- - -------- - --------- ------ ------ --------- - ------ ----- - ------------------------------------ -- ------ -- ----- ------ -------- ------ ------ - --------- ------ ------ ------------- - ------ ------------------- ------ ---- ----------- - -
在进行 Redis 操作时,执行完操作先将其转成 AOF 格式,然后放入队列中:
-- -------------------- ---- ------- ------ ----- ------------- - -- --- ------ ---- -------------------- -------- - -- --- -------------------------------------------------------------------- ------------------ - -- --- -
最后,我们在 Redis 容器的生命周期中,添加一个钩子函数,当容器被终止时,将当前的 AOF 存档:
public class RedisContainer { // ... public void start() { // ... Runtime.getRuntime().addShutdownHook(new Thread(() -> RedisAOFLog.getInstance().flush())); } // ... }
总结
异步持久化方案是 Redis 实现高可用的一个关键机制。本文通过介绍 Redis 的 RDB 和 AOF 两种持久化机制,详细讲解了 Redis 异步持久化方案的设计与实现,解决了 Redis 内存数据丢失的问题。
在实现过程中,我们需要注意线程池的配置,注意 AOF 文件的有序性与 AOF 控制文件的正确性,同时实现 AOF 的写操作缓存,防止 Redis 运行速度降低。最后,我们还介绍了 Redis 持久化方案设计的优点和缺点,读者可以根据具体需求选择不同的方案。
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/646c98ce968c7c53b0b8dd55