文章目录
- 高可用
- 14.Redis如何保证高可用?
- 15.Redis的主从复制?
- 16.Redis主从有几种常见的拓扑结构?
- 17.Redis的主从复制原理了解吗?
- 18.说说主从数据同步的方式?
- 19.主从复制存在的问题?
- 20.Redis Sentinel(哨兵)了解吗?
- 21.Redis Sentinel(哨兵)的实现原理?
- 22.Redis集群了解吗?
高可用
14.Redis如何保证高可用?
Redis 保证高可用主要有三种方式:主从、哨兵、集群。
15.Redis的主从复制?
- 主从复制,是指将一台 Redis 服务器的数据,复制到其他的 Redis 服务器。前者称为 主节点(master),后者称为 从节点(slave)。
- 且数据的复制是 单向 的,只能由主节点到从节点。Redis 主从复制支持 主从同步 和 从从同步 两种,后者是 Redis 后续版本新增的功能,以减轻主节点的同步负担。
- 主从复制的作用?
- 负载均衡: 在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务 (即写 Redis 数据时应用连接主节点,读 Redis 数据时应用连接从节点),分担服务器负载。尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高 Redis 服务器的并发量。
- 故障恢复: 当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复 (实际上是一种服务的冗余)。
- 数据冗余: 主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
- 高可用基石: 除了上述作用以外,主从复制还是哨兵和集群能够实施的 基础,因此说主从复制是 Redis 高可用的基础
16.Redis主从有几种常见的拓扑结构?
-
Redis 的复制拓扑结构可以支持单层或多层复制关系,根据拓扑复杂性可以分为以下三种:一主一从、一主多从、树状主从结构。
-
一主一从结构:一主一从结构是最简单的复制拓扑结构,用于主节点出现宕机时从节点提供故障转移支持。
-
一主多从结构(星形拓扑结构):使得应用端可以利用多个从节点实现读写分离。对于读占比较大的场景,可以把读命令发送到从节点来分担主节点压力。
-
树状主从结构(树状拓扑结构):使得从节点不但可以复制主节点数据,同时可以作为其他从节点的主节点继续向下层复制。通过引入复制中间层,可以有效降低主节点负载和需要传送给从节点的数据量。
-
17.Redis的主从复制原理了解吗?
- Redis 主从复制的工作流程大概可以分为如下几步:
- 保存主节点(master)信息:这一步只是保存主节点信息,保存主节点的 ip 和 port。
- 主从建立连接:从节点(slave)发现新的主节点后,会尝试和主节点建立网络连接。
- 发送 ping 命令:连接建立成功后从节点发送 ping 请求进行首次通信,主要是检测主从之间网络套接字是否可用、主节点当前是否可接受处理命令。
- 权限验证:如果主节点要求密码验证,从节点必须正确的密码才能通过验证。
- 同步数据集:主从复制连接正常通信后,主节点会把持有的数据全部发送给从节点。
- 命令持续复制:接下来主节点会持续地把写命令发送给从节点,保证主从数据一致性
18.说说主从数据同步的方式?
-
Redis 在 2.8 及以上版本使用 psync 命令完成主从数据同步,同步过程分为:全量复制和部分复制。
-
全量复制:
-
一般用于初次复制场景
-
Redis 早期支持的复制功能只有全量复制,它会把主节点全部数据一次性发送给从节点,当数据量较大时,会对主从节点和网络造成很大的开销。
-
完全运行流程:
- 发送 psync 命令进行数据同步,由于是第一次进行复制,从节点没有复制偏移量和主节点的运行 ID,所以发送 psync-1。
- 主节点根据 psync-1 解析出当前为全量复制,回复+FULLRESYNC 响应。
- 从节点接收主节点的响应数据保存运行 ID 和偏移量 offset
- 主节点执行 bgsave 保存 RDB 文件到本地
- 主节点发送 RDB 文件给从节点,从节点把接收的 RDB 文件保存在本地并直接作为从节点的数据文件
- 对于从节点开始接收 RDB 快照到接收完成期间,主节点仍然响应读写命令,因此主节点会把这期间写命令数据保存在复制客户端缓冲区内,当从节点加载完 RDB 文件后,主节点再把缓冲区内的数据发送给从节点,保证主从之间数据一致性。
- 从节点接收完主节点传送来的全部数据后会清空自身旧数据
- 从节点清空数据后开始加载 RDB 文件
- 从节点成功加载完 RDB 后,如果当前节点开启了 AOF 持久化功能, 它会立刻做 bgrewriteaof 操作,为了保证全量复制后 AOF 持久化文件立刻可用。
-
-
部分复制:部分复制主要是 Redis 针对全量复制的过高开销做出的一种优化措施, 使用 psync{runId}{offset}命令实现。当从节点(slave)正在复制主节点 (master)时,如果出现网络闪断或者命令丢失等异常情况时,从节点会向 主节点要求补发丢失的命令数据,如果主节点的复制积压缓冲区内存在这部分数据则直接发送给从节点,这样就可以保持主从节点复制的一致性。
19.主从复制存在的问题?
第一个问题是 Redis 的高可用问题,第二、三个问题属于 Redis 的分布式问题。
- 高可用问题:一旦主节点出现故障,需要手动将一个从节点晋升为主节点,同时需要修改应用方的主节点地址,还需要命令其他从节点去复制新的主节点,整个过程都需要人工干预。
- 分布式问题:主节点的写能力受到单机的限制。
- 分布式问题:主节点的存储能力受到单机的限制。
20.Redis Sentinel(哨兵)了解吗?
-
主从复制存在一个问题,没法完成自动故障转移。所以我们需要一个方案来完成自动故障转移,它就是 Redis Sentinel(哨兵)。
-
Redis Sentinel ,它由两部分组成,哨兵节点和数据节点:
-
哨兵节点: 哨兵系统由一个或多个哨兵节点组成,哨兵节点是特殊的 Redis 节点,不存储数据,对数据节点进行监控。
-
数据节点: 主节点和从节点都是数据节点;
-
-
在复制的基础上,哨兵实现了 自动化的故障恢复 功能,下面是官方对于哨兵功能的描述:
- 监控(Monitoring): 哨兵会不断地检查主节点和从节点是否运作正常。
- 自动故障转移(Automatic failover): 当 主节点 不能正常工作时,哨兵会开始 自动故障转移操作,它会将失效主节点的其中一个 从节点升级为新的主节点,并让其他从节点改为复制新的主节点。
- 配置提供者(Configuration provider): 客户端在初始化时,通过连接哨兵来获得当前 Redis 服务的主节点地址。
- 通知(Notification): 哨兵可以将故障转移的结果发送给客户端。
21.Redis Sentinel(哨兵)的实现原理?
-
哨兵模式是通过哨兵节点完成对数据节点的监控、下线、故障转移。
-
定时监控:三个定时监控任务完成对各个节点发现和监控:
- 每隔 10 秒,每个 Sentinel 节点会向主节点和从节点发送 info 命令获取最新的拓扑结构
- 每隔 2 秒,每个 Sentinel 节点会向 Redis 数据节点的sentinel:hello 频道上发送该 Sentinel 节点对于主节点的判断以及当前 Sentinel 节点的信息
- 每隔 1 秒,每个 Sentinel 节点会向主节点、从节点、其余 Sentinel 节点发送一条 ping 命令做一次心跳检测,来确认这些节点当前是否可达
-
主观下线/客观下线:
- 主观下线:一个哨兵节点认为某个节点有问题
- 每个 Sentinel 节点会每隔 1 秒对主节点、从节点、其他 Sentinel 节点发送 ping 命令做心跳检测
- 当这些节点超过 down-after-milliseconds 没有进行有效回复,Sentinel 节点就会对该节点做失败判定,这个行为叫做主观下线。
- 客观下线:超过一定数量的哨兵节点认为主节点有问题。
- 当 Sentinel 主观下线的节点是主节点时,该 Sentinel 节点会通过 sentinel is- master-down-by-addr 命令向其他 Sentinel 节点询问对主节点的判断
- 当超过 quorum 个数,Sentinel 节点认为主节点确实有问题,这时该 Sentinel 节点会做出客观下线的决定
- 主观下线:一个哨兵节点认为某个节点有问题
-
领导者Sentinel节点选举:
- Sentinel 节点之间会做一个领导者选举的工作
- 选出一个 Sentinel 节点作为领导者进行故障转移的工作。
- Redis 使用了 Raft 算法实现领导者选举。
-
故障转移
-
领导者选举出的 Sentinel 节点负责故障转移,过程如下:
- 在从节点列表中选出一个节点作为新的主节点,这一步是相对复杂一些的一步
- Sentinel 领导者节点会对第一步选出来的从节点执行 slaveof no one 命令让其成为主节点
- Sentinel 领导者节点会向剩余的从节点发送命令,让它们成为新主节点的从节点
- Sentinel 节点集合会将原来的主节点更新为从节点,并保持着对其关注,当其恢复后命令它去复制新的主节点
-
22.Redis集群了解吗?
- 前面说到了主从复制存在高可用和分布式的问题
- 哨兵解决了高可用的问题,而集群就是终极方案,一举解决高可用和分布式问题。
- 数据分区: 数据分区 (或称数据分片) 是集群最核心的功能。集群将数据分散到多个节点,一方面 突破了 Redis 单机内存大小的限制,存储容量大大增加;另一方面 每个主节点都可以对外提供读服务和写服务,大大提高了集群的响应能力。
- 高可用: 集群支持主从复制和主节点的 自动故障转移 (与哨兵类似),当任一节点发生故障时,集群仍然可以对外提供服务