Redis Cluster 详解

Redis Cluster 详解

1. 为什么需要 Redis Cluster?

Redis 作为一个高性能的内存数据库,在单机模式下可能会遇到以下问题:

  1. 单机容量受限:Redis 是基于内存存储的,单机的内存资源有限,单实例的 Redis 只能存储有限的数据。
  2. 单点故障(SPOF):单机 Redis 宕机后,所有缓存数据都无法访问,影响业务可用性。
  3. 性能瓶颈:单机 Redis 受 CPU 和 I/O 限制,无法支撑高并发的访问需求。
  4. 扩展性差:单机模式不支持水平扩展,无法通过增加机器来提高存储和计算能力。

Redis Cluster(集群模式) 是 Redis 官方提供的分布式解决方案,主要用于解决以上问题。


2. Redis Cluster 解决了什么问题?有什么优势?

Redis Cluster 解决了以下问题:

  1. 数据分片存储,突破单机限制
    • 通过 哈希槽(hash slot)+ 多节点 的方式,将数据存储到多个 Redis 实例中,实现水平扩展
    • 解决了单机存储受限的问题。
  2. 无中心化架构,避免单点故障
    • 传统的 Redis Sentinel 模式存在 主从架构 + 哨兵管理,但仍然有中心节点。
    • Redis Cluster 去中心化,所有节点都存储集群信息,任何节点都可以提供集群状态。
    • 解决了单点故障的问题。
  3. 主从复制 + 自动故障转移
    • Redis Cluster 采用主从架构,每个 Master 可以有多个 Slave 备份。
    • 如果某个 Master 宕机,Redis Cluster 会自动提升 Slave 为新的 Master,保证集群可用性。
  4. 动态扩展,支持水平扩容
    • Redis Cluster 允许 动态添加 / 删除节点,可以在运行时扩展 Redis 集群,而不会影响业务。
    • 解决了 Redis 单机模式扩展性差的问题。

Redis Cluster 的核心优势

特点Redis Cluster 解决方案
存储受限数据分片存储,支持多个节点
单点故障无中心化架构,主从复制
故障恢复自动故障转移
性能瓶颈多主架构,支持并行读写
扩展性可动态扩容 / 缩容

3. Redis Cluster 是如何分片的?

Redis Cluster 采用 哈希槽(hash slot)+ 数据分片 机制进行数据分片:

  1. 整个集群有 16384 个哈希槽(slot)。

  2. 每个 Key 通过哈希算法分配到某个哈希槽:

    • slot = CRC16(key) % 16384
    • CRC16 是一种高效的哈希计算方法。
  3. 哈希槽分布到不同的 Redis 节点:

    • 例如:3 个 Redis 节点,每个节点存储部分哈希槽:

      节点 A:0 - 5460
      节点 B:5461 - 10922
      节点 C:10923 - 16383
      
    • 如果有新的节点加入,Redis Cluster 会重新分配哈希槽。


4. 为什么 Redis Cluster 的哈希槽是 16384 个?

Redis Cluster 选择 16384 作为固定的哈希槽数量,主要基于以下考虑:

  1. 兼容 CRC16 计算
    • Redis 使用 CRC16 算法计算 Key 的哈希值,并使用 模运算(% 16384) 确定哈希槽。
    • 16384(2¹⁴)是 2 的幂,计算高效。
  2. 负载均衡
    • 16384 个槽足够均匀地分配到多个节点,避免热点数据集中在某个节点。
  3. 迁移成本低
    • 槽的数量适中,在节点增加/删除时,可以快速迁移哈希槽,减少数据重新分布的影响。
  4. 适用于大规模集群
    • 16384 个槽能支持数百个 Redis 节点,适用于不同规模的集群扩展。

5. 如何确定给定 key 应该分布到哪个哈希槽中?

Redis Cluster 通过 CRC16 哈希算法 计算 key 的哈希槽:

slot = CRC16(key) % 16384

示例:

import crcmodcrc16 = crcmod.predefined.Crc('crc-16')
crc16.update(b'mykey')
slot = crc16.crcValue % 16384
print(slot)  # 输出哈希槽号

Redis 客户端会计算 Key 的哈希槽,并直接请求对应的 Redis 节点。


6. Redis Cluster 支持重新分配哈希槽吗?

是的,Redis Cluster 允许动态调整哈希槽分配,以支持扩容或缩容:

  • 增加新节点
    • 新增节点后,部分哈希槽会从已有 Master 迁移到新节点。
    • 使用 redis-cli --cluster reshard 进行槽位重新分配。
  • 删除节点
    • 删除节点时,节点上的哈希槽会迁移到其他节点。

哈希槽迁移过程:

  1. CLUSTER SETSLOT IMPORTING
  2. CLUSTER SETSLOT MIGRATING
  3. 数据同步
  4. 更新哈希槽信息

7. Redis Cluster 扩容/缩容期间可以提供服务吗?

可以!Redis Cluster 支持在线扩容/缩容,在数据迁移过程中仍然可以提供服务:

  1. 客户端访问时,可能会遇到 MOVED 重定向
    • 例如:客户端请求 Key 时,如果 Key 的哈希槽迁移到了新的节点,返回 MOVED <slot> <new-node-ip>,客户端会重新请求正确的节点。
  2. 数据在后台迁移,不影响正常读写
    • Redis Cluster 采用 渐进式迁移,不会一次性移动所有数据,而是逐步将哈希槽数据转移到新节点。

8. Redis Cluster 中的节点是如何通信的?

Redis Cluster 采用 Gossip 协议 进行节点间通信,保证集群状态一致:

  • PING:定期发送心跳检测其他节点的状态。
  • PONG:响应 PING,并附带本节点的状态信息。
  • MEET:新节点加入集群时,使用 MEET 命令。
  • FAIL:如果多数节点判定某个 Master 故障,则广播 FAIL 信息,触发故障转移。

每个 Redis Cluster 节点都维护整个集群的拓扑信息,即便某些节点故障,集群仍然可以继续运行。

9. Redis Cluster 缓存的数据量太大怎么办?

当 Redis Cluster 的数据量过大时,可以采取以下措施:

  • 水平扩展(增加节点):增加新的 Redis 节点,并重新分配哈希槽,使新节点分担数据存储压力。
  • 数据淘汰策略:使用 maxmemory-policy 进行数据淘汰,如 volatile-lruallkeys-lru 等。
  • 数据压缩:对于字符串、JSON 数据,可以使用 Snappy、Gzip 等方式进行压缩,减少存储占用。
  • 冷热数据分层:将热数据存入 Redis,冷数据存入 MySQL、MongoDB 等持久化存储中。
  • 使用 BigKey 拆分:避免存储大 key(如超大列表、集合、哈希),可以拆分为多个小 key 存储。

10. Redis Cluster 的基本架构

一个典型的 Redis Cluster 由多个 Redis 实例组成,每个实例可以是主节点(Master)或从节点(Slave):

  • 主节点(Master):负责存储数据并处理客户端请求,每个 Master 管理一部分哈希槽。
  • 从节点(Slave):作为 Master 的备份,提供高可用性,Master 宕机时从节点可自动提升为 Master。
  • 客户端(Client):连接 Redis Cluster,向不同的 Master 发送请求,并根据哈希槽计算数据存储位置。

Redis Cluster 默认使用 无中心化架构,每个节点既存储数据,又维护整个集群的元数据(比如槽位信息、其他节点状态等)。


总结

问题解答
为什么需要 Redis Cluster?解决单机存储、可用性、性能瓶颈问题。
Redis Cluster 如何分片?采用 16384 个哈希槽,通过 CRC16(Key) % 16384 计算槽位,并分布到不同节点。
为什么是 16384 个哈希槽?兼顾计算效率、负载均衡、扩展性和数据迁移成本。
Redis Cluster 能动态扩容吗?支持在线扩容/缩容,迁移期间不影响业务。
Redis Cluster 节点如何通信?采用 Gossip 协议,进行 PING/PONG 心跳检测,支持自动故障转移。
数据量太大怎么办?采用水平扩展、数据淘汰策略、数据压缩、冷热分层等优化方案。
基本架构?由多个 Master 节点和 Slave 节点组成,每个 Master 负责一部分哈希槽。

Redis Cluster 通过数据分片 + 无中心化架构 + 自动故障恢复,实现了高可用、可扩展的分布式 Redis! 🚀

扩展阅读

1. Redis Cluster 的哈希槽为什么是 16384?

Redis Cluster 采用 16384 个哈希槽(slot)来进行数据分片和管理,主要基于以下几个原因:

(1) 兼顾性能与灵活性
  • 太少的哈希槽:如果哈希槽数量太少,例如 1024,数据分布会很粗糙,负载均衡效果不佳。
  • 太多的哈希槽:如果哈希槽数量过多(如 10^6 级别),每次集群管理和迁移操作都会涉及大量计算,增加开销。

16384 是一个合理的折中方案,它既能保证数据分布的均衡性,又能在扩展和迁移时保持较低的计算和存储成本。

(2) CRC16 计算的高效性

Redis Cluster 采用 CRC16(循环冗余校验)算法计算哈希槽:

Slot = CRC16(Key) % 16384

CRC16 是一种高效的哈希计算方式,16384(2¹⁴)是 2 的幂,可以通过位运算高效计算哈希槽。

(3) 分片和迁移的平衡
  • 16384 个槽可以被

    多个 Master 节点

    平均分配。例如:

    • 3 个 Master:每个 Master 约管理 5461 个槽(16384 ÷ 3)。
    • 6 个 Master:每个 Master 约 2730 个槽(16384 ÷ 6)。
  • 这样,扩容和数据迁移时,不会造成太大的数据重分布,迁移成本较低。

(4) 兼容性

Redis Cluster 设计时考虑到 多个 Redis 实例部署在多个服务器上,16384 适用于不同规模的集群:

  • 小规模集群(3~6 个节点)→ 适量的槽可保证均衡分配。
  • 大规模集群(数十个节点)→ 16384 个槽依然可以较好地分片。

2. 什么是 Gossip 协议?

(1) Gossip 协议的基本概念

Gossip 协议是一种 去中心化的分布式通信协议,用于 节点之间同步信息,类似于“八卦传播”:

  • 每个节点只与部分其他节点通信,而不是全网广播。
  • 信息在多个通信轮次后,逐步传播到整个集群。

Redis Cluster 采用 Gossip 协议 来管理节点状态,保持集群的可用性。


(2) Redis Cluster 中的 Gossip 协议

在 Redis Cluster 中,每个节点都会定期向部分节点 发送状态信息,以此来同步集群状态,确保各个节点了解彼此的情况。

Gossip 协议中的几种消息
  1. PING:节点定期向其他节点发送 PING 消息,询问对方状态。
  2. PONG:收到 PING 后,节点返回 PONG 作为响应,并附带自己的状态信息。
  3. MEET:新节点加入集群时,使用 MEET 消息通知集群中的其他节点。
  4. FAIL:如果某个 Master 节点被大多数节点判定为不可用,整个集群会广播 FAIL 消息,触发故障转移。
示例

假设 Redis Cluster 有 6 个节点:

A  B  C  D  E  F
  • A 发送 PING 给 B 和 C。
  • B 发送 PING 给 D 和 E。
  • C 发送 PING 给 F 和 A。
  • 经过几轮传播后,所有节点都可以获取最新的集群状态。

(3) Gossip 协议的优点
  1. 去中心化:无中心服务器,避免单点故障。
  2. 高效传播:不像传统的全网广播,Gossip 只向部分节点发送信息,网络开销更小。
  3. 容错性强:即使部分节点故障,其他节点仍可继续传播信息,保证集群健康。

总结

问题解答
Redis Cluster 的哈希槽为什么是 16384?16384 是 2¹⁴,兼顾数据分片均衡、迁移效率、CRC16 计算高效性。
Gossip 协议是什么?一种去中心化的分布式通信协议,Redis Cluster 通过 Gossip 进行节点状态同步。
Gossip 协议在 Redis Cluster 中的作用?负责集群节点状态同步、故障检测(PING/PONG)、节点加入(MEET)、故障传播(FAIL)。

Gossip 让 Redis Cluster 实现了 去中心化管理、高效容错,结合 16384 哈希槽的设计,使得 Redis Cluster 既能 高效分片存储,又能 保证集群高可用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/73113.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

利用 MATLAB/Simulink 建立完整的控制系统模型,并进行阶跃响应和负载扰动响应仿真

-利用 MATLAB/Simulink 建立完整的控制系统模型,包括单一控制回路(电流、速度、位置)和整个系统的级联模型 仿真任务包括验证各回路的阶跃响应、负载扰动响应等,确保系统在动态性能上满足设计要求。 以下是在MATLAB/Simulink中建立完整控制系统模型(包含单一控制回路和级联…

python基于spark的心脏病患分类及可视化(源码+lw+部署文档+讲解),源码可白嫖!

摘要 时代在飞速进步&#xff0c;每个行业都在努力发展现在先进技术&#xff0c;通过这些先进的技术来提高自己的水平和优势&#xff0c;汽车数据分析平台当然不能排除在外。本次我所开发的心脏病患分类及可视化系统是在实际应用和软件工程的开发原理之上&#xff0c;运用Pyth…

3.milvus索引-HNSW

索引作用 加速大型数据集上的查询。 向量字段&#xff0c;仅只能创建一个索引。 milvus支持的向量索引类型大部分使用 近似最近邻搜索算法。ANNS该算法的核心不局限于返回最准确的结果&#xff0c;而是仅搜索目标的邻居。ANNS通过在可接受的范围内牺牲准确性提高检索效率。 …

Python(学习二)

列表&#xff1a;[] 列表是可以容纳不同类型的数据的 列表取&#xff1a; 列表切片&#xff1a;一次去获取多个元素 第三个参数&#xff0c;设置跨度值&#xff1a; 列表倒序输出 列表增&#xff1a; 列表后面添加元素&#xff1a; 切片&#xff1a;实现添加元素 任意位置…

【中文翻译】第1章-The Algorithmic Foundations of Differential Privacy

为方便阅读&#xff0c;故将《The Algorithmic Foundations of Differential Privacy》翻译项目内容搬运至此&#xff1b; 教材原文地址&#xff1a;https://www.cis.upenn.edu/~aaroth/Papers/privacybook.pdf 中文翻译版 Github 项目地址1&#xff1a;https://github.com/gu…

UI-TARS与Midscene.js自动化探索

结合 Midscene.js 和 UI-TARS 大模型 实现 UI 页面自动化的可实施方案&#xff0c;涵盖环境配置、核心流程、代码示例及优化建议&#xff1a; 一、环境配置与工具集成 安装 Midscene.js 方式一&#xff1a;通过 Chrome 插件快速安装&#xff08;适用于浏览器自动化场景&#x…

Web开发-JS应用NodeJS原型链污染文件系统Express模块数据库通讯

知识点&#xff1a; 1、安全开发-NodeJS-开发环境&功能实现 2、安全开发-NodeJS-安全漏洞&案例分析 3、安全开发-NodeJS-特有漏洞 node.js就是专门运行javascript的一个应用程序&#xff0c;区别于以往用浏览器解析原生js代码&#xff0c;node.js本身就可以解析执行js代…

Spring AOP 核心概念与实践指南

第一章&#xff1a;AOP 核心概念与基础应用 1.1 AOP 核心思想 ​面向切面编程&#xff1a;通过横向抽取机制解决代码重复问题&#xff08;如日志、事务、安全等&#xff09;​核心优势&#xff1a;不修改源代码增强功能&#xff0c;提高代码复用性和可维护性 1.2 基础环境搭…

Flutter使用自签证书打包ipa

在 Flutter 中使用自签证书打包 IPA 文件&#xff0c;可以通过以下步骤完成&#xff1a; 1. 准备自签证书 方式一 生成自签证书&#xff1a; 打开 钥匙串访问 应用。选择 证书助理 > 创建证书。按照提示填写证书信息&#xff0c;选择证书类型为 代码签名&#xff0c;并保存…

基于STM32的机器人控制系统设计方案

一、系统概述 该机器人控制系统以STM32微控制器为核心,旨在实现对机器人的运动控制、传感器数据采集与处理、任务调度以及人机交互等功能。适用于多种类型的移动机器人,如轮式机器人、履带式机器人等,可应用于室内导航、环境监测、物流搬运等场景。 二、硬件设计 STM32微控…

【leetcode hot 100 51】N皇后

解法一&#xff1a;&#xff08;基于集合的回溯&#xff09;我们从第一行开始寻找&#xff0c;找每一行皇后应该放在第几列。每次找到都用Set记录已经用过的列和对角&#xff0c;其中从左到右向下的对角&#xff08;行-列相同&#xff09;&#xff0c;右到左向下的对角&#xf…

蓝桥刷题note9(分发饼干,最长回文子串)

1.分发饼干 假设你是一位很棒的家长&#xff0c;想要给你的孩子们一些小饼干。但是&#xff0c;每个孩子最多只能给一块饼干。 对每个孩子 i&#xff0c;都有一个胃口值 g[i]&#xff0c;这是能让孩子们满足胃口的饼干的最小尺寸&#xff1b;并且每块饼干 j&#xff0c;都有…

面试常问系列(一)-神经网络参数初始化

一、背景 说到参数初始化&#xff0c;先提一下大家常见的两个概念梯度消失和梯度爆炸。 &#xff08;一&#xff09;、梯度消失&#xff1a;深层网络的“静默杀手” 定义&#xff1a; 在反向传播过程中&#xff0c;梯度值随着网络层数增加呈指数级衰减&#xff0c;最终趋近…

Manacher 马拉车算法

Manacher 马拉车算法 5. 最长回文子串 - 力扣&#xff08;LeetCode&#xff09; 马拉车算法是目前解决寻找字符串中最长的回文子串时间复杂度最低的算法&#xff08;线性O(n)&#xff09;. 中心扩散法 初始化一个长度与字符串 s 相等的 臂长数组 arr 和 最长臂长 max 与 最…

(学习总结29)Linux 进程概念和进程状态

Linux 进程概念 冯诺依曼体系结构软件运行与存储分级数据流动的理论过程 操作系统操作系统(Operator System) 概念操作系统的功能与作用系统调用和库函数概念 进程概念描述进程 - PCBtask_struct查看进程通过系统调用获取进程标示符 PID通过系统调用 fork 函数创建进程简单使用…

MySQL密码修改的全部方式一篇详解

本文将详细介绍多种修改MySQL密码的方式。 本文目录 一、alter user 语句操作步骤 二、set password操作步骤 三、直接修改 mysql.user表操作步骤 一、alter user 语句 当你以 root 用户或者拥有足够权限的用户登录 MySQL 时&#xff0c;可以使用 ALTER USER 语句来修改密码。…

Wi-Fi NAN 架构(Wi-Fi Aware Specification v4.0,第2章:2.3~2.6)

1. NAN 数据通信架构 1.1 单播支持 要在两个NAN设备之间启动单播数据通信&#xff0c;服务需发起一个NAN数据路径&#xff08;NDP&#xff0c;NAN Data Path&#xff09;请求。这对NAN设备之间会建立一个NAN设备链路&#xff08;NDL&#xff0c;NAN Device Link&#xff09;&…

Lineageos 22.1(Android 15)实现负一屏

一、前言 方案是参考的这位大佬的&#xff0c;大家可以去付费订阅支持一波。我大概理一下Android15的修改。 大佬的方案代码 二、Android15适配调整 1.bp调整&#xff0c;加入aidl引入&#xff0c;这样make之后就可以索引代码了 filegroup {name: "launcher-src"…

Java 大视界 -- Java 大数据在智能医疗远程会诊与专家协作中的技术支持(146)

&#x1f496;亲爱的朋友们&#xff0c;热烈欢迎来到 青云交的博客&#xff01;能与诸位在此相逢&#xff0c;我倍感荣幸。在这飞速更迭的时代&#xff0c;我们都渴望一方心灵净土&#xff0c;而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识&#xff0c;也…

Sqlite3数据库

工具库的使用&#xff1a;程序编写时#include <库名.h>即可调用库中的函数 编译时链接工具库&#xff1b; 注意&#xff1a;数据库中不区分字母大小写&#xff1b; SQLite 中的事务是数据库操作中非常重要的一个概念&#xff0c;它用于确保数据库操作的完整性和一致性。…