1.哨兵机制的介绍
通过自动化的手段,来解决主节点挂了的问题~~
哨兵机制, 是通过独立的 进程 来体现的.和之前 redis-server 是不同的进程!!
redis-sentine| 不负责存储数据,只是对其他的 redis-server 进程起到监控的效果~~
通常哨兵节点,也会搞一个集合~~(多个哨兵节点构成的)
单个哨兵节点,挂了,咋办~~
1.1 基本概念
名词 | 逻辑结构 | 物理结构 |
主节点 | Redis 主服务 | ⼀个独⽴的 redis-server 进程 |
从节点 | Redis 从服务 | ⼀个独⽴的 redis-server 进程 |
Redis 数据节点 | 主从节点 | 主节点和从节点的进程 |
哨兵节点 | 监控 Redis 数据节点的节点 | ⼀个独⽴的 redis-sentinel 进程 |
哨兵节点集合 | 若⼲哨兵节点的抽象组合 | 若⼲ redis-sentinel 进程 |
Redis 哨兵(Sentinel) | Redis 提供的⾼可⽤⽅案 | 哨兵节点集合 和 Redis 主从节点 |
应⽤⽅ | 泛指⼀个多多个客⼾端 | ⼀个或多个连接 Redis 的进程 |
2.手动恢复redis主从复制的流程
- 实际开发中,对于服务器后端开发,监控程序, 是非常重要的!!
- 服务器,要求要有比较高的可用性,7*24 运行~~
- 服务器长期运行,总会有一些"意外",具体啥时候出现了意外,咱们也不知道~~同时,也不能全靠人工来盯着服务器运行~~
- 写一个程序,用程序来盯着服务器的运行状态~~
- 监控程序~~
往往还需要搭配 |报警程序"短信/电话/邮件/微信/钉钉/飞书.(给程序猿报警,通知程序猿说,这个服务器程序挂了/出问题了~-) - 互联网公司的程序猿,尤其是大厂,公司都会明确要求, 程序猿的手机要 24 小时开机, 并且要随时关注~~报警不仅仅是只发给这一个程序猿的~~还会发给程序猿的领导/领导的领导~~
关键时刻,错过领导的电话, 掉链子,领导就会有比较负面的评价~~可能升职加薪就得往后稍
稍了~~
程序猿如何恢复?
- 1.先看看主节点还能不能抢救了,好不好抢救~~
- 如果主节点这边是啥原因挂的,不好定位; 或者原因知道,但是短时间难以解决~
- 2.就需要挑一个从节点,设置为新的主节点~
- a)把选中的从节点,通过 slaveof no one,自立山头,
- b)把其他的从节点,修改 slaveof 的主节点 ip port,连上新的主节点~
- c)告知客户端(修改客户端的配置),让客户端能够连接新的主节点,用来完成修改数据的操作~
- 当之前的挂了的主节点,修好了之后,就可以作为一个新的从节点,挂到这组机器中~~
只要是涉及到人工干预,不说繁琐,至少很烦人~~
另外,这个操作过程如果出错了咋办?? 可能会导致问题更加严重~~
通过人工干预的做法, 就算程序猿第一时间看到了报警信息,第一时间处理~~
恢复的过程,也需要 半个小时,以上~~
这半个小时里,整个 redis 就一直不能写????显然是不合适
引入了哨兵机制
3.自动redis主从复制的流程
- redis 哨兵核心功能:
- 1.监控
- 2.自动的故障转移
- 3. 通知
- 注意,redis 哨兵节点,有一个,也是可以的~~
- 1.如果哨兵节点只有一个,它自身也是容易出现问题的~~
- 万一这个哨兵节点挂了,后续redis节点也挂了,就无法进行自动的恢复过程了~~出现误判的概率也比较高~~
- 2.毕竟网络传数据是容易出现抖动或者延迟或者丢包的~~ 如果只有一个哨兵节点,出现上述问题之后,影响就比较大~~
基本的原则: 在分布式系统中,应该避免使用"单点”(冗余)
哨兵节点,最好要搞 奇数 个.最少也应该是3 个~~(方便进行选举)
4.使用docker搭建环境
- 按理说,这 6个节点,是要在 6个不同的服务器主机上的~~
- 此时, 只有一个云服务器, 就在一个云服务器上,来完成这里的环境搭建~~
- 在实际工作中,把上述节点放到一个服务器上,是没有意义的!!当前这么做只是迫于无奈~~
- 由于这些节点,还挺多的, 相互之间容易打架;
- 依赖的端口号/配置文件/数据文件....如果咱们直接部署,就需要小心翼翼的去避开这些冲突~~
- 类似于咱们最开始哪种进行主从结构配置的方式~~
- 比较繁琐; 也会和在不同主机上部署,存在较大差异~~
使用 docker 就可以有效的解决上述的问题~~
- 虚拟机~~,通过软件,在一个电脑上模拟出另外的一些硬件(构造了另一个虚拟的电脑)
- 虚拟机这样的软件,就可以使用一个计算机,来模拟出多个电脑的情况~~
- 但是虚拟机有一个很大的问题: 比较吃配置~这个事情对于咱们的云服务器来说,压力山大~~
- docker(现在后端开发这块非常流行的组件~~) 可以认为是一个"轻量级"的虚拟机~~ 起到了虚拟机这样的隔离环境的效果,但是又没有吃很多的硬件资源即使是配置比较拉胯的云服务器,也能构造出好几个这样的虚拟的环境~~
4.1 安装部署 (基于 docker)
1.安装 docker 和 docker-compose
docker
yum install docker
# ubuntuapt install docker-compose# centosyum install docker-compose
2.停⽌之前的 redis-server
# 停⽌ redis-serverservice redis-server stop# 停⽌ redis-sentinel 如果已经有的话 .service redis-sentinel stop
3.使⽤ docker 获取 redis 镜像
- git pull 使用 git 从中央仓库拉取代码.
- docker pull 使用 docker 从中央仓库(默认就是从 docker hub)来拉取镜像
- 拉取到的镜像,里面包含一个精简的 Linux 操作系统, 并且上面会安装 redis ~^只要直接基于这个镜像创建一个容器跑起来,此时,redis 服务器就搭建好了~~
【出现问题】
[root@iZuf6ep3mumzp5gofcygtuZ ~]# docker images
Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?service docker start
Docker启动提示:Cannot connect to the Docker daemon..._cannot connect to the docker daemon at-CSDN博客
4.启动服务器
sudo systemctl start redis
4.2 基于docker搭建redis哨兵环境
- 基于 docker 来搭建 redis 哨兵环境了~~
- docker-compose 来进行 容器编排~
- 此处涉及到多个 redis server 也有多个 redis 哨兵节点~每一个 redis server 或者每一个 redis 哨兵节点都是作为一个单独的容器了
- 通过一个配置文件,把具体要创建哪些容器,每个容器运行的各种参数,描述清楚
- 后续通过一个简单的命令,就能够批量的启动/停止这些容器了
- 使用 yml 这样的格式来作为配置文件,
- spring 也是使用 yml来作为配置文件的呀~~
1.具体步骤
- 1)创建三个容器, 作为 redis 的数据节点(一个主 两个从) yml
- 2)创建三个容器,作为 redis 的哨兵节点 yml
- 其实也是可以用一个 ym| 文件, 直接启动 6 个容器~~
- 如果把这个6个容器同时启动,可能是 哨兵 先启动完,成,数据节点 后启动完成,哨兵可能就会先认为是数据节点挂了,虽然对于大局不影响,但是会影响到观察执行日志的过程~~
- 所以直接分成两组,先手动启动第一组,再手动启动第二组
-
1.1 编排 redis 主从节点
-
1)编写yml
version: '3.3'
services:master:image: 'redis:5.0.9'container_name: redis-masterrestart: alwayscommand: redis-server --appendonly yesports:- 6379:6379slave1:image: 'redis:5.0.9'container_name: redis-slave1restart: alwayscommand: redis-server --appendonly yes --slaveof redis-master 6379ports:- 6380:6379slave2:image: 'redis:5.0.9'container_name: redis-slave2restart: alwayscommand: redis-server --appendonly yes --slaveof redis-master 6379ports:- 6381:6379
2) 启动所有容器
3) 查看运⾏⽇志
docker-compose logs
4) 验证
1.连接主节点
redis-cli -p 6379info replication
成功!!!
2.连接从节点
redis-cli -p 6380
redis-cli -p 6381
1.2 编排 redis-sentinel 节点
1) 编写 docker-compose.yml
version: '3.3'
services:sentinel1:image: 'redis:5.0.9'container_name: redis-sentinel-1restart: alwayscommand: redis-sentinel /etc/redis/sentinel.confvolumes:- ./sentinel1.conf:/etc/redis/sentinel.confports:- 26379:26379sentinel2:image: 'redis:5.0.9'container_name: redis-sentinel-2restart: alwayscommand: redis-sentinel /etc/redis/sentinel.confvolumes:- ./sentinel2.conf:/etc/redis/sentinel.confports:- 26380:26379sentinel3:image: 'redis:5.0.9'container_name: redis-sentinel-3restart: alwayscommand: redis-sentinel /etc/redis/sentinel.confvolumes:- ./sentinel3.conf:/etc/redis/sentinel.confports:- 26381:26379
networks:default:external:name: redisdata_default
其中最后一行的name要与以下配置相对应
2) 创建配置⽂件
bind 0.0.0.0port 26379sentinel monitor redis-master redis-master 6379 2sentinel down-after-milliseconds redis-master 1000
理解 sentinel monitor
sentinel monitor 主节点名 主节点ip 主节点端⼝ 法定票数
理解 sentinel down-after-milliseconds
既然内容相同, 为啥要创建多份配置⽂件?
redis-sentinel 在运⾏中可能会对配置进⾏ rewrite, 修改⽂件内容. 如果⽤⼀份⽂件, 就可能出现修改混乱的情况.
3) 启动所有容器
docker-compose up -d
如果启动后发现前⾯的配置有误, 需要重新操作, 使⽤ docker-compose down 即可停⽌并删除刚才创建好的容器.
4) 查看运⾏⽇志
docker-compose logs
上述操作必须保证⼯作⽬录在 yml 的同级⽬录中, 才能⼯作.
哨兵启动后自动修改
5.哨兵节点的作用
- 哨兵存在的意义,能够在 redis 主从结构出现问题的时候(比如主节点挂了),此时哨兵节点就能够自动的帮我们重新选出一个主节点,来代替之前挂了的节点、保证整个 redis 仍然是可用状态.
- 手动把主节点给干掉.
- 当主节点挂了之后,哨兵节点就开始工作了!!
- sdown 主观下线: 本哨兵节点,认为该主节点挂了
- odown 客观下线: 好几个哨兵都认为该节点挂了,达成了一致(法定票数)
- 此时,主节点挂了这个事情就被石锤了~~
- 此时就需要哨兵节点选出一个从节点,作为新的主节点,此处就需要提拔出一个新的主节点~~
6.主从切换的具体流程
1.主观下线.
哨兵节点通过心跳包,判定 redis 服务器是否正常工作,如果心跳包没有如约而至,就说明 redis 服务器挂了,此时还不能排除网络波动的影响,因此就只能是单方面认为这个 redis 节点挂了
2.客观下线.
多个哨兵都认为主节点挂了。(认为挂了的哨兵节点数目达到 法定票数)哨兵们就认为这个主节点是 客观下线
【比如是否可能出现非常严重的网络波动导致所有的哨兵都联系不上 redis 主节点误判成挂了呢??
当然是有的!!!
如果出现这个情况,怕是用户的客户端也连不上 redis 主节点了..此时这个主节点基本也就无法正常工作了
"挂了"不一定是进程崩了只要无法正常访问,都可以视为是挂了】
3.要让多个哨兵节点,选出一个 leader 节点由这个 leader 负责选一个 从节点 作为新的主节点,
上面投票过程,看谁反应快(谁网络延时小)
4.此时 leader 选举完毕,leader 就需要挑选一个从节点,作为新的主节点.
- 1)优先级
- 每个 redis 数据节点,都会在配置文件中,有一个优先级的设置.slave-priority优先级高的从节点,就会胜出~~~
- 2) offset最大,就胜出.
- offset 从节点从主节点这边同步数据的进度.数值越大,说明从节点的数据和主节点就越接近.
- 3)run id 每个 redis 节点启动的时候随机生成的一串数字~~(大小全凭缘分了)
- 把新的主节点指定好了之后,
leader 就会控制这个这个节点,执行 slave no one,成为 master,
再控制其他节点,执行 slave of,让这些其他节点,以新的 master 作为主节点了
经典面试顾~~
尤其是注意选举的过程
不是直接选出新的主节点,而是先选 leader
由 leader 负责后续的主节点指定~~
7.小结
高的机器来部署.(但是不能搞一个机器部署三个哨兵))