【MHA】MySQL高可用MHA介绍4-故障监控与切换具体流程

目录

一 故障监控与切换

1 验证复制设置并识别当前主服务器

2 监控主服务器

3 检测主服务器故障

4 再次验证从服务器配置

5 关闭故障的主服务器(可选)

6 恢复新主服务器

6.1 保存来自 已崩溃主服务器的二进制日志事件(如果可能)

6.2 确定新主服务器

6.3 识别最新的从服务器(接收到最新中继日志的从服务器)

6,4 恢复并提升新的主服务器

7 上线新主服务器

8 恢复其他从服务器

9 通知(可选)

二 MHA 在线(快速)主切换 流程

1 验证复制设置并确定当前主服务器

2 识别新的主服务器

3 拒绝在当前主服务器上进行写操作

4 等待所有从属服务器追赶复制进度

5 在新主服务器上授予写入权限

6 切换其他所有从属服务器上的复制


一 故障监控与切换

以下是MHA(masterha_manager)在主监控和故障转移中的基本流程。

1 验证复制设置并识别当前主服务器

  • 通过连接配置文件中描述的所有主机来识别当前主服务器。您不必指定哪个主机是当前主服务器。MHA会自动检查复制设置并识别当前主服务器。>(注意:MHA不会自行构建复制环境(例如添加/删除从属服务器)。MHA在现有复制环境中监视主服务器。)
  • 如果在此阶段有任何从服务器已经宕机,出于安全原因终止脚本(如果有任何从服务器已经宕机,MHA当然无法恢复它)。
  • 如果在每个MySQL服务器(MHA节点)上没有安装任何必要的脚本,MHA会在此阶段中止,并且不会开始监视。

2 监控主服务器

  • 等待当前主服务器死机。在这个阶段,MHA不监视从服务器。停止/重新启动/添加/删除从服务器对当前监视的MHA没有任何影响。当您添加/删除从服务器时,应更新配置文件,并最好重新启动MHA。

3 检测主服务器故障

  • 如果MHA连续三次无法连接到主服务器,则进入此阶段。
  • 如果在配置文件中设置了secondary_check_script参数,则MHA调用该脚本以双重检查主服务器是否真的死机。

4 再次验证从服务器配置

  • 重新读取配置文件,并连接到所有主机,验证当前主服务器是否已停止工作以及所有其他从服务器是否正在复制来自已停止工作的主服务器。如果检测到任何无效的复制配置(例如,某些从服务器正在复制来自不同的主服务器),MHA会在此处停止并显示错误。您可以通过在配置文件中设置ignore_fail参数来更改此行为。此步骤出于安全考虑。由于在启动masterha_manager后可能会花费很长时间(几周/几个月),复制配置可能会发生更改,因此通常建议进行双重检查。
  • 检查上次故障切换的状态 如果上次故障切换以错误结束,或者上次故障切换完成得太近,MHA会在此处停止并且不会开始故障切换。您可以通过在masterha_manager命令中设置ignore_last_failover和wait_on_failover_error参数来更改此行为。

5 关闭故障的主服务器(可选)

  • 如果您在配置文件中定义了master_ip_failover_script和/或shutdown_script,MHA会调用这些脚本。
    • 使当前主服务器的IP地址失效
  • 关闭宕机的主服务器,以避免脑裂。

6 恢复新主服务器

  • 6.1 保存来自 已崩溃主服务器的二进制日志事件(如果可能)

    • 如果已崩溃的主服务器可以通过SSH访问,从最新的从服务器的end_log_pos(Read_Master_Log_Pos)复制二进制日志。
  • 6.2 确定新主服务器

    • 基于配置文件设置和当前的MySQL设置
    • 如果您有一些主机作为候选主服务器,请在配置文件中设置candidate_master=1。
    • 如果您有一些永远不应该成为主服务器的主机,请在配置文件中设置no_master=1。
  • 6.3 识别最新的从服务器(接收到最新中继日志的从服务器)

  • 6,4 恢复并提升新的主服务器

    • 生成差异二进制/中继日志事件到主服务器
    • 将日志事件应用到新的主服务器上
    • 如果此处发生任何错误(例如重复键错误),MHA会中止,并且包括恢复其余从服务器在内的下面的恢复步骤不会发生。

7 上线新主服务器

  • 如果您在配置文件中定义了master_ip_failover_script,MHA会调用该脚本。
    • 您可以执行各种操作,例如激活当前主服务器的IP地址,创建特权用户等。

8 恢复其他从服务器

  • 恢复其他从服务器
    • 并行生成差异二进制/中继日志事件并将其应用到从服务器上,
    • 并从新主服务器开始复制。
    • 即使在此阶段发生恢复错误(例如从服务器 3 上的重复键错误),MHA也不会中止。失败的从服务器将不会从新主服务器复制数据,但其他成功恢复的从服务器可以开始复制。

9 通知(可选)

如果您在配置文件中定义了report_script,MHA 将调用该脚本。您可以执行任何您喜欢的操作,例如:

  • 发送邮件
  • 禁用新主服务器上的定期备份作业
  • 更新内部管理工具状态等

二 MHA 在线(快速)主切换 流程

以下步骤可以通过 masterha_master_switch 命令完成(带有 --master_state=alive 参数)

1 验证复制设置并确定当前主服务器

  • 通过连接配置文件中描述的所有主机来确定当前主服务器(注意:MHA本身不会构建复制环境(例如添加/删除从属),而是监视现有复制环境中的主服务器)
  • 在当前主服务器上执行FLUSH TABLES操作(可选)。这是为了最小化稍后执行的FLUSH TABLES WITH READ LOCK操作的成本(时间)
  • 检查MHA主服务器监视和故障转移是否均未运行
  • 检查是否满足以下条件:
    • 所有从属服务器上的IO线程正在运行
    • 所有从属服务器上的SQL线程正在运行
    • 所有从属服务器上的Seconds_Behind_Master值都小于2秒(可以通过--running_updates_limit=(seconds)参数进行更改)
    • 在主服务器上,show processlist输出中没有任何更新查询花费超过2秒


2 识别新的主服务器

  • 新主机可以通过"--new_master_host"参数设置。否则,新的主服务器将从配置文件中自动确定。
  • 原主服务器和新主服务器必须具有相同的二进制日志过滤规则(binlog-do-db和binlog-ignore-db)。

3 拒绝在当前主服务器上进行写操作

  • 如果您在配置文件中定义了master_ip_online_change_script参数,MHA会调用该脚本。
    • 您可以在这里优雅地阻止写入(例如删除写入用户、执行SET GLOBAL read_only=1等)
  • 在当前主服务器上执行FLUSH TABLES WITH READ LOCK操作来阻止所有写入(可以通过--skip_lock_all_tables参数跳过)

4 等待所有从属服务器追赶复制进度


在此处使用MASTER_LOG_POS()函数

5 在新主服务器上授予写入权限

  • 执行SHOW MASTER STATUS来确定新主服务器的当前二进制日志文件和位置
  • 如果您在配置文件中定义了master_ip_online_change_script参数,MHA会调用该脚本。您可以创建一个写入用户,执行SET GLOBAL read_only=0等操作。

6 切换其他所有从属服务器上的复制

  • 并行执行CHANGE MASTER、START SLAVE

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/3380.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

无人机+遥控器:遥控数传链路二合一远距离传输遥控器技术详解

无人机遥控器是无人机飞行控制的重要组成部分,用于向无人机发送控制指令和接收无人机的状态信息。无人机遥控器通常具备多种功能,如开关机、起飞降落、飞行方向控制、摄像头控制等。 无人机遥控器大多数都具备以下基本特点: 无线传输&#x…

Qt | 窗口的显示及可见性|标题、透明度、启用/禁用|窗口标志、设置其他属性|获取窗口部件、设置父部件|鼠标光标

​显示事件:QEvent::show,处理函数为 showEvent(QShowEvent*) 隐藏事件:QEvent::hide,处理函数为 hideEvent(QHideEvent* ) 01 QWidget 类中与可见性有关的属性 visible:bool 访问函数: bool isVisible() const; virtual void setVisible(bool visible); 02 QWid…

3.搭建增长模型-数据洞察

用分享内容举例 分享一个内容出去,有很大概率会带来新的用户,会带来下载量 提升分享就是一个拉活用户数的方法 拆解【提升分享拉新\拉活用户数】: 【提升分享量】 【每次分享拉新\拉活用户数】 [谁在分享] 分享用户画像 分享高转化用户 …

vue3 子组件实现v-model用法

在Vue 3中,实现自定义的input组件并支持v-model绑定,涉及到对modelValue这个默认prop的处理和对应的update:modelValue事件的触发。Vue 3使得这个过程比Vue 2更为简化和灵活,尤其是在可以自定义绑定的属性和事件名方面。 步骤 1: 创建自定义…

【C 数据结构】图

文章目录 【 1. 基本原理 】1.1 无向图1.2 有向图1.3 基本知识 【 2. 图的存储结构 】2.1 完全图2.2 稀疏图和稠密图2.3 连通图2.3.1 (普通)连通图连通图 - 无向图非连通图 的 连通分量 2.3.2 强连通图强连通图 - 有向图非强连通有向图 的 强连通分量 2.3.3 生成树 - 连通图2.3…

lua中的pcall和xpcall和直接调用一个函数的区别

1、pcall 在 Lua 中,pcall 函数用于以一种安全的方式调用另一个函数,并捕获任何可能发生的错误。而直接调用一个函数则是简单地执行该函数的代码。下面是它们之间的区别: 错误处理: 直接调用函数:如果在直接调用一个函…

Jenkins构建实用场景指南

1 总体说明 本文主要介绍在研发实战时,通过Jenkins解决企业级软件构建打包一些实用场景。通常是在打包构建前,通过命令和工具进行预处理,避免修改源码,可按需配置构建任务,自动持续集成。 2 Jenkins简介 2.1 复制任务 研发实战创建构建任务,推荐从已有的构建任务进行…

windows查看xxx的版本号

node -v python --version redis-server --version java -version go version mvn -version git --version

商标申请注册交费就一定会下注册证?

近日遇到一个网友说普推知产老杨说,他以为商标交钱就一定会下商标注册证,这个不管找哪家也做不到的。商标申请注册时要给商标局交费用,交完费用商标才有商标的形式审查,通过后下受理书,才有后面商标实质审查&#xff0…

基础SQL 函数

在MySQL中内置了很多函数,我们可以通过一段程序或者代码直接调用这个函数 一、字符串函数 下面通过例子来验证这些函数 -- 字符串函数-- concat函数 select concat("hello ","world");-- lower函数 select lower("HELLO");-- upper函…

文件不存在创建并写入数据

一、背景 之前遗留了一个问题&#xff0c;就是c没有文件创建文件的代码&#xff0c;这边整理一下&#xff0c;下次可以直接使用 二、实现 #include <iostream> #include <fstream> #include <vector>#define PATH_SEPARATOR_CHAR / #define PATH_SEPARATOR…

C#基础|构造方法相关

哈喽&#xff0c;你好&#xff0c;我是雷工。 以下为C#方法相关的学习笔记。 01 方法的概述 概念&#xff1a;方法表示这个对象能够做什么&#xff0c;也就是封装了这个对象行为。 类型&#xff1a;实例方法—>静态方法&#xff08;抽象方法、虚方法&#xff09;—>特殊…

动手学大模型应用开发--Chapter 05如何评估大模型应用

文章目录 前言一、学习目标二、学习知识点概要三、总结四、参考资料 前言 本学习笔记为datawhale动手学大模型应用开发的第五章&#xff0c;学习链接为&#xff1a; https://datawhalechina.github.io/llm-universe/ 一、学习目标 学习大模型的评估方法和思路。 二、学习知…

Pandas 2.2 中文官方教程和指南(九·二)

比较类似数组的对象 当将 pandas 数据结构与标量值进行比较时&#xff0c;您可以方便地执行逐元素比较&#xff1a; In [65]: pd.Series(["foo", "bar", "baz"]) "foo" Out[65]: 0 True 1 False 2 False dtype: boolIn …

CSS画一条虚线,并且灵活设置虚线的宽度和虚线之间的间隔和虚线的颜色

CSS画一条虚线,并且灵活设置虚线的宽度和虚线之间的间隔和虚线的颜色。 先看效果图&#xff1a; 在CSS中&#xff0c;你可以使用border属性或者background属性来画一条虚线。以下是两种常见的方法&#xff1a; 方法一&#xff1a;使用border属性 你可以设置一个元素的border…

设计模式详解(十七)——迭代子模式

迭代子模式简介 迭代子模式定义 迭代子模式&#xff0c;也称为迭代器模式&#xff0c;是一种对象行为模式。它的定义是&#xff1a;提供一种方法顺序访问一个聚合对象中各个元素&#xff0c;而又不需暴露该对象的内部表示。在迭代子模式中&#xff0c;迭代子是一个对象&#x…

别再把ERP吹上天了,在中国根本没几家企业用得起来

ERP系统无疑具有诸多优势&#xff0c;然而&#xff0c;其在中国多年的应用实效如何&#xff0c;各界看法不一&#xff0c;尚无定论。 历经长达20余年的信息化探索&#xff0c;华为直至2016年才达成了“流程基本顺畅&#xff0c;账目与实际相符”的目标&#xff08;详见华为轮值…

张大哥笔记:如何选择一个好项目?

互联网已经改变了我们的日常生活&#xff0c;使我们可以便捷地获取信息&#xff0c;更快地完成工作&#xff0c;更有效地进行沟通&#xff0c;并且可以让我们更容易地获得服务。随着技术的发展&#xff0c;互联网将继续改变我们的生活.... 有时候我们会感叹&#xff0c;互联网发…

群组分析方法

目录 1.什么是群组分析方法 2.基本原理 3.群组分析方法分类 3.1.层次方法 3.2.划分方法 3.3.密度基方法 ​​​​​​​3.4.模型基方法 4.群组评估 5.应用步骤 1.什么是群组分析方法 群组分析&#xff08;Cluster Analysis&#xff09;是数据分析中的一种重要方法&…

VMWare vmdk文件非常大解决

你如果发现你的虚拟机占用了几百个GB的空间想要变小&#xff0c;在我使用电脑中有一个虚拟机放在了D盘的vm7.9文件夹中。D盘总容量为1TB,但是扯淡的是一个虚拟机占用了600多个GB空间&#xff0c;我按照下面流程执行了最终变为了使用200多GB。 虚拟机经过长时间使用以及各种操作…