《MySQL 简易速速上手小册》第6章:MySQL 复制和分布式数据库(2024 最新版)

在这里插入图片描述

文章目录

  • 6.1 设置和管理复制
    • 6.1.1 基础知识
    • 6.1.2 重点案例:使用 Python 设置 MySQL 主从复制
    • 6.1.3 拓展案例 1:自动故障转移
    • 6.1.4 拓展案例 2:设置双主复制
  • 6.2 复制的类型和策略
    • 6.2.1 基础知识
    • 6.2.2 重点案例:使用 Python 设置半同步复制
    • 6.2.3 拓展案例 1:监控半同步复制的延迟
    • 6.2.4 拓展案例 2:动态切换复制类型
  • 6.3 解决复制冲突
    • 6.3.1 基础知识
    • 6.3.2 重点案例:使用 Python 检测并解决主键冲突
    • 6.3.3 拓展案例 1:自动解决数据不一致
    • 6.3.4 拓展案例 2:使用 Python 实现自定义冲突解决策略

6.1 设置和管理复制

在 MySQL 的世界里,复制不仅仅是数据的翻版,它是提高数据可用性、可靠性和灾难恢复能力的关键技术。让我们深入了解如何启动你的复制之旅,确保你的数据不会因为任何意外而遗失。

6.1.1 基础知识

复制允许数据从一个 MySQL 服务器(主服务器)同步到一个或多个 MySQL 服务器(从服务器)。这个过程可以是异步的,也可以是半同步的,取决于你对数据一致性的需求。

  • 主从复制配置:在主服务器上,你需要启用二进制日志并创建一个具有复制权限的用户。在从服务器上,你需要配置连接到主服务器的信息,包括主服务器的 IP 地址、复制用户的用户名和密码,以及要从哪个点开始复制的二进制日志文件名和位置。

  • 启动复制过程:在从服务器上执行 CHANGE MASTER TO 命令以指定主服务器的详情,然后启动复制进程。

  • 监控复制状态:使用 SHOW SLAVE STATUS\G 来检查从服务器的复制状态,确保 Slave_IO_RunningSlave_SQL_Running 都是 Yes

6.1.2 重点案例:使用 Python 设置 MySQL 主从复制

假设你负责一个在线商店的数据库管理工作,需要设置复制来增加数据的可用性和备份。

步骤

  1. 在主服务器上配置

    • 编辑 MySQL 配置文件(通常是 /etc/my.cnf/etc/mysql/mysql.conf.d/mysqld.cnf),启用二进制日志并指定服务器 ID。

      [mysqld]
      log_bin=mysql-bin
      server_id=1
      
    • 重启 MySQL 服务使配置生效。

    • 创建复制用户。

      CREATE USER 'replicator'@'%' IDENTIFIED BY 'password';
      GRANT REPLICATION SLAVE ON *.* TO 'replicator'@'%';
      FLUSH PRIVILEGES;
      
  2. 在从服务器上配置

    • 同样地编辑 MySQL 配置文件,指定一个唯一的服务器 ID。

      [mysqld]
      server_id=2
      
    • 重启 MySQL 服务。

    • 使用 Python 连接到从服务器的 MySQL 实例,并配置复制。

      import mysql.connectorconn = mysql.connector.connect(host='slave_host', user='root', password='yourpassword')
      cursor = conn.cursor()
      cursor.execute(f"CHANGE MASTER TO MASTER_HOST='master_host', MASTER_USER='replicator', MASTER_PASSWORD='password', MASTER_LOG_FILE='mysql-bin.000001', MASTER_LOG_POS=  154;")
      cursor.execute("START SLAVE;")
      

6.1.3 拓展案例 1:自动故障转移

假设主服务器突然宕机,你需要快速将从服务器提升为新的主服务器,同时保持业务的连续性。

  1. 在从服务器上停止复制进程,并提升为主服务器。

    cursor.execute("STOP SLAVE;")
    cursor.execute("RESET MASTER;")
    
  2. 更新应用配置,将数据库连接指向新的主服务器。

6.1.4 拓展案例 2:设置双主复制

在某些场景下,你可能需要两个数据库服务器互为主备,以实现高可用性。

  1. 在两个服务器上互相配置对方为主服务器,确保开启二进制日志并设置不同的 server_id
  2. 使用 Python 在两个服务器上互相执行 CHANGE MASTER TO,指定对方的详情。

通过以上案例,你不仅学会了如何使用 Python 来设置和管理 MySQL 的复制,还探索了如何在实际生产环境中应用复制来提高数据的可用性和灾难恢复能力。这些技能对于任何希望确保数据安全和业务连续性的数据库管理员来说都是宝贵的资产。

在这里插入图片描述


6.2 复制的类型和策略

在 MySQL 的世界里,复制不只是一个简单的数据复制过程。根据业务需求的不同,你可以选择不同类型的复制策略,每种策略都有其独特的优势和应用场景。

6.2.1 基础知识

  • 异步复制:这是 MySQL 复制的默认模式。在这种模式下,主服务器在更新自己的数据后不会等待从服务器确认就继续处理其他操作,这可能会导致主从服务器之间的数据延迟。
  • 半同步复制:在半同步复制中,主服务器在提交事务前至少需要一个从服务器发回确认,这样可以确保数据在主服务器和至少一个从服务器之间是一致的,减少了数据丢失的风险。
  • 组复制:这是 MySQL 5.7 版本引入的一个新特性,提供了一种基于组成员资格的复制方式,可以实现多主复制,所有的写操作都会被复制到组内的其他成员,确保数据的一致性。

6.2.2 重点案例:使用 Python 设置半同步复制

假设你的在线商店数据非常重要,不能容忍任何数据丢失,你决定使用半同步复制来确保数据的一致性。

步骤

  1. 首先,确保主服务器和至少一个从服务器安装了半同步复制插件。

    INSTALL PLUGIN rpl_semi_sync_master SONAME 'semisync_master.so';
    INSTALL PLUGIN rpl_semi_sync_slave SONAME 'semisync_slave.so';
    
  2. 在主服务器上启用半同步复制。

    SET GLOBAL rpl_semi_sync_master_enabled = 1;
    SET GLOBAL rpl_semi_sync_master_timeout = 1000;  -- 1 second
    
  3. 在从服务器上启用半同步复制。

    SET GLOBAL rpl_semi_sync_slave_enabled = 1;
    
  4. 使用 Python 脚本来自动化这一过程,假设你已经建立了与数据库的连接。

    import mysql.connectordef configure_semi_sync(host, user, password, is_master=True):conn = mysql.connector.connect(host=host, user=user, password=password)cursor = conn.cursor()if is_master:cursor.execute("INSTALL PLUGIN rpl_semi_sync_master SONAME 'semisync_master.so'")cursor.execute("SET GLOBAL rpl_semi_sync_master_enabled = 1")cursor.execute("SET GLOBAL rpl_semi_sync_master_timeout = 1000")else:cursor.execute("INSTALL PLUGIN rpl_semi_sync_slave SONAME 'semisync_slave.so'")cursor.execute("SET GLOBAL rpl_semi_sync_slave_enabled = 1")conn.close()# Configure the master
    configure_semi_sync('master_host', 'root', 'master_password', is_master=True)
    # Configure the slave
    configure_semi_sync('slave_host', 'root', 'slave_password', is_master=False)
    

6.2.3 拓展案例 1:监控半同步复制的延迟

为了确保你的半同步复制运行顺畅,监控复制延迟是非常重要的。

使用 Python 查询 SHOW SLAVE STATUS 并解析 Seconds_Behind_Master 来监控延迟。

conn = mysql.connector.connect(host='slave_host', user='root', password='yourpassword')
cursor = conn.cursor()
cursor.execute("SHOW SLAVE STATUS")
slave_status = cursor.fetchone()
delay = slave_status[cursor.column_names.index('Seconds_Behind_Master')]
print(f"Current replication delay: {delay} seconds")

6.2.4 拓展案例 2:动态切换复制类型

在某些情况下,你可能需要根据负载动态切换复制类型,比如从半同步复制切换回异步复制以减少写操作的延迟。

使用 Python 脚本来动态调整复制类型。

def switch_replication_mode(host, user, password, mode='ASYNC'):conn = mysql.connector.connect(host=host, user=user, password=password)cursor = conn.cursor()if mode == 'SEMI_SYNC':cursor.execute("SET GLOBAL rpl_semi_sync_master_enabled = 1")else:cursor.execute("SET GLOBAL rpl_semi_sync_master_enabled = 0")conn.close()# Switch to asynchronous replication
switch_replication_mode('master_host', 'root', 'master_password', mode='ASYNC')

通过以上案例,你不仅学会了如何根据业务需求选择合适的复制策略,还掌握了使用 Python 来配置和监控 MySQL 复制的技巧,确保你的数据库复制策略既灵活又可靠。

在这里插入图片描述


6.3 解决复制冲突

在 MySQL 复制过程中,冲突是不可避免的。它们通常发生在多主复制环境中,或者当从服务器试图应用已经在主服务器上更改过的数据时。有效地管理和解决这些冲突对于保持数据一致性和系统稳定性至关重要。

6.3.1 基础知识

复制冲突主要包括两类:

  • 主键冲突:当两个或更多的服务器试图插入具有相同主键的记录时发生。
  • 数据不一致:当不同的更改被应用到同一数据集上,导致数据在主从服务器之间不一致。

解决复制冲突的策略包括:

  • 冲突检测与解决机制:一些高级复制技术(如 MySQL Group Replication)内置了冲突检测与解决机制。

  • 避免写入冲突:通过应用设计或数据库架构来避免潜在的写入冲突。

  • 手动解决冲突:通过审查冲突数据并手动解决。

6.3.2 重点案例:使用 Python 检测并解决主键冲突

假设你在一个多主复制环境中工作,需要确保数据的一致性,你可以使用 Python 来帮助检测和解决可能的主键冲突。

步骤

  1. 编写一个 Python 脚本来查询可能的主键冲突。

    import mysql.connector
    from mysql.connector import Errortry:conn = mysql.connector.connect(host='host', user='user', password='password', database='dbname')cursor = conn.cursor()cursor.execute("SELECT id, COUNT(*) c FROM tablename GROUP BY id HAVING c > 1")for (id, count) in cursor:print(f"Duplicate ID: {id}, Count: {count}")
    except Error as e:print(f"Error: {e}")
    finally:if conn.is_connected():cursor.close()conn.close()
    
  2. 手动或自动解决检测到的冲突。这可能包括删除重复的记录或合并数据。

6.3.3 拓展案例 1:自动解决数据不一致

在某些情况下,你可能需要自动解决由于网络分区或其他问题导致的数据不一致问题。

  1. 使用 Python 定期检查并修复数据不一致。

    # 假设有两个连接,conn_master 和 conn_slave 分别连接到主和从服务器
    cursor_master = conn_master.cursor()
    cursor_slave = conn_slave.cursor()# 检查并解决数据不一致
    cursor_master.execute("SELECT id, data FROM tablename")
    master_data = cursor_master.fetchall()
    for (id, data) in master_data:cursor_slave.execute("SELECT data FROM tablename WHERE id = %s", (id,))slave_data = cursor_slave.fetchone()if slave_data is None or slave_data[0] != data:print(f"Data inconsistency detected for ID: {id}. Updating slave...")cursor_slave.execute("REPLACE INTO tablename (id, data) VALUES (%s, %s)", (id, data))conn_slave.commit()
    

6.3.4 拓展案例 2:使用 Python 实现自定义冲突解决策略

在一些高级应用场景中,可能需要根据业务逻辑实现自定义的冲突解决策略。在一些高级应用场景中,可能需要根据业务逻辑实现自定义的冲突解决策略。

  1. 设计一个策略来决定当冲突发生时保留哪条记录。

    # 假设基于最新的时间戳来解决冲突
    cursor.execute("SELECT id, MAX(updated_at) FROM tablename GROUP BY id HAVING COUNT(*) > 1")
    for (id, latest) in cursor:cursor.execute("DELETE FROM tablename WHERE id = %s AND updated_at < %s", (id, latest))print(f"Resolved conflict for ID: {id}, keeping record with latest updated_at: {latest}")conn.commit()
    

通过上述案例,你不仅学习了如何检测和解决 MySQL 复制中的常见冲突类型,还探索了如何利用 Python 实现自动化和自定义的冲突解决策略,从而保证了数据的一致性和系统的稳定性。这些技能对于管理复杂的数据库系统和确保业务连续性至关重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/675952.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

架构整洁之道-软件架构-测试边界、整洁的嵌入式架构、实现细节

6 软件架构 6.14 测试边界 和程序代码一样&#xff0c;测试代码也是系统的一部分。甚至&#xff0c;测试代码有时在系统架构中的地位还要比其他部分更独特一些。 测试也是一种系统组件。 从架构的角度来讲&#xff0c;所有的测试都是一样的。不论它们是小型的TDD测试&#xff…

windowsserver 2016 PostgreSQL9.6.3-2升级解决其安全漏洞问题

PostgreSQL 身份验证绕过漏洞(CVE-2017-7546) PostgreSQL 输入验证错误漏洞(CVE-2019-10211) PostgreSQL adminpack扩展安全漏洞(CVE-2018-1115) PostgreSQL 输入验证错误漏洞(CVE-2021-32027) PostgreSQL SQL注入漏洞(CVE-2019-10208) PostgreSQL 安全漏洞(CVE-2018-1058) …

数据库管理-第146期 最强Oracle监控EMCC深入使用-03(20240206)

数据库管理145期 2024-02-06 数据库管理-第146期 最强Oracle监控EMCC深入使用-03&#xff08;20240206&#xff09;1 概览2 性能中心3 性能中心-Exadata总结 数据库管理-第146期 最强Oracle监控EMCC深入使用-03&#xff08;20240206&#xff09; 作者&#xff1a;胖头鱼的鱼缸&…

dddddddddddddddddddd

欢迎关注博主 Mindtechnist 或加入【Linux C/C/Python社区】一起探讨和分享Linux C/C/Python/Shell编程、机器人技术、机器学习、机器视觉、嵌入式AI相关领域的知识和技术。 磁盘满的本质分析 专栏&#xff1a;《Linux从小白到大神》 | 系统学习Linux开发、VIM/GCC/GDB/Make工具…

安全之护网(HVV)、红蓝对抗

文章目录 红蓝对抗什么是护网行动&#xff1f;护网分类护网的时间 什么是红蓝对抗红蓝对抗演练的目的什么是企业红蓝对抗红蓝对抗价值参考 红蓝对抗 什么是护网行动&#xff1f; 护网的定义是以国家组织组织事业单位、国企单位、名企单位等开展攻防两方的网络安全演习。进攻方…

基于CNN卷积网络的MNIST手写数字识别matlab仿真,CNN编程实现不使用matlab工具箱

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1 卷积神经网络&#xff08;CNN&#xff09; 4.2 损失函数和优化 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 matlab2022a 3.部分核心程序 ......................…

Bert下载和使用(以bert-base-uncased为例)

Bert官方github地址&#xff1a;https://github.com/google-research/bert?tabreadme-ov-file 【hugging face无法加载预训练模型】OSError&#xff1a;Can‘t load config for ‘./bert-base-uncased‘. If you‘re trying 如何下载和在本地使用Bert预训练模型 以bert-base-u…

计算机网络基本知识(一)

文章目录 概要速率带宽、吞吐量带宽吞吐量 时延发送&#xff08;传输&#xff09;时延传播时延排队时延处理时延时延带宽积 利用率 概要 速率、带宽、吞吐量、时延、利用率 速率 记忆要点&#xff1a;10的三次方 记忆要点&#xff1a;2的10次方 带宽、吞吐量 带宽 单位&…

【lesson11】高并发内存池性能优化

文章目录 高并发内存池性能问题基数树优化性能代码一层基数树两层基数树三层基数树 一层基数树替代mapPageCache.hPageCache.cpp基数树线程安全的原因 高并发内存池性能问题 我们知道&#xff0c;我们实现的高并发内存池存在大量的申请锁和&#xff0c;释放锁&#xff0c;而这…

为什么要进行FTP替代?专业的FTP替代方案了解一下!

FTP&#xff08;File Transfer Protocol&#xff0c;文件传输协议&#xff09;的历史可以追溯到20世纪70年代&#xff0c;这是一个由美国国防部资助的早期计算机网络&#xff0c;后来发展成为互联网的前身。随着时间的推移&#xff0c;FTP经历了多次迭代和改进&#xff0c;以适…

一条 SQL 查询语句是如何执行的

MySQL 的基本架构示意图 大体来说&#xff0c;MySQL 可以分为 Server 层和存储引擎层两部分 Server 层包括连接器、查询缓存、分析器、优化器、执行器等&#xff0c;涵盖 MySQL 的大多数核心服务功能&#xff0c;以及所有的内置函数&#xff08;如日期、时间、数学和加密函数等…

数字图像处理实验记录七(彩色图像处理实验)

一、基础知识 经过前面的实验可以得知&#xff0c;彩色图像中的RGB图像就是一个三维矩阵&#xff0c;有3个维度&#xff0c;它们分别存储着R元素&#xff0c;G元素&#xff0c;B元素的灰度信息&#xff0c;最后将它们合起来&#xff0c;便是彩色图像。 这一次实验涉及CMYK和HS…

Linux下的多用户管理和认证:从入门到精通(附实例)

Linux操作系统以其强大的多用户管理和认证机制而著称。这种机制不仅允许多个用户同时登录并执行各种任务&#xff0c;还能确保每个用户的数据安全和隐私。本文将通过一系列实例&#xff0c;带你逐步掌握Linux下的多用户管理和认证。 一、Linux多用户管理的基础知识 在Linux中&…

企业内部知识库管理软件的终极指南:如何选择最适合你的工具?

知识库管理软件对于希望提高客户支持和组织效率的公司来说是一个强大的工具。在数字时代&#xff0c;拥有一个可靠的知识库系统对于快速准确地满足客户需求至关重要。在当今的技术条件下&#xff0c;知识库管理软件有很多选择&#xff0c;每个企业都应该仔细评估并选择最适合自…

服务器与电脑的区别?

目录 一、什么是服务器 二、什么是电脑 三、服务器和电脑的区别 一、什么是服务器 服务器是指一种专门提供计算和存储资源、运行特定软件服务的物理或虚拟计算机。服务器主要用于接受和处理来自客户端&#xff08;如个人电脑、手机等&#xff09;的请求&#xff0c;并向客户…

Android:Android Studio安装及环境配置

1开发环境搭建 Android开发需要使用java的jdk环境,所以需要下载JAVA JDK。 1.1安装配置JAVA JDK Java的JDK下载: https://www.oracle.com/technetwork/java/javase/downloads/index.html 配置java的环境变量: JAVA_HOME:java安装路径。 新增环境变量CLASSPATH 在Path环境…

数据结构入门(1)数据结构介绍

目录 前言 1. 什么是数据结构&#xff1f; 2.什么是算法&#xff1f; 3.数据结构和算法的重要性 前言 本文将开始介绍计算机里的数据结构。 数据结构是指数据对象中元素之间的关系&#xff0c;以及对这些关系的操作。数据结构可以分为线性结构和非线性结构。 线性结构是…

openGauss学习笔记-216 openGauss性能调优-确定性能调优范围-硬件瓶颈点分析-CPU

文章目录 openGauss学习笔记-216 openGauss性能调优-确定性能调优范围-硬件瓶颈点分析-CPU216.1 CPU216.2 查看CPU状况216.3 性能参数分析 openGauss学习笔记-216 openGauss性能调优-确定性能调优范围-硬件瓶颈点分析-CPU 获取openGauss节点的CPU、内存、I/O和网络资源使用情况…

Leetcode 213 打家劫舍 II

题意理解&#xff1a; 你是一个专业的小偷&#xff0c;计划偷窃沿街的房屋&#xff0c;每间房内都藏有一定的现金。这个地方所有的房屋都 围成一圈 &#xff0c;这意味着第一个房屋和最后一个房屋是紧挨着的。同时&#xff0c;相邻的房屋装有相互连通的防盗系统&#xff0c;如果…

项目02《游戏-11-开发》Unity3D

基于 项目02《游戏-10-开发》Unity3D &#xff0c; 任务&#xff1a;飞行坐骑 首先创建脚本&#xff0c; 绑定脚本&#xff0c; using UnityEngine; public class Dragon : MonoBehaviour{ [SerializeField] private float speed 10f; public Transfo…