MySQL数据库笔记——多版本并发控制MVCC

大家好,这里是Good Note,关注 公主号:Goodnote,本文详细介绍MySQL的并发控制:多版本并发控制MVCC。

在这里插入图片描述

文章目录

    • 背景介绍
      • 数据库并发控制——锁机制
        • 悲观锁和乐观锁
          • 悲观锁
          • 乐观锁
      • 数据库并发控制——MVCC 的引入
      • MVCC 和锁机制的对比
    • MySQL 的多版本并发控制 (MVCC)
      • 快照读和当前读
      • 快照读和当前读的对比
      • 隐藏的系统列
      • Undo Log(回滚日志)
      • Read View(读视图)
      • 可见性算法(Visibility Algorithm)
      • MVCC 支持的事务隔离级别
      • 整体工作流程
      • 总结
      • MVCC 的优点
      • MVCC 的局限性
      • 示例:MVCC 的快照读
    • 历史文章

背景介绍

许多人认为 MVCC(Multi-Version Concurrency Control,多版本并发控制) 是一种乐观锁的实现方式,我们先来了解一下什么是乐观锁和悲观锁。

数据库并发控制——锁机制

在数据库系统中,并发控制是保证多个事务在并发执行时数据一致性的核心技术。传统的并发控制方法是使用 ,它是一种直接而有效的解决方案。

  • 锁的分类
    • DQL(Data Query Language,数据查询语言):查询数据(如 SELECT)时使用 读锁
    • DML(Data Manipulation Language,数据操作语言):对数据进行增、删、改操作(如 INSERTDELETEUPDATE)时使用 写锁
    • DDL(Data Definition Language,数据库定义语言):定义和修改表结构(如 CREATE TABLEDROP TABLE)时,通常会使用 元数据锁
悲观锁和乐观锁
悲观锁
  • 概念
    悲观锁假定会发生并发冲突,因此在对资源进行操作之前,会先加锁,确保其他事务无法同时访问该资源。
  • 特点
    • 需要加锁,锁定资源后,其他线程对该资源的操作会被阻塞。
    • 开销较大,可能导致性能下降。
  • 应用场景
    • 适用于并发冲突频繁的场景。
  • 例子
    数据库中的 行级锁 或 Java 中的 synchronized 关键字。
乐观锁
  • 概念
    乐观锁假定不会发生并发冲突,因此不加锁,而是在更新数据时,通过比较版本号或条件检查来保证操作的正确性。
  • 特点
    • 不加锁,操作更轻量级。
    • 需要在操作完成后检查是否发生冲突。
  • 应用场景
    • 适用于并发冲突较少的场景。
  • 实现方式
    • 版本号机制:每次修改数据时,更新版本号。更新操作成功的前提是版本号没有变化。
    • CAS(Compare And Swap):通过原子性比较和更新操作实现乐观锁。

数据库并发控制——MVCC 的引入

许多人认为 MVCC(Multi-Version Concurrency Control,多版本并发控制) 是一种乐观锁的实现方式,但 MVCC 的核心在于通过 版本控制和可见性算法 来实现数据库的并发控制。InnoDB 的 MVCC 通过隐藏字段、Undo Log 和 Read View 协同工作,实现了高效的多版本并发控制:

  1. 隐藏字段

    • 提供版本控制信息,判断事务的可见性。
  2. Undo Log

    • 保存数据的历史版本,支持事务回滚和快照读。
  3. Read View

    • 在事务启动时生成的元数据,用于确定哪些数据版本对事务可见。

MVCC 和锁机制的对比

特性锁(悲观锁/乐观锁)MVCC
加锁开销悲观锁需要加锁,开销较大;乐观锁无需加锁不加锁,依赖多版本数据
并发性能读写互斥,可能导致线程阻塞读写分离,读操作不阻塞写
实现方式直接加锁或通过版本号/CAS 判断通过 Undo Log 和事务视图维护多版本
适用场景并发冲突频繁的场景(悲观锁)读多写少的场景,且冲突较少
优缺点加锁开销大,读写冲突会阻塞空间开销较大,但读性能更优

MySQL 的多版本并发控制 (MVCC)

多版本并发控制 (MVCC, Multi-Version Concurrency Control) 是 MySQL 用于实现事务隔离的一种机制,主要应用于 InnoDB 存储引擎。通过 MVCC,MySQL 可以在高并发环境下实现 读写并行,同时减少锁的使用,提高性能。

快照读和当前读

  • 快照读(Snapshot Read)

    • 读取的是数据的快照版本(历史版本),即事务开始时的数据状态,而不是最新的
    • 常见的 SELECT 语句都是快照读,除非显式使用加锁查询。
  • 当前读(Current Read)

    • 读取的是最新版本的数据,并且会对读取的数据加锁以确保一致性
    • 常见的当前读操作包括:
      • SELECT ... FOR UPDATE
      • SELECT ... LOCK IN SHARE MODE
      • UPDATE
      • DELETE
      • INSERT

快照读和当前读的对比

操作类型快照读(Snapshot Read)当前读(Current Read)
使用场景普通 SELECT 查询加锁查询(SELECT ... FOR UPDATE 等)
是否加锁不加锁加锁
数据版本读取快照版本,使用 Undo Log读取当前版本,可能会阻塞
是否支持 MVCC支持支持,但需要额外的锁操作

隐藏的系统列

InnoDB 存储引擎会为每一行记录添加了以下 三个隐藏的系统列,用于实现 MVCC:

isDeleteDB_TRX_IDDB_ROLL_PTRRowID(可选)idnamepassword
是否删除事务 ID回滚指针隐藏的自增 ID。如果表未指定主键,系统会自建idnamepassword
字段名含义
isDelete标记该记录是否被逻辑删除,删除标志不是单独的字段,而是存储在记录头信息中,用户不可见。
DB_TRX_ID记录每行数据最近一次修改(插入/更新)所对应的事务 ID(Read View中的事务ID)。
DB_ROLL_PTR回滚指针,指向该记录的 undo log 日志,保存行的历史版本。

Undo Log(回滚日志)

Undo Log 是 InnoDB 存储引擎用于实现事务回滚、快照读(MVCC)的重要机制之一。它记录数据修改前的旧版本,并通过回滚指针(DB_ROLL_PTR)形成一条 Undo 日志链。

  • 功能

    1. 事务回滚
      • 当事务未提交或被回滚时,Undo Log 提供修改前的数据,用于恢复到原始状态,撤销未提交事务对数据库的影响。
    2. 多版本控制(MVCC)
      • Undo Log 保存了数据的历史版本,通过回滚指针(DB_ROLL_PTR),其他事务可以通过 Undo Log 获取旧版本数据。
  • Undo Log 的特性

    • 逻辑日志
      • 记录逻辑上的操作。例如:
        • 删除一条记录时,Undo Log 会记录一个对应的“插入操作”。
        • 更新一条记录时,Undo Log 会记录一个对应的“反向更新操作”。
    • 存储位置
      • Undo Log 存储在 回滚段 中。
  • Undo Log 的分类

    1. Insert Undo Log
      • 记录事务插入数据时的日志。
      • 特点:事务提交后即可丢弃,因为没有其他事务需要访问它。
    2. Update Undo Log
      • 记录事务更新或删除数据时的日志。
      • 特点:事务提交后,仍需保留以支持快照读,只有当没有比该日志更早的 Read View 存在时,才能删除。
  • 问题与优化

    • 长事务可能导致 Undo Log 无法及时清理,因为较早的 Read View 仍然需要访问旧版本数据。这会导致存储空间占用过大,建议避免长时间未提交的事务。

Read View(读视图)

Read View 是事务在执行快照读(Snapshot Read)时生成的一种快照机制,用于判断当前事务对哪些数据版本可见。

  • 功能

    • Read View 确保事务在快照读时能够看到一致性的数据。
    • 通过可见性算法(Visibility Algorithm)判断某个数据版本是否对当前事务可见。
  • Read View 的组成

    1. alive_trx_list
      • 当前系统中活跃的事务 ID 列表,包含所有未提交事务的 ID。
    2. up_limit_id
      • alive_trx_list 中的最小事务 ID。
    3. low_limit_id
      • 系统当前分配的最大事务 ID 加 1。

可见性算法(Visibility Algorithm)

在生成 Read View 后,InnoDB 通过以下步骤判断数据版本(DB_TRX_ID)是否对当前事务可见, MVCC 的可重复读(Repeatable Read)隔离级别判断如下:

  1. 判断是否早于活跃事务的最小 ID

    • 如果 DB_TRX_ID < up_limit_id,表明该版本在生成 Read View 前已提交,对当前事务可见。
  2. 判断是否晚于最新事务的最大 ID

    • 如果 DB_TRX_ID >= low_limit_id,表明该版本在生成 Read View 后才生成,对当前事务不可见。
  3. 判断是否属于活跃事务

    • 如果 DB_TRX_IDalive_trx_list 中,说明生成 Read View 时该事务仍未提交,因此该版本对当前事务不可见。
  4. 通过回滚指针查找可见版本

    • 如果数据版本不可见且 ROLL_PTR 不为空,则通过 ROLL_PTR 指向的 Undo Log 查找更早的版本,重复上述判断,直到找到可见的版本。

MVCC 支持的事务隔离级别

1. 读未提交(Read Uncommitted)

  • Read View

    • 不使用 Read View。
    • 读取数据时直接读取最新版本,无论数据是否由其他事务提交。
  • 可见性规则

    • 所有事务的最新修改版本对当前事务可见
    • 即使其他事务未提交的数据,也可以被读取(会发生脏读)。
  • 特点

    • 无需 Undo Log,也不使用 alive_trx_list 等 Read View 属性。

2. 读已提交(Read Committed)

  • Read View

    • 每次查询都会生成新的 Read View,因此每次查询的结果可能不同
    • Read View 只在当前查询的上下文中生效,不跨查询复用。
  • 可见性规则

    1. 如果 DB_TRX_ID 小于 up_limit_id(即数据版本在当前查询的 Read View 生成之前已提交),则该版本对当前事务可见
    2. 如果 DB_TRX_ID 在活跃事务列表中,说明该版本由未提交事务生成,对当前事务不可见
  • 特点

    • 数据版本的可见性随着每次查询变化。
    • 防止脏读,但可能发生不可重复读。

3. 可重复读(Repeatable Read)

  • Read View

    • 事务开始时生成一次 Read View,整个事务期间使用同一个快照,确保读取结果一致
    • 该 Read View 的属性(up_limit_idlow_limit_idalive_trx_list)在事务期间不会变化。
  • 可见性规则

    1. 如果 DB_TRX_ID < up_limit_id,说明数据版本在事务开始前已提交,对当前事务可见
    2. 如果 DB_TRX_ID >= low_limit_id,说明数据版本在事务开始后生成,对当前事务不可见
    3. 如果 DB_TRX_IDalive_trx_list 中,说明数据版本由未提交的事务生成,对当前事务不可见
  • 特点

    • 读操作始终基于事务开始时生成的 Read View。
    • 防止脏读和不可重复读,但可能发生幻读。

4. 串行化(Serializable)

  • Read View

    • 不使用 Read View。
    • 通过加锁(如共享锁、排他锁)实现事务隔离。
  • 可见性规则

    • 每次读取时都会加锁,确保当前读操作的可见性。
    • 因为加锁阻塞了其他事务的修改或读取,因此不存在不可见的问题。
  • 特点

    • 防止脏读、不可重复读和幻读。
    • 并发性能较低,但数据一致性最高。

整体工作流程

  1. 事务修改数据时

    • 写入 Undo Log,保存旧版本数据。
    • 更新 DB_TRX_IDDB_ROLL_PTR
  2. 事务执行快照读时

    • 生成 Read View,记录当前系统中活跃事务列表。
    • 判断数据版本是否可见:
      • 若不可见,使用 DB_ROLL_PTR 查找历史版本。
  3. 事务提交时

    • Insert Undo Log 可直接删除。
    • Update Undo Log 保留,用于支持其他事务的快照读。
  4. 事务回滚时

    • 通过 Undo Log 恢复旧版本数据,撤销事务的影响。

总结

  • MVCC 是 InnoDB 存储引擎中实现事务隔离和提高并发性能的关键机制

  • 通过维护多个数据版本和 Undo Log,实现快照读和当前读,避免了大量加锁操作。

  • Undo Log

    • 是 MVCC 的基础,记录旧版本数据,支持事务回滚和快照读。
    • 分类为 Insert Undo Log 和 Update Undo Log。
  • Read View

    • 确保快照读的隔离性,通过可见性算法判断数据版本是否可见。
    • 隔离级别的不同会影响 Read View 的生成时机。
  • 两者配合

    • Undo Log 提供数据的历史版本,Read View 判断哪些版本对当前事务可见,共同实现事务的并发控制和一致性。

MVCC 的优点

  1. 提高并发性能

    • 快照读不需要加锁,避免了读写之间的冲突。
  2. 减少锁开销

    • 大量读操作可以通过读取历史版本完成,无需加锁,提高效率。
  3. 支持事务隔离

    • MVCC 能够在不同的隔离级别下提供一致的数据读取。

MVCC 的局限性

  1. 占用存储空间

    • Undo Log 的存在会增加存储开销,特别是长事务会导致 Undo Log 增长。
  2. 长事务的性能问题

    • 长事务可能会导致 Undo Log 不能被及时清理,增加性能开销。
  3. 仅适用于读写混合场景

    • 如果事务中大量是写操作,MVCC 的优势会减弱,因为写操作仍需加锁。

示例:MVCC 的快照读

1. 表结构

CREATE TABLE orders (id INT AUTO_INCREMENT PRIMARY KEY,status VARCHAR(20)
);

2. 插入数据

INSERT INTO orders (status) VALUES ('pending'), ('shipped'), ('delivered');

3. 启动事务并模拟并发查询
事务 A:

START TRANSACTION;
SELECT * FROM orders; -- 快照读,读取事务开始时的版本
UPDATE orders SET status = 'cancelled' WHERE id = 1; -- 当前读,修改最新版本

事务 B:

START TRANSACTION;
SELECT * FROM orders WHERE id = 1; -- 读取事务 A 修改前的快照版本

结果:

  • 事务 A 在事务 B 提交之前,可以看到修改后的状态。
  • 事务 B 在事务 A 提交之前,读取的是修改前的状态。

历史文章

  1. MySQL数据库笔记——数据库三范式
  2. MySQL数据库笔记——存储引擎(InnoDB、MyISAM、MEMORY、ARCHIVE)
  3. MySQL数据库笔记——常见的几种锁分类
  4. MySQL数据库笔记——索引介绍
  5. MySQL数据库笔记——事务介绍
  6. MySQL数据库笔记——索引结构之B+树
  7. MySQL数据库笔记——索引潜规则(回表查询、索引覆盖、索引下推)
  8. MySQL数据库笔记——索引潜规则(最左前缀原则)
  9. MySQL数据库笔记——常见慢查询优化方式
  10. MySQL数据库笔记——日志介绍

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/891783.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

内部类 --- (寄生的哲学)

内部类总共有 4 种&#xff08;静态内部类、非静态内部类、局部内部类、匿名内部类&#xff09; 作用&#xff1a; 一&#xff1a;内部类提供了更好的封装&#xff0c;可以把内部类隐藏在外部类之内&#xff0c;不允许同一个包中的其他类访问该类。 二&#xff1a;内部类可以…

电脑里msvcr120.dll文件丢失怎样修复?

电脑里msvcr120.dll文件丢失的修复指南 在电脑的日常使用中&#xff0c;我们可能会遇到各种各样的系统文件丢失问题&#xff0c;其中msvcr120.dll文件的丢失就是较为常见的一种。作为一名在软件开发领域深耕多年的从业者&#xff0c;我将为大家详细解析msvcr120.dll文件的重要…

今日头条ip属地根据什么显示?不准确怎么办

在今日头条这样的社交媒体平台上&#xff0c;用户的IP属地信息对于维护网络环境的健康与秩序至关重要。然而&#xff0c;不少用户发现自己的IP属地显示与实际位置不符&#xff0c;这引发了广泛的关注和讨论。本文将深入探讨今日头条IP属地的显示依据&#xff0c;并提供解决IP属…

理解linux内核中的几种地址

1. 前言 《Linux内核完全注释》这本书提到了几种Linux内核中的几种地址&#xff0c;实地址&#xff0c;有虚拟地址&#xff0c;逻辑地址&#xff0c;线性地址&#xff0c;物理地址。除了物理地址以外&#xff0c;其他几种容易弄混淆。这里做一下笔记&#xff0c;讲一下我的理解…

【Rust自学】10.3. trait Pt.1:trait的定义、约束与实现

喜欢的话别忘了点赞、收藏加关注哦&#xff0c;对接下来的教程有兴趣的可以关注专栏。谢谢喵&#xff01;(&#xff65;ω&#xff65;) 题外话&#xff1a;trait的概念非常非常非常重要&#xff01;&#xff01;&#xff01;整个第10章全都是Rust的重难点&#xff01;&#x…

Java List 集合详解:基础用法、常见实现类与高频面试题解析

正文 在 Java 集合框架中&#xff0c;List 是一个非常重要的接口&#xff0c;广泛用于存储有序的元素集合。本文将带你深入了解 List 接口的基本用法、常见实现类及其扩展&#xff0c;同时通过实际代码示例帮助你快速掌握这些知识。 &#x1f449;点击获取2024Java学习资料 1…

大白话拆解——多线程中关于死锁的一切(七)(已完结)

前言&#xff1a; 25年初&#xff0c;这个时候好多小伙伴都在备战期末 小编明天还有一科考试&#xff0c;日更一篇&#xff0c;今天这篇一定会对小白非常有用的&#xff01;&#xff01;&#xff01; 因为我们会把案例到用代码实现的全过程思路呈现出来&#xff01;&#xff…

ROS节点架构设计:提高模块化与可扩展性

在 ROS2&#xff08;Robot Operating System 2&#xff09;的开发中&#xff0c;节点的架构设计是构建高效、稳定和可扩展机器人系统的基石。一个设计良好的节点架构不仅有助于提升系统的模块化水平&#xff0c;还能极大地增强代码的可维护性。本文将深入探讨 ROS2 中的三种常见…

GitLab集成Runner详细版--及注意事项汇总【最佳实践】

一、背景 看到网上很多用户提出的runner问题其实实际都不是问题&#xff0c;不过是因为对runner的一些细节不清楚导致了误解。本文不系统性的介绍GitLab-Runner&#xff0c;因为这类文章写得好的特别多&#xff0c;本文只汇总一些常几的问题/注意事项。旨在让新手少弯路。 二、…

《数据结构》期末考试测试题【中】

《数据结构》期末考试测试题【中】 21.循环队列队空的判断条件为&#xff1f;22. 单链表的存储密度比1&#xff1f;23.单链表的那些操作的效率受链表长度的影响&#xff1f;24.顺序表中某元素的地址为&#xff1f;25.m叉树第K层的结点数为&#xff1f;26. 在双向循环链表某节点…

「Mac畅玩鸿蒙与硬件54」UI互动应用篇31 - 滑动解锁屏幕功能

本篇教程将实现滑动解锁屏幕功能&#xff0c;通过 Slider 组件实现滑动操作&#xff0c;学习事件监听、状态更新和交互逻辑的实现方法。 关键词 滑动解锁UI交互状态管理动态更新事件监听 一、功能说明 滑动解锁屏幕功能包含以下功能&#xff1a; 滑动解锁区域&#xff1a;用…

螺栓松动丢失腐蚀生锈检测数据集VOC+YOLO格式504张4类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;504 标注数量(xml文件个数)&#xff1a;504 标注数量(txt文件个数)&#xff1a;504 标注…

Postman测试big-event

报错500。看弹幕&#xff0c;知道可能是yml或sql有问题。 所以检查idea工作台&#xff0c; 直接找UserMapper检查&#xff0c;发现完全OK。 顺着这个error发现可能是sql有问题。因为提示是sql问题&#xff0c;而且是有now()的那个sql。 之后通过给的课件&#xff0c;复制课件…

如何使用大语言模型进行事件抽取与关系抽取

诸神缄默不语-个人CSDN博文目录 文章目录 1. 什么是事件抽取与关系抽取&#xff1f;2. 示例&#xff1a;使用大语言模型进行事件抽取与关系抽取 1. 什么是事件抽取与关系抽取&#xff1f; 事件抽取是指从文本中识别出与某些“事件”相关的信息。这些事件通常包括动作、参与者、…

NAT网络技术

NAT&#xff08;Network Address Translation&#xff0c;网络地址转换&#xff09;是一种常用的网络技术&#xff0c;主要用于在私有网络和公共网络之间转换IP地址。在家庭和小型企业网络当中用的比较多。它的主要功能有IP地址重用和增强网络的安全性。   NAT允许一个整个网…

SpringBoot框架开发中常用的注解

文章目录 接收HTTP请求。RestController全局异常处理器Component依赖注入LombokDataBuildersneakyThrowsRequiredArgsConstructor 读取yml文件配置类注解 接收HTTP请求。 RequestMapping 接收HTTP请求。具体一点是 GetMapping PostMapping PutMapping DeleteMapping 一共…

FFmpeg(音视频处理的瑞士军刀)开发实战指南

【欢迎关注编码小哥&#xff0c;学习更多实用的编程方法和技巧】 FFmpeg开发实战指南 1. FFmpeg简介 开源多媒体处理框架支持音视频编解码跨平台&#xff08;Windows/Linux/Mac&#xff09; 2. 环境准备 2.1 安装FFmpeg # Ubuntu sudo apt-get install ffmpeg libavcodec-…

洛谷B4071 [GESP202412 五级] 武器强化

题目传送门&#xff01; 思路 我愿称之为gesp5史上最难想。。。 做法&#xff1a;贪心模拟&#xff08;or二分&#xff09; 对于贪心算法来说&#xff0c;最最最无法理解的地方&#xff1a;选择价格最低的配件来转换&#xff0c;还是选择拥有最多配件的其他武器来转换。 选…

TVS二极管选型【EMC】

TVS器件并联在电路中&#xff0c;当电路正常工作时&#xff0c;他处于截止状态&#xff08;高阻态&#xff09;&#xff0c;不影响线路正常工作&#xff0c;当线路处于异常过压并达到其击穿电压时&#xff0c;他迅速由高阻态变为低阻态&#xff0c;给瞬间电流提供一个低阻抗导通…

qt鼠标右键菜单

来看一个小例子 // 重写鼠标右键事件 void QtGuiApplication2::mousePressEvent(QMouseEvent* event) {if (event->button() Qt::RightButton){m_pMenuRD->exec(QCursor::pos());} } 鼠标右键启动菜单&#xff0c;菜单里面有啥呢&#xff1f; // 先来声明一下 // 右键…