MySQL数据库笔记——多版本并发控制MVCC

大家好,这里是Good Note,关注 公主号:Goodnote,本文详细介绍MySQL的并发控制:多版本并发控制MVCC。

在这里插入图片描述

文章目录

    • 背景介绍
      • 数据库并发控制——锁机制
        • 悲观锁和乐观锁
          • 悲观锁
          • 乐观锁
      • 数据库并发控制——MVCC 的引入
      • MVCC 和锁机制的对比
    • MySQL 的多版本并发控制 (MVCC)
      • 快照读和当前读
      • 快照读和当前读的对比
      • 隐藏的系统列
      • Undo Log(回滚日志)
      • Read View(读视图)
      • 可见性算法(Visibility Algorithm)
      • MVCC 支持的事务隔离级别
      • 整体工作流程
      • 总结
      • MVCC 的优点
      • MVCC 的局限性
      • 示例:MVCC 的快照读
    • 历史文章

背景介绍

许多人认为 MVCC(Multi-Version Concurrency Control,多版本并发控制) 是一种乐观锁的实现方式,我们先来了解一下什么是乐观锁和悲观锁。

数据库并发控制——锁机制

在数据库系统中,并发控制是保证多个事务在并发执行时数据一致性的核心技术。传统的并发控制方法是使用 ,它是一种直接而有效的解决方案。

  • 锁的分类
    • DQL(Data Query Language,数据查询语言):查询数据(如 SELECT)时使用 读锁
    • DML(Data Manipulation Language,数据操作语言):对数据进行增、删、改操作(如 INSERTDELETEUPDATE)时使用 写锁
    • DDL(Data Definition Language,数据库定义语言):定义和修改表结构(如 CREATE TABLEDROP TABLE)时,通常会使用 元数据锁
悲观锁和乐观锁
悲观锁
  • 概念
    悲观锁假定会发生并发冲突,因此在对资源进行操作之前,会先加锁,确保其他事务无法同时访问该资源。
  • 特点
    • 需要加锁,锁定资源后,其他线程对该资源的操作会被阻塞。
    • 开销较大,可能导致性能下降。
  • 应用场景
    • 适用于并发冲突频繁的场景。
  • 例子
    数据库中的 行级锁 或 Java 中的 synchronized 关键字。
乐观锁
  • 概念
    乐观锁假定不会发生并发冲突,因此不加锁,而是在更新数据时,通过比较版本号或条件检查来保证操作的正确性。
  • 特点
    • 不加锁,操作更轻量级。
    • 需要在操作完成后检查是否发生冲突。
  • 应用场景
    • 适用于并发冲突较少的场景。
  • 实现方式
    • 版本号机制:每次修改数据时,更新版本号。更新操作成功的前提是版本号没有变化。
    • CAS(Compare And Swap):通过原子性比较和更新操作实现乐观锁。

数据库并发控制——MVCC 的引入

许多人认为 MVCC(Multi-Version Concurrency Control,多版本并发控制) 是一种乐观锁的实现方式,但 MVCC 的核心在于通过 版本控制和可见性算法 来实现数据库的并发控制。InnoDB 的 MVCC 通过隐藏字段、Undo Log 和 Read View 协同工作,实现了高效的多版本并发控制:

  1. 隐藏字段

    • 提供版本控制信息,判断事务的可见性。
  2. Undo Log

    • 保存数据的历史版本,支持事务回滚和快照读。
  3. Read View

    • 在事务启动时生成的元数据,用于确定哪些数据版本对事务可见。

MVCC 和锁机制的对比

特性锁(悲观锁/乐观锁)MVCC
加锁开销悲观锁需要加锁,开销较大;乐观锁无需加锁不加锁,依赖多版本数据
并发性能读写互斥,可能导致线程阻塞读写分离,读操作不阻塞写
实现方式直接加锁或通过版本号/CAS 判断通过 Undo Log 和事务视图维护多版本
适用场景并发冲突频繁的场景(悲观锁)读多写少的场景,且冲突较少
优缺点加锁开销大,读写冲突会阻塞空间开销较大,但读性能更优

MySQL 的多版本并发控制 (MVCC)

多版本并发控制 (MVCC, Multi-Version Concurrency Control) 是 MySQL 用于实现事务隔离的一种机制,主要应用于 InnoDB 存储引擎。通过 MVCC,MySQL 可以在高并发环境下实现 读写并行,同时减少锁的使用,提高性能。

快照读和当前读

  • 快照读(Snapshot Read)

    • 读取的是数据的快照版本(历史版本),即事务开始时的数据状态,而不是最新的
    • 常见的 SELECT 语句都是快照读,除非显式使用加锁查询。
  • 当前读(Current Read)

    • 读取的是最新版本的数据,并且会对读取的数据加锁以确保一致性
    • 常见的当前读操作包括:
      • SELECT ... FOR UPDATE
      • SELECT ... LOCK IN SHARE MODE
      • UPDATE
      • DELETE
      • INSERT

快照读和当前读的对比

操作类型快照读(Snapshot Read)当前读(Current Read)
使用场景普通 SELECT 查询加锁查询(SELECT ... FOR UPDATE 等)
是否加锁不加锁加锁
数据版本读取快照版本,使用 Undo Log读取当前版本,可能会阻塞
是否支持 MVCC支持支持,但需要额外的锁操作

隐藏的系统列

InnoDB 存储引擎会为每一行记录添加了以下 三个隐藏的系统列,用于实现 MVCC:

isDeleteDB_TRX_IDDB_ROLL_PTRRowID(可选)idnamepassword
是否删除事务 ID回滚指针隐藏的自增 ID。如果表未指定主键,系统会自建idnamepassword
字段名含义
isDelete标记该记录是否被逻辑删除,删除标志不是单独的字段,而是存储在记录头信息中,用户不可见。
DB_TRX_ID记录每行数据最近一次修改(插入/更新)所对应的事务 ID(Read View中的事务ID)。
DB_ROLL_PTR回滚指针,指向该记录的 undo log 日志,保存行的历史版本。

Undo Log(回滚日志)

Undo Log 是 InnoDB 存储引擎用于实现事务回滚、快照读(MVCC)的重要机制之一。它记录数据修改前的旧版本,并通过回滚指针(DB_ROLL_PTR)形成一条 Undo 日志链。

  • 功能

    1. 事务回滚
      • 当事务未提交或被回滚时,Undo Log 提供修改前的数据,用于恢复到原始状态,撤销未提交事务对数据库的影响。
    2. 多版本控制(MVCC)
      • Undo Log 保存了数据的历史版本,通过回滚指针(DB_ROLL_PTR),其他事务可以通过 Undo Log 获取旧版本数据。
  • Undo Log 的特性

    • 逻辑日志
      • 记录逻辑上的操作。例如:
        • 删除一条记录时,Undo Log 会记录一个对应的“插入操作”。
        • 更新一条记录时,Undo Log 会记录一个对应的“反向更新操作”。
    • 存储位置
      • Undo Log 存储在 回滚段 中。
  • Undo Log 的分类

    1. Insert Undo Log
      • 记录事务插入数据时的日志。
      • 特点:事务提交后即可丢弃,因为没有其他事务需要访问它。
    2. Update Undo Log
      • 记录事务更新或删除数据时的日志。
      • 特点:事务提交后,仍需保留以支持快照读,只有当没有比该日志更早的 Read View 存在时,才能删除。
  • 问题与优化

    • 长事务可能导致 Undo Log 无法及时清理,因为较早的 Read View 仍然需要访问旧版本数据。这会导致存储空间占用过大,建议避免长时间未提交的事务。

Read View(读视图)

Read View 是事务在执行快照读(Snapshot Read)时生成的一种快照机制,用于判断当前事务对哪些数据版本可见。

  • 功能

    • Read View 确保事务在快照读时能够看到一致性的数据。
    • 通过可见性算法(Visibility Algorithm)判断某个数据版本是否对当前事务可见。
  • Read View 的组成

    1. alive_trx_list
      • 当前系统中活跃的事务 ID 列表,包含所有未提交事务的 ID。
    2. up_limit_id
      • alive_trx_list 中的最小事务 ID。
    3. low_limit_id
      • 系统当前分配的最大事务 ID 加 1。

可见性算法(Visibility Algorithm)

在生成 Read View 后,InnoDB 通过以下步骤判断数据版本(DB_TRX_ID)是否对当前事务可见, MVCC 的可重复读(Repeatable Read)隔离级别判断如下:

  1. 判断是否早于活跃事务的最小 ID

    • 如果 DB_TRX_ID < up_limit_id,表明该版本在生成 Read View 前已提交,对当前事务可见。
  2. 判断是否晚于最新事务的最大 ID

    • 如果 DB_TRX_ID >= low_limit_id,表明该版本在生成 Read View 后才生成,对当前事务不可见。
  3. 判断是否属于活跃事务

    • 如果 DB_TRX_IDalive_trx_list 中,说明生成 Read View 时该事务仍未提交,因此该版本对当前事务不可见。
  4. 通过回滚指针查找可见版本

    • 如果数据版本不可见且 ROLL_PTR 不为空,则通过 ROLL_PTR 指向的 Undo Log 查找更早的版本,重复上述判断,直到找到可见的版本。

MVCC 支持的事务隔离级别

1. 读未提交(Read Uncommitted)

  • Read View

    • 不使用 Read View。
    • 读取数据时直接读取最新版本,无论数据是否由其他事务提交。
  • 可见性规则

    • 所有事务的最新修改版本对当前事务可见
    • 即使其他事务未提交的数据,也可以被读取(会发生脏读)。
  • 特点

    • 无需 Undo Log,也不使用 alive_trx_list 等 Read View 属性。

2. 读已提交(Read Committed)

  • Read View

    • 每次查询都会生成新的 Read View,因此每次查询的结果可能不同
    • Read View 只在当前查询的上下文中生效,不跨查询复用。
  • 可见性规则

    1. 如果 DB_TRX_ID 小于 up_limit_id(即数据版本在当前查询的 Read View 生成之前已提交),则该版本对当前事务可见
    2. 如果 DB_TRX_ID 在活跃事务列表中,说明该版本由未提交事务生成,对当前事务不可见
  • 特点

    • 数据版本的可见性随着每次查询变化。
    • 防止脏读,但可能发生不可重复读。

3. 可重复读(Repeatable Read)

  • Read View

    • 事务开始时生成一次 Read View,整个事务期间使用同一个快照,确保读取结果一致
    • 该 Read View 的属性(up_limit_idlow_limit_idalive_trx_list)在事务期间不会变化。
  • 可见性规则

    1. 如果 DB_TRX_ID < up_limit_id,说明数据版本在事务开始前已提交,对当前事务可见
    2. 如果 DB_TRX_ID >= low_limit_id,说明数据版本在事务开始后生成,对当前事务不可见
    3. 如果 DB_TRX_IDalive_trx_list 中,说明数据版本由未提交的事务生成,对当前事务不可见
  • 特点

    • 读操作始终基于事务开始时生成的 Read View。
    • 防止脏读和不可重复读,但可能发生幻读。

4. 串行化(Serializable)

  • Read View

    • 不使用 Read View。
    • 通过加锁(如共享锁、排他锁)实现事务隔离。
  • 可见性规则

    • 每次读取时都会加锁,确保当前读操作的可见性。
    • 因为加锁阻塞了其他事务的修改或读取,因此不存在不可见的问题。
  • 特点

    • 防止脏读、不可重复读和幻读。
    • 并发性能较低,但数据一致性最高。

整体工作流程

  1. 事务修改数据时

    • 写入 Undo Log,保存旧版本数据。
    • 更新 DB_TRX_IDDB_ROLL_PTR
  2. 事务执行快照读时

    • 生成 Read View,记录当前系统中活跃事务列表。
    • 判断数据版本是否可见:
      • 若不可见,使用 DB_ROLL_PTR 查找历史版本。
  3. 事务提交时

    • Insert Undo Log 可直接删除。
    • Update Undo Log 保留,用于支持其他事务的快照读。
  4. 事务回滚时

    • 通过 Undo Log 恢复旧版本数据,撤销事务的影响。

总结

  • MVCC 是 InnoDB 存储引擎中实现事务隔离和提高并发性能的关键机制

  • 通过维护多个数据版本和 Undo Log,实现快照读和当前读,避免了大量加锁操作。

  • Undo Log

    • 是 MVCC 的基础,记录旧版本数据,支持事务回滚和快照读。
    • 分类为 Insert Undo Log 和 Update Undo Log。
  • Read View

    • 确保快照读的隔离性,通过可见性算法判断数据版本是否可见。
    • 隔离级别的不同会影响 Read View 的生成时机。
  • 两者配合

    • Undo Log 提供数据的历史版本,Read View 判断哪些版本对当前事务可见,共同实现事务的并发控制和一致性。

MVCC 的优点

  1. 提高并发性能

    • 快照读不需要加锁,避免了读写之间的冲突。
  2. 减少锁开销

    • 大量读操作可以通过读取历史版本完成,无需加锁,提高效率。
  3. 支持事务隔离

    • MVCC 能够在不同的隔离级别下提供一致的数据读取。

MVCC 的局限性

  1. 占用存储空间

    • Undo Log 的存在会增加存储开销,特别是长事务会导致 Undo Log 增长。
  2. 长事务的性能问题

    • 长事务可能会导致 Undo Log 不能被及时清理,增加性能开销。
  3. 仅适用于读写混合场景

    • 如果事务中大量是写操作,MVCC 的优势会减弱,因为写操作仍需加锁。

示例:MVCC 的快照读

1. 表结构

CREATE TABLE orders (id INT AUTO_INCREMENT PRIMARY KEY,status VARCHAR(20)
);

2. 插入数据

INSERT INTO orders (status) VALUES ('pending'), ('shipped'), ('delivered');

3. 启动事务并模拟并发查询
事务 A:

START TRANSACTION;
SELECT * FROM orders; -- 快照读,读取事务开始时的版本
UPDATE orders SET status = 'cancelled' WHERE id = 1; -- 当前读,修改最新版本

事务 B:

START TRANSACTION;
SELECT * FROM orders WHERE id = 1; -- 读取事务 A 修改前的快照版本

结果:

  • 事务 A 在事务 B 提交之前,可以看到修改后的状态。
  • 事务 B 在事务 A 提交之前,读取的是修改前的状态。

历史文章

  1. MySQL数据库笔记——数据库三范式
  2. MySQL数据库笔记——存储引擎(InnoDB、MyISAM、MEMORY、ARCHIVE)
  3. MySQL数据库笔记——常见的几种锁分类
  4. MySQL数据库笔记——索引介绍
  5. MySQL数据库笔记——事务介绍
  6. MySQL数据库笔记——索引结构之B+树
  7. MySQL数据库笔记——索引潜规则(回表查询、索引覆盖、索引下推)
  8. MySQL数据库笔记——索引潜规则(最左前缀原则)
  9. MySQL数据库笔记——常见慢查询优化方式
  10. MySQL数据库笔记——日志介绍

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/891783.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电脑里msvcr120.dll文件丢失怎样修复?

电脑里msvcr120.dll文件丢失的修复指南 在电脑的日常使用中&#xff0c;我们可能会遇到各种各样的系统文件丢失问题&#xff0c;其中msvcr120.dll文件的丢失就是较为常见的一种。作为一名在软件开发领域深耕多年的从业者&#xff0c;我将为大家详细解析msvcr120.dll文件的重要…

今日头条ip属地根据什么显示?不准确怎么办

在今日头条这样的社交媒体平台上&#xff0c;用户的IP属地信息对于维护网络环境的健康与秩序至关重要。然而&#xff0c;不少用户发现自己的IP属地显示与实际位置不符&#xff0c;这引发了广泛的关注和讨论。本文将深入探讨今日头条IP属地的显示依据&#xff0c;并提供解决IP属…

【Rust自学】10.3. trait Pt.1:trait的定义、约束与实现

喜欢的话别忘了点赞、收藏加关注哦&#xff0c;对接下来的教程有兴趣的可以关注专栏。谢谢喵&#xff01;(&#xff65;ω&#xff65;) 题外话&#xff1a;trait的概念非常非常非常重要&#xff01;&#xff01;&#xff01;整个第10章全都是Rust的重难点&#xff01;&#x…

大白话拆解——多线程中关于死锁的一切(七)(已完结)

前言&#xff1a; 25年初&#xff0c;这个时候好多小伙伴都在备战期末 小编明天还有一科考试&#xff0c;日更一篇&#xff0c;今天这篇一定会对小白非常有用的&#xff01;&#xff01;&#xff01; 因为我们会把案例到用代码实现的全过程思路呈现出来&#xff01;&#xff…

GitLab集成Runner详细版--及注意事项汇总【最佳实践】

一、背景 看到网上很多用户提出的runner问题其实实际都不是问题&#xff0c;不过是因为对runner的一些细节不清楚导致了误解。本文不系统性的介绍GitLab-Runner&#xff0c;因为这类文章写得好的特别多&#xff0c;本文只汇总一些常几的问题/注意事项。旨在让新手少弯路。 二、…

《数据结构》期末考试测试题【中】

《数据结构》期末考试测试题【中】 21.循环队列队空的判断条件为&#xff1f;22. 单链表的存储密度比1&#xff1f;23.单链表的那些操作的效率受链表长度的影响&#xff1f;24.顺序表中某元素的地址为&#xff1f;25.m叉树第K层的结点数为&#xff1f;26. 在双向循环链表某节点…

「Mac畅玩鸿蒙与硬件54」UI互动应用篇31 - 滑动解锁屏幕功能

本篇教程将实现滑动解锁屏幕功能&#xff0c;通过 Slider 组件实现滑动操作&#xff0c;学习事件监听、状态更新和交互逻辑的实现方法。 关键词 滑动解锁UI交互状态管理动态更新事件监听 一、功能说明 滑动解锁屏幕功能包含以下功能&#xff1a; 滑动解锁区域&#xff1a;用…

螺栓松动丢失腐蚀生锈检测数据集VOC+YOLO格式504张4类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;504 标注数量(xml文件个数)&#xff1a;504 标注数量(txt文件个数)&#xff1a;504 标注…

Postman测试big-event

报错500。看弹幕&#xff0c;知道可能是yml或sql有问题。 所以检查idea工作台&#xff0c; 直接找UserMapper检查&#xff0c;发现完全OK。 顺着这个error发现可能是sql有问题。因为提示是sql问题&#xff0c;而且是有now()的那个sql。 之后通过给的课件&#xff0c;复制课件…

如何使用大语言模型进行事件抽取与关系抽取

诸神缄默不语-个人CSDN博文目录 文章目录 1. 什么是事件抽取与关系抽取&#xff1f;2. 示例&#xff1a;使用大语言模型进行事件抽取与关系抽取 1. 什么是事件抽取与关系抽取&#xff1f; 事件抽取是指从文本中识别出与某些“事件”相关的信息。这些事件通常包括动作、参与者、…

NAT网络技术

NAT&#xff08;Network Address Translation&#xff0c;网络地址转换&#xff09;是一种常用的网络技术&#xff0c;主要用于在私有网络和公共网络之间转换IP地址。在家庭和小型企业网络当中用的比较多。它的主要功能有IP地址重用和增强网络的安全性。   NAT允许一个整个网…

SpringBoot框架开发中常用的注解

文章目录 接收HTTP请求。RestController全局异常处理器Component依赖注入LombokDataBuildersneakyThrowsRequiredArgsConstructor 读取yml文件配置类注解 接收HTTP请求。 RequestMapping 接收HTTP请求。具体一点是 GetMapping PostMapping PutMapping DeleteMapping 一共…

TVS二极管选型【EMC】

TVS器件并联在电路中&#xff0c;当电路正常工作时&#xff0c;他处于截止状态&#xff08;高阻态&#xff09;&#xff0c;不影响线路正常工作&#xff0c;当线路处于异常过压并达到其击穿电压时&#xff0c;他迅速由高阻态变为低阻态&#xff0c;给瞬间电流提供一个低阻抗导通…

Azkaban其二,具体使用以及告警设置

目录 Azkaban的使用 1、使用Flow1.0(比较老旧&#xff09; 2、Flow2.0的用法 1、小试牛刀 2、YAML格式的数据 3、多任务依赖 4、内嵌流&#xff08;嵌套流&#xff09;案例 5、动态传参 3、Azkaban的报警机制 1&#xff09;邮箱通知 2&#xff09;电话报警机制 4、关…

文档 | Rstudio下的轻量级单页面markdown阅读器 markdownReader

需求&#xff1a;在写R数据分析项目的时候&#xff0c;代码及结果的关键变化怎么记录下来&#xff1f;最好git能很容易的跟踪版本变化。 markdown 是最理想的选择&#xff0c;本文给出一种Rstuidio下的轻量级md阅读器实现&#xff1a;markdownReader。书写md还是在Rstudio。更…

SonarQube相关的maven配置及使用

一、maven 全局配置 <settings><pluginGroups><pluginGroup>org.sonarsource.scanner.maven</pluginGroup></pluginGroups><profiles><profile><id>sonar</id><activation><activeByDefault>true</acti…

Arduino Uno简介与使用方法

目录 一、Arduino Uno概述 1. 硬件特性 2. 开发环境 二、Arduino Uno的基本使用方法 1. 硬件连接 2. 软件编程 三、Arduino Uno编程基础 1. 基本语法 2. 常用函数 四、Arduino Uno应用举例 1. LED闪烁 2. 温度检测 3. 超声波测距 五、Arduino Uno的扩展与应用 1…

UniApp | 从入门到精通:开启全平台开发的大门

UniApp | 从入门到精通:开启全平台开发的大门 一、前言二、Uniapp 基础入门2.1 什么是 Uniapp2.2 开发环境搭建三、Uniapp 核心语法与组件3.1 模板语法3.2 组件使用四、页面路由与导航4.1 路由配置4.2 导航方法五、数据请求与处理5.1 发起请求5.2 数据缓存六、样式与布局6.1 样…

滑动窗口。

1456 定长子串中元音的最大数目 采用滑动窗口。每次移动一个位置&#xff0c;判断当前窗口内的子串内目标元素的个数&#xff0c;若比之前更大就更新结果。 如何判断是否更新结果&#xff1f;也即&#xff0c;如何判断当前窗口内所含目标元素个数&#xff0c;是否为遍历到这个…

公共数据授权运营系统建设手册(附下载)

在全球范围内&#xff0c;许多国家和地区已经开始探索公共数据授权运营的路径和模式。通过建立公共数据平台&#xff0c;推动数据的开放共享&#xff0c;促进数据的创新应用&#xff0c;不仅能够提高政府决策的科学性和公共服务的效率&#xff0c;还能够激发市场活力&#xff0…