诚意满满之MySQL实现事务隔离的秘诀:锁与MVCC

如果对事务没有太多理解,可以看前面三篇:

诚意满满之讲透事务

诚意满满之讲透事务隔离级别

诚意满满之MySQL如何实现原子性、持久性

不看前两篇也没有关系,知识点是独立的。


MySQL的四个事务隔离级别:读未提交、读已提交、可重复读、串行读。其中,读未提交即是不加任何限制,串行读则可以理解为单线程更新数据,比较简单,没有太多的探讨价值。

本文立足于读已提交和可重复读这两个痛点,以锁和MVCC为抓手,对齐读已提交和可重复读两个事务隔离级别的解决思路,通过分析MySQL的打法,沉淀出一套通用的方法论,进而在本系列内形成闭环,为八股文赋能。

咳咳,一不小心暴露了职业基本功......还未没毕业或者刚毕业的小年轻会觉得上面那段话是废话,毕业多年的老油条才知道上面那段话背后才是真正的技术门槛。

MVCC

MVCC,全称Multi-Version Concurrency Control,即多版本并发控制,用以对数据库实现并发访问。

你说并发访问不就是加锁,加锁就加锁,咋还搞这么多花里胡哨的。

在了解为什么会有MVCC之前,我们先讲两个概念:

什么是当前读和快照读?

当前读:

像select lock in share mode(共享锁), select for update ; update, insert ,delete(排他锁)这些操作都是一种当前读,为什么叫当前读?就是它读取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁。说白了,这其实悲观锁的一种实现

快照读

既然当前读是悲观锁的一种实现,相对的,快照读是乐观锁的一种实现。快照读的实现是基于多版本并发控制,即MVCC,在很多情况下,避免了加锁操作,降低了开销;既然是基于多版本,即快照读可能读到的并不一定是数据的最新版本,而有可能是之前的历史版本。

就跟拍照一样,快照读每来一个事务就按下快门,并基于此时刻的数据进行读取。

快照读的前提是事务隔离级别不是串行级别,串行级别下的快照读会退化成当前读。同样的,作为快照读的思想理论指导,MVCC一般也只放在读已提交、可重复读这两个级别下讨论。

至于读未提交,读未提交表示:不好意思,我没有锁的概念。

MVCC的实现原理

MVCC的目的就是多版本并发控制,在MySQL的innodb的实现中,它的实现原理主要是依赖记录中的 3个隐式字段、undo log 和Read View 。

我们先分别说下这三个东西:

三个隐藏字段是之前提到的:

  • DB_TRX_ID:最后对该行进行插入或修改的事务ID
  • DB_ROLL_PTR:回滚指针,指向该数据的上一个版本,本质上就是指向undo log的指针。
  • DB_ROW_ID,隐藏主键。

undolog,回滚日志,在之前的有提到,回滚日志是一条链,由历史数据版本组成。

ReadView(读视图)

什么是ReadView?

前面我们说了,快照读就跟拍照一样,每来一个事务就按下快门。ReadView可以理解为是当前存活事务的相片集。当事务执行快照读的时候(记住这个前提,这是readview的生成时机),系统就会维护一个当前活跃事务的id池用来做可见性判断,这个id池就是ReadView。

Read View遵循一个可见性算法,主要是将要被修改的数据的最新记录中的DB_TRX_ID(即当前事务ID)取出来,与系统当前其他活跃事务的ID去对比(由Read View维护),如果DB_TRX_ID跟Read View的属性做了某些比较,不符合可见性,那就通过DB_ROLL_PTR回滚指针去取出Undo Log中的DB_TRX_ID再比较,即遍历链表的DB_TRX_ID(从链首到链尾,即从最近的一次修改查起),直到找到满足特定条件的DB_TRX_ID, 那么这个DB_TRX_ID所在的旧记录就是当前事务能看见的最新老版本。

如何做可见性判断的呢?

我们把ReadView简单理解为有三个全局属性:

  • trx_list:一个由事务id组成的列表,用来维护ReadView生成时刻系统活跃的事务ID
  • up_limit_id:记录trx_list中最小的事务id。是的,是最小的事务id,这里up的意思应该是最久的意思,即存活时间最久的事务id(事务id都是从小到大递增,id最小说明事务越早创建)。
  • low_limit_id:存活时间最短的事务id

当事务读取记录时,获取记录上的DB_TRX_ID,进行以下比较:

  1. 当DB_TRX_ID=当前事务id,return true,表示可以读取,反之进入2
  2. 当DB_TRX_ID<up_limit_id,说明当前记录是更早存在的,当前事务能看到DB_TRX_ID 所在的记录,反之进入3
  3. DB_TRX_ID 大于等于 low_limit_id , 则代表DB_TRX_ID 所在的记录在Read View生成后才出现的,那对当前事务肯定不可见,如果小于则进入4
  4. 如果DB_TRX_ID在trx_list里,则代表readview生成时,DB_TRX_ID所代表的事务还在活跃(即此事务还没提交),那么对当前事务肯定不可见。如果DB_TRX_ID不在trx_list里,则说明,DB_TRX_ID这个事务在Read View生成之前就已经Commit了,当前事务是肯定可见的。

用下图来说明,此时正在活跃的事务为[4,6,8],up_limit_id=4,low_limit_id=8。当前事务准备读取DB_TRX_ID为3、6、7、9的记录。

  1. 读取DB_TRX_ID=3时,由于3 < up_limit_id,可见
  2. 读取DB_TRX_ID=6时,由于6是正在活跃的事务(还没提交),因此不可见
  3. 读取DB_TRX_ID=7时,由于7 < low_limit_id,且不在活跃事务中,可见
  4. 读取DB_TRX_ID=9时,由于9 > low_limit_id,说明9是未来事务创建的,不可见。

知道了ReadView的可见性判断条件之后,这里抛出一个问题:读已提交和可重复读是怎么用ReadView解决的?

ReadView如何解决读已提交和可重复读

ReadView如何解决读已提交和可重复读,区别在于ReadView的生成。

  • 在可重复读级别下的某个事务的对某条记录的第一次快照读会创建一个快照及Read View, 将当前系统活跃的其他事务记录起来,这些事务的修改对于当前事务都是不可见的,而早于Read View创建的事务所做的修改均是可见。此后在调用快照读的时候,还是使用的是同一个Read View。
  • 而在读已提交级别下,事务中每次快照读都会新生成一个快照和Read View, 因此在两个ReadView生成中间的修改在后一个ReadView是可见的,这就是我们在RC级别下的事务中可以看到别的事务提交的更新的原因

总结:

  • 快照读与当前读,前者是乐观的并发控制思想,后者是悲观的体现。
  • MVCC,多版本并发控制,是快照读的一种实现
    • MVCC实现事务隔离的三个关键:隐藏字段、undolog、ReadView
    • ReadView包含三个属性:trx_list、up_limit_id、low_limit_id。根据这三个条件与隐藏字段DB_TRX_ID的对比可判断事务对当前数据版本是否可见,不可见则沿着unlog寻找。
    • 在可重复读隔离级别下,ReadView只会在一开始快照读时生成;在读已提交隔离级别下,ReadView会在每次读取时生成。       

诶,等等,锁呢?

咳咳,留到下一篇

写在后面:

诚意满满系列每一篇都是精挑细选,从大众知识点到原理再到具体实现,争取把一个知识点从头到尾完整讲下来,足以应付面试与工作。让读者读完之后能够有一种:“这个知识我看这一篇就够了”的感觉是本系列最大愿望。

对于本人而言,在之前的学习中也发现,八股文讲得细致但不系统,而系统的学习往往又宽泛不细致,所以也打算取长补短,互相结合一下,欢迎大家收藏关注,持续更新。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/745129.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GoLang:云原生时代致力于构建高性能服务器的后端语言

Go语言的介绍 概念 Golang&#xff08;也被称为Go&#xff09;是一种编程语言&#xff0c;由Google于2007年开始设计和开发&#xff0c;并于2009年首次公开发布。Golang是一种静态类型、编译型的语言&#xff0c;旨在提供高效和可靠的软件开发体验。它具有简洁的语法、高效的编…

JS-12-关键字this、apply()、call()

一、对象的方法 在一个对象中绑定函数&#xff0c;称为这个对象的方法。 示例&#xff1a; 1、对象&#xff1a; var xiaoming {name: 小明,birth: 1990 }; 2、给xiaoming绑定一个函数。比如&#xff0c;写个age()方法&#xff0c;返回xiaoming的年龄&#xff1a; var x…

SwiftUI的context Menu

SwiftUI的 context Menu 现在来演示一下如何使用 SwiftUI 的 Context Menu 。 代码&#xff1a; import SwiftUIstruct ContextMenuBootCamp: View {State var bgColor: Color .purplevar body: some View {VStack(alignment: .leading, spacing: 10.0) {Image(systemName: …

LLVM-3.5 —— 01记,编译 LLVM 3.5.0 clang and clang-query

包括编译&#xff1a;clang clang-tools-extra 0, prepare env sudo apt install llvm sudo apt install clang 使用最新的g 会出错。 1, source code $ git clone --recursive $ cd llvm-project $ git checkout llvmorg-3.5.0 $ cp -r ./clang ./llvm/tools/ $ mkdir llv…

冥想与AI:打造定制的放松体验

如今&#xff0c;在浏览网页或社交网络时&#xff0c;您似乎很难对一条条心理健康信息无动于衷。遇到这种情况的可不只是您。当今不断变化的时代给人们平添压力&#xff0c;企业纷纷利用智能技术满足人们的减压需求&#xff0c;让人们的生活多一些平和从容。 冥想就是一种练习呼…

高效Go编程: encoding/csv标准库深度解析

高效Go编程: encoding/csv标准库深度解析 引言了解encoding/csv库CSV文件的基本结构encoding/csv库的核心功能应用场景 读取CSV文件基本步骤代码示例处理不同的分隔符错误处理 处理CSV数据数据解析代码示例处理不规则数据代码示例 写入CSV文件基本步骤代码示例自定义设置错误处…

Vue组件之间的通信方式

文章目录 组件间通信的概念组件间通信的分类组件间通信的方案父组件将方法传递给子组件&#xff08;props&#xff09;子组件向父组件传值(emit)通过 ref 属性获取DOM元素EventBus p a r e n t 或 parent 或 parent或 root a t t r s 与 attrs 与 attrs与 listeners provide 与…

Kotlin编程权威指南学习知识点预览

一、变量、常量和类型&#xff1a; 变量、常量以及 Kotlin 基本数据类型。变量和常量在 应用程序中可用来储值和传递数据。类型则用来描述常量或变量中保存的是什么样的数据。 1、声明变量: // 变量定义关键字 —— 变量名 —— 类型定义 —— 赋值运算符 —— 赋值var na…

cesium wall 扩散墙(动态立体墙效果 Primitive 方法)

cesium wall 扩散墙(动态立体墙效果)以下为源码直接复制可用 1、实现思路 1、此效果运用cesium 中 Primitive 方法,通过传入中心点、半径、顶点数、颜色来进行加载。 2、运用 Math 方法 对传进来的中心点、半径、定点数,来计算个顶点经纬度。 3、通过Primitive 方法中upda…

643.子数组最大平均数

题目&#xff1a;给你一个由 n 个元素组成的整数数组 nums 和一个整数k。 找出平均数最大且长度为 k 的连续子数组&#xff0c;并输出该最大平均数。 任何误差小于10^-5 的答案都将被视为正确答案。 解题思路&#xff1a;规定了子数组的长度为k&#xff0c;因此可以通过寻找子…

洛谷——P1352 没有上司的舞会

题目描述 某大学有 n 个职员&#xff0c;编号为1…n。 他们之间有从属关系&#xff0c;也就是说他们的关系就像一棵以校长为根的树&#xff0c;父结点就是子结点的直接上司。 现在有个周年庆宴会&#xff0c;宴会每邀请来一个职员都会增加一定的快乐指数 ri​&#xff0c;但…

【MySQL】深入解析索引实现原理

文章目录 1、索引介绍2、索引分类2.1、数据结构HashB Tree 2.2、存储方式聚簇索引非聚簇索引 2.3、功能特性主键索引唯一索引普通索引 2.4、字段数量单列索引多列索引 3、最佳实践3.1、索引覆盖3.2、回表操作3.3、最左匹配原则3.4、索引下推 1、索引介绍 对于MySQL数据库来说…

笔试题:小红的循环小数 数论 欧拉 快速幂 小费马定理

小红的循环小数 众所周知&#xff0c;所有的无限循环小数都可以写成分数的形式 小红想让你判断循环节长度为k的无限循环小数的分母是否可能是p。你能帮帮她吗&#xff1f; 共有q次询问。 输入描述 第一行输入一个正整数 q q q&#xff0c;代表询问次数。 接下来的 q q q行&…

Tensorflow笔记(二):常用函数2、激活函数、优化器等、神经网络模型实现(商品销量预测)

import tensorflow as tf import numpy as np from tqdm import tqdm# ----------------------------- tensor常用函数2 ----------------------------------- a tf.constant([1, 2, 3, 1, 2]) b tf.constant([0, 1, 3, 4, 5]) c tf.where(tf.greater(a, b), a, b) # 若a&g…

计算机毕业设计-springboot+vue前后端分离电竞社交平台管理系统部分成果分享

4.5系统结构设计 本系统使用的角色主要有系统管理员、顾客、接单员&#xff0c;本系统为后台管理系统&#xff0c;游客用户可以经过账号注册&#xff0c;管理员审核通过后&#xff0c;用账号密码登录系统&#xff0c;查看后台首页&#xff0c;模块管理&#xff08;顾客信息&am…

mysql重构

力扣题目链接 列转行 SELECT product_id, store1 store, store1 price FROM products WHERE store1 IS NOT NULL UNION SELECT product_id, store2 store, store2 price FROM products WHERE store2 IS NOT NULL UNION SELECT product_id, store3 store, store3 price FROM p…

全栈的自我修养 ———— js中的复制api

通常用于可以禁止用户复制或者在复制的内容后面添加版权信息等 一、代码二、展示1、访问粘贴板的内容2、替换复制内容3、在复制内容的后面添加版权信息4、监听粘贴事件 一、代码 <body><div class"demo">不可以被复制</div><div class"de…

如何从任何文档生成指令数据集以进行LLM微调

使用轻量级库经济地生成高质量的合成数据集 大型语言模型 &#xff08;LLMs&#xff09; 是功能强大的通用工具&#xff0c;但它们通常缺乏特定于领域的知识&#xff0c;这些知识通常存储在企业存储库中。 使用您自己的数据微调自定义LLM可以弥合这一差距&#xff0c;而数据准…

【Shiro反序列化漏洞】Shiro-550反序列化漏洞复现

&#x1f36c; 博主介绍&#x1f468;‍&#x1f393; 博主介绍&#xff1a;大家好&#xff0c;我是 hacker-routing &#xff0c;很高兴认识大家~ ✨主攻领域&#xff1a;【渗透领域】【应急响应】 【Java、PHP】 【VulnHub靶场复现】【面试分析】 &#x1f389;点赞➕评论➕收…

了解下索引的几棵树?

二叉树 二叉搜索树最好的情况性能是O(logn)&#xff0c;最坏情况是O(n) 红黑树 它的时间复杂度是O(logn)&#xff0c;但是在数据量特别大的时候&#xff0c;树会特别高&#xff0c;就会遍历很多层级&#xff0c;对性能影响较大 BTree B树是一种多叉路衡查找树&#xff0c;相对于…