细嗦MySQL三大日志

文章目录

  • 三大日志:binlog(归档日志)、redo log(重做日志)、undo log(回滚日志)
  • redo log
    • 刷盘机制
    • 日志文件组
  • binlog
    • 记录格式
    • 写入机制
  • 两阶段提交
  • undo log
    • 提供回滚操作
    • 提供MVCC(多版本并发控制)

三大日志:binlog(归档日志)、redo log(重做日志)、undo log(回滚日志)

redo log

  • redo log是一个重做日志,是InnoDB引擎独有的,是用于MySQL在挂了之后或者宕机之后恢复数据使用的,保证了数据的持久性和一致性。
  • 在MySQL中数据都是以页为单位的,默认一页16kb,这个参数在配置MySQL的时候可以设置,加载出来的数据页会放入Buffer Pool中,当查询数据的时候会先去Buffer Pool(缓冲池)中查找数据,如果没有,Buffer Pool会从硬盘中加载进来,之后进行修改数据时也是修改的Buffer Pool中的数据,然后将修改的记录记录在redo log buffer(重做日志缓存)中,定期将redo log buffer中的数据同步到redo log中(刷盘机制)。
    在这里插入图片描述

刷盘机制

一般在这几种情况下会进行刷盘:通过innodb_flush_log_at_trx_commit参数进行控制

  • 当事务提交的时候的时候会将redo log buffer中的数据刷新到redo.file文件中。
  • redo log buffer的空间占总容量的一半以上,就需要把这些日志刷新到磁盘中。
  • InnoDB使用了一个事务日志缓冲区(transaction log buffer)来暂时存储事务重做日志,当这个缓冲区满的时候会触发刷盘机制。
  • InnoDB会定期执行检查点操作(Chechpoint),进行刷盘操作,同时将相关重做日志一同刷新。
  • InnoDB 启动了一个后台线程,负责周期性(每隔 1 秒)的刷盘,同时将相关重做日志一同刷新。
  • 正常关闭服务器:MySQL 关闭的时候会进行刷盘。
    在这里插入图片描述
    通过设置参数innodb_flush_log_at_trx_commit 可以有不同的刷盘时机:
  • 设置为0,每次提交事务不进行刷盘操作,这种性能高,但是安全性低,因为这种只能等redo log buffer缓存占一半或InnoDB定期刷盘,如果宕机可能会丢失1S内的事务。
  • 设置为1,每次提交事务都会进行刷盘操作,这种性能低,但是安全性高,因为只要提交事务就会进行刷盘,不会有数据丢失。 如果事务执行期间MySQL挂了或宕机,这部分日志丢了,但是事务并没有提交,所以日志丢了也不会有损失。
  • 设置为2,每次提交事务都只会把redo log buffer 中的内容写到page cache(文件系统缓存),page cache 是专门用来缓存文件的,这里被缓存的文件就是 redo log 文件。这种方式的性能和安全性都介于前两者中间。
  • 刷盘机制innodb_flush_log_at_trx_commit 的默认值为 1,设置为 1 的时候才不会丢失任何数据。为了保证事务的持久性,我们必须将其设置为 1。

日志文件组

硬盘上存储的redo log日志文件不止一个,而是通过一个日志文件组的形式出现的,每一个日志文件的大小相同通过环形拼接而成。
在这里插入图片描述

  • 在日志文件组中还有两个重要属性write pos、checkpoint,相当于头尾指针,write pos 是当前记录的位置,一边写一边后移,checkpoint 是当前要擦除的位置,也是往后推移,每次刷盘记录redo log,write pos位置就会后移,每次MySQL加载日志文件组恢复数据时,会清空加载过得redo log数据,checkpoint就会后移。
  • 如果write pos,后移追上checkpoint,表示日志文件组满了,需要清空一些记录,然后将checkpoint后移。
  • MySQL 8.0.30 及之后的版本中,文件数固定为了32,可以指定innodb_redo_log_capacity的值来设置每个文件的大小,即innodb_redo_log_capacity/32。
    只要每次把修改后的数据页直接刷盘不就好了,还有 redo log 什么事?
    数据页刷盘是随机写,因为一个数据页对应的位置可能在硬盘文件的随机位置,所以性能是很差。如果是写 redo log,一行记录可能就占几十 Byte,只包含表空间号、数据页号、磁盘文件偏移 量、更新值,再加上是顺序写,所以刷盘速度很快。所以用 redo log 形式记录修改内容,性能会远远超过刷数据页的方式,这也让数据库的并发能力更强。

binlog

redo log是物理日志,记录的是在什么数据上做了什么修改,属于InnoDB引擎。binlog属于逻辑日志,主要记录的是原始的逻辑语句,不管什么存储引擎,只要发生了表数据更新操作,都会产生binlog日志,binlog主要用于数据库的备份,主从数据同步,之类的用来保证数据的一致性。

记录格式

binlog日志有三种格式,可以通过binlog_format参数指定。statement row mixed

  • 如果指定statement,binlog中记录的就是sql语句原文,在同步数据的时候会执行sql语句。但是当遇到像记录当前时间的sql,如果是直接执行sql语句的话就会和原数据不一致。
  • 指定为row就不仅仅是记录执行的sql语句,在记录的时候还会包括具体的数据,这样就保证了记录数据的一致性,通常情况下都是指定为row,但是这种格式,需要更大的容量来记录,比较占用空间,恢复与同步数据时会更消耗IO资源,影响执行速度。
  • 指定为mixed是前两种的折中方案,当设置为mixed的时候,binlog中的记录是前两种的混合记录,在记录之前MySQL会先判断这条sql语句是否会引起数据不一致,然后根据判断结果记录相应的格式。

写入机制

binlog写入的过程是,在事务执行过程中,先把日志写到binlog cache中,事务提交的时候再将binlog cache写入到binlog文件中。可以通过binlog_cache_size参数配置binlog cache的大小,如果存储的内容超过这个容量就需要将内容暂时存储在磁盘中。在这里插入图片描述

将数据写入到page cache中是比较快的,只有数据从page cache写入到binlog中才是真正的持久化磁盘的操作。至于这两者的时机,由参数sync_binlog控制,默认是1。

  • 当这个参数为0的时候,每次提交事务都只会将binlog cache中的记录写入page cache,具体什么时候从page cache写入binglog由系统自行判断。虽然性能得到提升,但是机器宕机,page cache里面的 binlog 会丢失。
  • 当参数设置为1的时候,每次提交事务都会将binlog cache中的记录写入page cache并且刷盘到磁盘binlog中。
  • 还有一种方式就是可以设置参数为n,表示每提交n个事务之后进行一次刷盘操作。但是如果机器宕机,就会丢失最近n个事务的binlog日志。

两阶段提交

  • redo log(重做日志)让InnoDB引擎拥有崩溃恢复的能力,binlog(归档日志)保证了MySQL集群架构的数据一致性。虽然都是属于持久化的保证,但是两者的侧重点不同。

  • 在执行更新语句过程中,会记录redo log和binlog两个日志,以基本的事务为单位,redo log在事务执行过程中可以不断写入,而binlog只有在事务提交时候才写入,所以redo log和binlog写入时机不一样。

  • 因为两者的写入时机不一致,所以会出现一些问题。比如当执行某update语句,将一个n从0修改为了1,在事务提交前redo log日志记录了这次操作,而在事务提交后写入binlog时发生了异常。之后恢复数据的时候主库使用redo log恢复数据n=1,而从库使用binlog恢复数据n=0,出现了数据不一致。

为了解决两份日志之间的逻辑一致问题,InnoDB存储引擎使用两阶段提交方案。
原理很简单,将redo log的写入拆成了两个步骤prepare和commit,这就是两阶段提交。

  • 在事务执行过程中redo log写入会先处于prepare状态,当事务提交记录binlog日志时就会将redo log改为commit状态。在宕机恢复数据时会查看redo log日志的状态,如果发现redo log日志处于prepare状态,并且没有对应的binlog日志,就会回滚该事务。
  • 如果redo log在设置commit阶段发生异常,在恢复数据时,虽然redo log是出于prepare状态,但是能通过事务id找到对应的binlog日志,所以就认为事务是完整的,不会发生回滚,直接提交事务恢复数据。

undo log

我们知道如果想要保证事务的原子性,就需要在异常发生时,对已经执行的操作进行回滚,在 MySQL 中,恢复机制是通过 回滚日志(undo log) 实现的,所有事务进行的修改都会先记录到这个回滚日志中,然后再执行相关的操作。如果执行过程中遇到异常的话,我们直接利用 回滚日志 中的信息将数据回滚到修改之前的样子即可!并且,回滚日志会先于数据持久化到磁盘上。这样就保证了即使遇到数据库突然宕机等情况,当用户再次启动数据库的时候,数据库还能够通过查询回滚日志来回滚将之前未完成的事务。

提供回滚操作

在数据修改的时候,不仅记录了redo log,还记录了相对应的undo log,如果因为某些原因导致事务执行失败了,可以借助undo log进行回滚。

undo log 和 redo log 记录物理日志不一样,它是逻辑日志。可以认为当delete一条记录时, undo log中会记录一条对应的insert记录,反之亦然,当update一条记录时,它记录一条对应相反的update记录。

提供MVCC(多版本并发控制)

MVCC,即多版本控制。在MySQL数据库InnoDB存储引擎中,用undo Log来实现多版本并发控制(MVCC)。当读取的某一行被其他事务锁定时,它可以从undo log中分析出该行记录以前的数据版本是怎样的,从而让用户能够读取到当前事务操作之前的数据【快照读】。

快照读: SQL读取的数据是快照版本【可见版本】,也就是历史版本,不用加锁,普通的SELECT就是快照读。

当前读: SQL读取的数据是最新版本(最新版本指的是修改且已经提交的数据)。除了在执行修改语句的时候,需要执行当前读,然后再更新数据之外,select语句也有可能是当前读,比如: select … lock in share mode、select … for update。

在更新数据之前,MySQL会提前生成undo log日志,当事务提交的时候,并不会立即删除undo log,因为后面可能需要进行回滚操作,要执行回滚(rollback)操作时,从缓存中读取数据。undo log日志的删除是通过通过后台purge线程进行回收处理的。

事务A执行update更新操作,在事务没有提交之前,会将旧版本数据备份到对应的undo buffer中,然后再由undo buffer持久化到磁盘中的undo log文件中,之后才会对user进行更新操作,然后持久化到磁盘。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/705215.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

科技云报道:黑马Groq单挑英伟达,AI芯片要变天?

科技云报道原创。 近一周来,大模型领域重磅产品接连推出:OpenAI发布“文字生视频”大模型Sora;Meta发布视频预测大模型 V-JEPA;谷歌发布大模型 Gemini 1.5 Pro,更毫无预兆地发布了开源模型Gemma… 难怪网友们感叹&am…

【Excel PDF 系列】POI + iText 库实现 Excel 转换 PDF

你知道的越多,你不知道的越多 点赞再看,养成习惯 如果您有疑问或者见解,欢迎指教: 企鹅:869192208 文章目录 前言转换前后效果引入 pom 配置代码实现 前言 最近遇到生成 Excel 并转 pdf 的需求,磕磕碰碰总…

stm32——hal库学习笔记(DMA实验)

一、DMA介绍(了解) 二、DMA结构框图介绍(熟悉) 三、DMA相关寄存器介绍(熟悉) 四、DMA相关HAL库驱动介绍(掌握) 五、DMA配置步骤(掌握) 六、编程实战&#xff…

Anaconda和TensorFlow环境搭建!!

Anaconda下载 进入官网下载 https://www.anaconda.com/download 也可以通过清华的映像站下载: https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 我这里下载的是3.4.20版本。下载好就可以安装默认安装就行。 打开Anaconda Prompt修改成国内镜像 conda c…

大概了解一下G1收集器

在上一篇文章中(链接:大概了解一下CMS收集器)我们提到,CMS是一种主要针对旧生代对象进行回收的收集器。与CMS不同,G1号称“全功能的垃圾收集器”,对初生代内存和旧生代内存均进行管理。鉴于此,这…

pyspark分布式部署随机森林算法

前言 分布式算法的文章我早就想写了,但是一直比较忙,没有写,最近一个项目又用到了,就记录一下运用Spark部署机器学习分类算法-随机森林的记录过程,写了一个demo。 基于pyspark的随机森林算法预测客户 本次实验采用的…

成功解决ModuleNotFoundError: No module named ‘cv2’

🔥 成功解决ModuleNotFoundError: No module named ‘cv2’ 🔥 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程 …

中间件-Nginx漏洞整改(限制IP访问隐藏nginx版本信息)

中间件-Nginx漏洞整改(限制IP访问&隐藏nginx版本信息) 一、限制IP访问1.1 配置Nginx的ACL1.2 重载Nginx配置1.3 验证结果 二、隐藏nginx版本信息2.1 打开Nginx配置文件2.2 隐藏Nginx版本信息2.3 保存并重新加载Nginx配置2.4 验证结果2.5 验证隐藏版本…

ubuntu20.04安装和使用 Maldet (Linux Malware Detect)

1、下载 Maldet sudo wget http://www.rfxn.com/downloads/maldetect-current.tar.gz 2、解压Maldet sudo tar -xvf maldetect-current.tar.gz 3、进入到Maldet目录,然后运行安装脚本 sudo ./install.sh 4、安装ClamAV sudo apt-get update sudo apt-get in…

Jenkins 中针对视图分组(11)

一、将没有在视图的项目进行归纳操作; 新增的项目规则,并入到某就一个视图中,但常规是设置一个规则,后续按照规则走,就不用单独设置 1、首先到控制台页面,如果没有视图分组就点击加号新增;已存在…

JavaScript异步编程

回调地狱 回调地狱是一种由于过度使用嵌套回调函数而导致的代码结构不清晰、难以理解和维护的问题。一个典型例子是嵌套多个回调函数,每个回调函数都作为另一个回调函数的参数。这样会导致各个部分之间高度耦合、程序结构混乱、流程难以追踪,每个任务只能…

详解顺序结构滑动窗口处理算法

🎀个人主页: https://zhangxiaoshu.blog.csdn.net 📢欢迎大家:关注🔍点赞👍评论📝收藏⭐️,如有错误敬请指正! 💕未来很长,值得我们全力奔赴更美好的生活&…

性能优化问题思考总结

INP 是什么? Interaction to Next Paint (INP) INP是一项指标,通过观察用户在访问网页期间发生的所有点击、点按和键盘互动的延迟时间,评估网页对用户互动的总体响应情况。 互动是指在同一逻辑用户手势期间触发的一组事件处理脚本。例如&a…

龙蜥OS 尝试

> 尝试一下龙蜥OS,和Centos8应该没什么区别。 阿里云版本龙蜥 https://alinux3.oss-cn-hangzhou.aliyuncs.com/aliyun_3_x64_20G_nocloud_alibase_20230727.vhd Index of /anolis/8.8/isos/GA/x86_64/ (openanolis.cn) 网卡 我在虚拟机上安装完后,…

SpringBoot使用classfinal-maven-plugin插件加密Jar包

jar包加密 1、在启动类的pom.xml中加入classfinal-maven-plugin插件 <build><plugins><plugin><groupId>org.springframework.boot</groupId><artifactId>spring-boot-maven-plugin</artifactId></plugin><plugin><…

算法沉淀——动态规划之子数组、子串系列(上)(leetcode真题剖析)

算法沉淀——动态规划之子数组、子串系列 01.最大子数组和02.环形子数组的最大和03.乘积最大子数组04.乘积为正数的最长子数组长度 01.最大子数组和 题目链接&#xff1a;https://leetcode.cn/problems/maximum-subarray/、 给你一个整数数组 nums &#xff0c;请你找出一个具…

计算机设计大赛 深度学习实现行人重识别 - python opencv yolo Reid

文章目录 0 前言1 课题背景2 效果展示3 行人检测4 行人重识别5 其他工具6 最后 0 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; **基于深度学习的行人重识别算法研究与实现 ** 该项目较为新颖&#xff0c;适合作为竞赛课题方向&#xff0c…

vue3使用elementPlus进行table合并处理

elementPlus中table合并部分列 虚拟数据中公司下有多个客户&#xff0c;公司一样的客户&#xff0c;公司列需要合并&#xff0c;客户如果一样也需要合并进行展示&#xff0c;效果展示 const tableData ref([])自定定义自已想要的数据&#xff0c;一般都是通过接口拿到 //table…

ubuntu+QT+ OpenGL环境搭建和绘图

一&#xff0c;安装OpenGL库 安装OpenGL依赖项&#xff1a;运行sudo apt install libgl1-mesa-glx命令安装OpenGL所需的一些依赖项。 安装OpenGL头文件&#xff1a;运行sudo apt install libgl1-mesa-dev命令来安装OpenGL的头文件。 安装GLUT库&#xff1a;GLUT&#xff08;Ope…

亚马逊巨头都在用的自养号大法,赶快get!

随着时间的推移&#xff0c;越来越多做亚马逊生意的朋友开始意识到自养号的重要性。拥有自养号意味着掌握了一手资源&#xff0c;这种自主性让人感到更安全。高权重的买家号可以享有更多的操作权限&#xff0c;也能获得更好的效果。然而&#xff0c;要想成功地养好自养号并不是…