【MySQL精炼宝库】深度解析索引 | 事务

目录

一、索引

1.1 索引(index)概念:

1.2 索引的作用:

1.3 索引的缺点:

1.4 索引的使用场景:

1.5 索引的使用:

1.6 面试题:索引底层的数据结构(核心内容):

1.7 索引列查询(主键 | 非主键)过程:

二、事务

2.1 事务的概念:

2.2 事务操作:

2.3 面试题:事务的基本特性:

2.4 MySQL事务的隔离性:


一、索引

1.1 索引(index)概念:

索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引, 并指定索引的类型,各类索引有各自的数据结构实现。

注意:数组下标,目录,索引这三个是不同的术语,虽然它们的英文都是 index 但是表示的含义各不相同,希望友友们不要混淆。

本文章主要讲解MySQL中的索引及事务。

1.2 索引的作用:

• 数据库中的表、数据、索引之间的关系,类似于书架上的图书、书籍内容和书籍目录的关系。

• 索引所起的作用类似书籍目录,可用于快速定位、检索数据。

• 索引对于提高数据库的性能有很大的帮助。

1.3 索引的缺点:

主要体现在下面两点:

• 索引本身要占据存储空间。

• 索引能提高查询速度,但是可能会拖慢增删改的速度(对数据进行增删改都是要同步更新索引的)。

1.4 索引的使用场景:

要考虑对数据库表的某列或某几列创建索引,需要考虑以下几点:

• 数据量较大,且经常对这些列进行条件查询(索引是用在条件查询的时候)。

• 该数据库表的插入操作,及对这些列的修改操作频率较低。

• 索引会占用额外的磁盘空间。

满足以上条件时,考虑对表中的这些字段创建索引,以提高查询效率。

相反,如果非条件查询列,或经常做插入、修改操作,或磁盘空间不足时,不考虑创建索引。

1.5 索引的使用:

创建主键约束(PRIMARY KEY)、唯一约束(UNIQUE)、外键约束(FOREIGN KEY)时,会自动创建对应列的索引。

例如下图:只需关注画红框的这几个即可,至于如何查看表中的索引,后续马上讲到。

通过sql我们能够创建索引,查看索引,删除索引。 

 • 查看索引

sql脚本语法:

show index from 表名;

案例:查看学生表已有的索引

show index from student;

问题:为什么建立外键约束时,子表中的对应列(外键)为什么也要建立索引? 

解答:在父表中进行删除修改的时候要去子表查询(如果子表有对应外键那么要先修改子表).为了让子表查询的速度加快,所以这里加上了索引。

 • 创建索引

sql脚本语法:

create index 索引名 on 表名(字段名);

案例:创建班级表中,name字段的索引。

create index idx_classes_name on classes(name);

注意1:创建索引都是根据具体的列来创建的,所以后续查询的时候,也必须针对这一列进行条件查询才能够通过索引来提速。

注意2:索引的创建是一个危险操作。如果表中的数据不多,创建索引啥的哪都无所谓。如果表本身很大,这个时候进行创建索引操作,就会引起大量的 CPU / 硬盘 IO 的消耗,也是可能会把数据库给搞挂了的(年终奖也挂了😭)。

那么如果我们因为业务需要就是要加上索引该怎么加呢?

解决办法如下:

(1)另外弄一个机器,也是搭建好一样的数据库服务器。

(2)创建表,建立索引(空表无所谓)。

(3)把旧的数据库的数据,导入到新的数据库中(非常耗时)我们可以慢慢导~控制一下数据传输的速度。

(4)数据导好了,把应用程序的请求切换到新的服务器上。

这样就可以在数据库不会挂的前提把索引加上。

 • 删除索引

sql脚本语法:

drop index 索引名 on 表名;

案例:删除班级表中name字段的索引

drop index idx_classes_name on classes;

注意:删除索引也是一个比较危险的操作,因为会涉及到大量的 IO ,那么就可能会把 mysql 主机弄挂了。

1.6 面试题:索引底层的数据结构(核心内容):

在面试中,mysql 相关的面试题很少出现,如果考 SQL 的话就是考察多表查询,更加常见更加高频的问题是(1)索引:谈谈索引内部的结构是怎么样的。(2)谈谈事务的基本特性。

数据库索引数据结构的最终形态是 B+ 树,B树的升级版。例如下图就是一颗B+树。

这里解释一下为什么不使用二叉搜索树和哈希表。

• 不使用哈希表的原因

哈希表只能查询 key 相等的情况无法进行大于小于的范围查询。

• 不使用二叉搜索树原因

二叉搜索树虽然可以进行范围查询但是要找到中序遍历的下一个后继元素的操作很可能需要向父亲节点进行回溯,才能找到后续。如果通过“线索化”的方式来解决,需要付出更多的存储空间。当元素非常多的时候由于是二叉,树的高度就会比较高,查询的效率就会低,数据库的数据/索引都是存储在硬盘上的,上述的每次比较都需要一次硬盘 IO 操作,是非常耗时的因此,红黑树(二叉搜索树)不太适合于大规模在硬盘上管理数据的场景。

• 使用B树的优点

为了方便叙述下面就是一颗B树。注意:每个方框是一个节点(每个数字代表一个key,一个方框里面可以存储多个数字)。

优点:

1. 每个节点上的 key 也是有序排序的,比较的时候可以直接进行二分查找。

2. B 树会控制(可以自己调整),某个节点上存储的 key 不会太多,如果插入更多的元素,那么节点会分裂出更多的子树出来。

3. 多个数据放在一块连续的存储空间上,在进行比较的时候,一次硬盘 IO 就能读取出整个节点(进行多次比较,实际上只有一次硬盘的 IO)。

• B+树相对于B树的优点

要想理解B+ 树的优点那么至少要知道B+ 树的特点(图在上面给过了)

• B+ 树的特点:

1. N叉搜索树.

2. 每个父节点中的元素都会在子节点中以最大值的方式存在。

3. 叶子节点这一层通过链表连接。

4. 所有节点都会在叶子节点出现。

• B+ 树的优势:

1. 方便查询范围(数据都是在叶子节点,可以直接通过链表找到下一个数据不用回溯)。

2. 查询操作稳定(每次都要查询到叶子节点,稳定本身就是最大的优势)。

3. 数据存储在叶子节点,非叶子节点能够存储在内存。(由于叶子节点是数据的全集,非叶子节点都是重复出现的数据,那么就可以把表中的每一行数据,最终都关联到叶子节点这一层。非叶子节点中只保存一个单纯的 key 值即可,例如(id))。

因为B+ 树的稳定,查询的速度又快,所以我们选择B + 树作为底层的数据结构。 

B+ 树这个结构是一直存在的如果定义了主键,那么就是按照主键来建立,如果没有定义主键,数据库会用自带的隐藏的列建立。

查询一次B+树的时间复杂度为O(以M为底的logN)M为树的度。

1.7 索引列查询(主键 | 非主键)过程:

• 针对索引列进行查询

非叶子节点存储索引对应列的信息。

1. 主键索引:叶子节点存储数据行(全部信息)。

2. 非主键索引:叶子节点存储的是主键的id,找到id后再进行主键的索引(称为“回表”),也就是要查询两次。

• 针对非索引列查询

直接去最底下的叶子节点,遍历链表(直接遍历是最慢的)。

二、事务

在日常开发中,有很多操作不是通过一个 SQL 就能完成的,往往需要多个SQL配合完成,当执行多个SQL操作的时候,如果中间出现了特殊的情况(程序奔溃,系统奔溃,网络断开等)可能会出现前面的 SQL 执行成功,后面的 SQL 执行失败了。例如:转账,钱扣了但是账没有转出去,那么钱就丢了,这是非常严重的问题。因此事务的出现就是为了解决这个问题。

2.1 事务的概念:

事务指逻辑上的一组操作,组成这组操作的各个单元,要么全部成功,要么全部失败。

在不同的环境中,都可以有事务。对应在数据库中,就是数据库事务。

简单来说事务就是把多个操作打包成一个整体,那么就能够包装这个整体要么都执行成功,要么就

一个都不执行,这样就能有效避免,部分执行产生的一些“中间状态引起的问题”。

其实出现问题并非是没有执行,而是事务能够保证当执行到某一条出现问题,数据库能够自动的把前面 sql 造成的影响恢复回去,看起来就好像没有执行过一样。把这里的“翻新”操作称为“回滚”(rollback)。为了实现回滚机制,数据库会在执行事务的时候记录日志。

2.2 事务操作:

为了方便叙述我们先引入测试表:

drop table if exists accout;
create table accout(id int primary key auto_increment,name varchar(20) comment '账户名称',money decimal(11,2) comment '金额'
);
insert into accout(name, money) values
('阿里巴巴', 3000),
('四十大盗', 3000);

操作流程如下:

• 开启事务:start transaction;

• 执行多条SQL语句  

• 回滚或提交:rollback/commit;

说明:rollback即是全部失败,commit即是全部成功。 

具体案例如下:

start transaction;
-- 阿里巴巴账户减少2000
update accout set money=money-2000 where name = '阿里巴巴';
-- 四十大盗账户增加2000
update accout set money=money+2000 where name = '四十大盗';
commit;

 案例演示效果如下:

上面这些都是基本操作,

2.3 面试题:事务的基本特性:

基本特性主要有四个:原子性,一致性,持久性,隔离性。

• 原子性

把多个操作打包成一个整体。

• 一致性

执行事务之前,和执行事务完毕之后,数据是一致的(不会出现 “对不上” 的情况)。

• 持久性

把数据存储在硬盘上(程序重启/主机重启,数据依然能存在)。

• 隔离性

描述的是,数据库并发(多个客户端同时给服务器发起事务)执行事务时,产生的情况。

这个是最难理解的,面试官考你事务的四个核心特征其实就是在考隔离性。

将事务同时处理会出现三个问题:

1. 脏读问题:

描述:事务B读到了事务A中未提交的临时数据(脏数据)。

解决方法:写操作加锁。

2. 不可重复读问题:

描述:事务B读的过程中,又有一个事务C对刚才事务A提交的数据进行了修改,使事务B内部不同的读操作读到的结果不同。

解决方法:读操作加锁。

3. 幻读问题:

描述:和不可重复读类似,事务B读的过程中,事务C没有修改数据内容,而是修改了“结果集”,导致B内部不同的读操作读到的结果集合不同。

解决方法:串行化。

解决上述问题的过程中,要想让数据更准确,就需要牺牲一部分的并发/效率。

2.4 MySQL事务的隔离性:

那么在MySQL 中事务的隔离性具体是如何体现的呢?

MySQL给程序员提供了四个隔离级别。可以在MySQL配置文件中进行设置。具体如下:

到这我们今天要讲解的内容就已经全部讲解完毕了🎉🎉🎉 ,还是希望大家一定要把面试题多看看,这是最重要的部分。

结语:

其实写博客不仅仅是为了教大家,同时这也有利于我巩固知识点,和做一个学习的总结,由于作者水平有限,对文章有任何问题还请指出,非常感谢。如果大家有所收获的话还请不要吝啬你们的点赞收藏和关注,这可以激励我写出更加优秀的文章。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/5428.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

centos学习-精通ls-Linux目录管理的关键命令

精通ls-Linux目录管理的关键命令 一、引言 在Unix和Linux系统中,ls命令是用户最常用的命令之一。它用于列出目录的内容,并提供关于文件和目录的详细信息。本文将详细介绍ls命令的用法、选项、参数以及与其他命令的结合使用。 二、ls命令的基本用法 列…

Laravel breeze vs Jetstream

Introduction Laravel在应用程序中提供了几种身份验证选项,为我们的身份验证层提供了一个健壮而现代的脚手架。Laravel入门工具包就是其中之一,它由breeze和jetstream组成。 Laravel Breeze是快速运行程序的绝佳选择,jetstream提供双因素认…

启发式搜索算法1 - 最佳优先搜索算法

启发式搜索算法有什么优势? 对于复杂问题的盲目搜索,常用广度优先搜索和深度优先搜索这两种盲目搜索算法,极大极小值和Alpha-beta剪枝算法是在盲目搜索过程中,通过剪枝避开一些不可能的结果,从而提高效率。 如果搜索…

leetcode_41.缺失的第一个正数

41. 缺失的第一个正数 题目描述:给你一个未排序的整数数组 nums ,请你找出其中没有出现的最小的正整数。 请你实现时间复杂度为 O(n) 并且只使用常数级别额外空间的解决方案。 示例 1: 输入:nums [1,2,0] 输出:3 解释…

春秋云镜 CVE-2023-50563

靶标介绍: SEMCMS是一套支持多种语言的外贸网站内容管理系统(CMS)。SEMCMS v4.8版本存在SQLI,该漏洞源于SEMCMS_Function.php 中的 AID 参数包含 SQL 注入 开启靶场: 开始实验: 1、使用后台扫描工具&…

ENVI实战—一文搞定遥感图像的计算机解译

人工进行矢量化制图虽然可以达到相应的精度要求,但是在工作量大,内容繁琐,时间成本高,利用计算机帮助我们对各类图像进行解译是目前制图的趋势。 本文基于(ENVI和Arcgis)给出利用遥感图像制作某地土地利用…

分享一份物联网 SAAS 平台架构设计

一、架构图**** 二、Nginx**** 用于做服务的反向代理。 三、网关**** PaaS平台所有服务统一入口,包含token鉴权功能。 四、开放平台**** 对第三方平台开放的服务入口。 五、MQTT**** MQTT用于设备消息通信、内部服务消息通信。 六、Netty**** Socket通信设…

有货源和分销单品爆款玩法课

该课程专注于教授如何利用有货源和分销渠道,打造单品爆款销售策略。学员将学习货源获取、产品定位、市场推广等关键技巧,通过实战案例和实操训练,掌握成功销售单品爆款的方法,提升销售业绩和市场竞争力。 课程大小:6.…

服务器部署开源大模型完整教程 Ollama+Llama3+open-webui

前言 最近大语言模型大火,正好最近打比赛可能会用得上LLMs,今天就在学校的服务器上面进行一次部署。这样之后就可以直接在内网里面使用学校的LLMs了。 介绍 Ollama:一款可以让你在本地快速搭建大模型的工具 官网:https://olla…

JavaScript ES6 全新的Set、Map数据结构

JavaScript ES6 全新的Set、Map数据结构 Map、Set都是ES6新的数据结构, 都是新的内置构造函数, 也就是说typeof的结果, 多了两个: Set 是不能重复的数组, 但不能[某一项来枚举出来] Map 是可以任何东西当做键的对象 set()数据结构 ES6 提供了新的数据结构 Set。…

Visual studio 2019 编程控制CH341A芯片的USB设备

1、硬件 买了个USB可转IIC、或SPI、或UART的设备,主芯片是CH341A 主要说明USB转SPI的应用,绿色跳线帽选择IIC&SPI,用到CS0、SCK、MOSI、MISO这4个引脚 2、软件 2.1、下载CH341A的驱动 点CH341A官网https://www.wch.cn/downloads/CH34…

202012青少年软件编程(Python)等级考试试卷(一级)(2)

第 1 题 【单选题】 执行语句 print(1010.0)的结果为?( ) A :10 B :10.0 C :True D :False 正确答案:C 试题解析: 第 2 题 【单选题】 Turtle 库中, 画笔绘制的速度范围为?( ) A :任意…

快速入门Pandas和NumPy数据分析

大家好,从商业智能到科学研究,数据分析在许多领域中都是一项重要技能。Python因其可读性强和强大的库生态系统而成为最受欢迎的数据分析语言之一,Pandas和NumPy是重要的基础工具,适用于任何想要分析和解释数据的人。本文将探讨如何…

Element-UI快速入门

Element-UI 是一个基于 Vue.js 的高质量 UI 组件库,专为开发者提供了一套完整的解决方案,以便他们能够更加快速、方便地构建出美观、交互性强的网页应用。无论你是前端新手,还是资深开发者,通过 Element-UI,你都能显著…

C++11:shared_ptr循环引用问题

一、shared_ptr的弊端 struct Listnode {int _val;std::shared_ptr<Listnode> _prev;std::shared_ptr<Listnode> _next;Listnode(int val ):_val(val),_prev(nullptr),_next(nullptr){}~Listnode(){cout << "~Listnode()" << endl;} }; in…

翻译《The Old New Thing》 - How do I cover the taskbar with a fullscreen window?

How do I cover the taskbar with a fullscreen window? - The Old New Thing (microsoft.com)https://devblogs.microsoft.com/oldnewthing/20050505-04/?p35703 Raymond Chen 2005年5月5日 如何用全屏窗口覆盖任务栏&#xff1f; 很多时候&#xff0c;人们总是想得太多。…

2012NOIP普及组真题 1. 质因数分解

线上OJ&#xff1a; 一本通&#xff1a;http://ybt.ssoier.cn:8088/problem_show.php?pid1957 核心思想&#xff1a; 1、题中提到&#xff1a;n是两个不同的质数的乘积&#xff0c;求最大的质数。假设 n a ∗ b na*b na∗b&#xff0c;b为最大的质因数&#xff0c;则 a为n最…

Java高级开发者的面试问题及其答案

1. 在Java中&#xff0c;怎样理解并发与并行&#xff1f; 答案&#xff1a; 并发&#xff08;Concurrency&#xff09;和并行&#xff08;Parallelism&#xff09;是多线程编程的两个核心概念&#xff0c;它们在Java中有着重要的应用。 并发指的是多个任务能在重叠的时间段内…

使用 scikit-learn 进行机器学习的基本原理-2

介绍 scikit-learn 估计器对象 每个算法都通过“Estimator”对象在 scikit-learn 中公开。 例如&#xff0c;线性回归是&#xff1a;sklearn.linear_model.LinearRegression 估计器参数&#xff1a;估计器的所有参数都可以在实例化时设置&#xff1a; 拟合数据 让我们用 nump…

springboot整合mqtt实现android推送功能

1、mqtt服务器使用emqx EMQX: The Worlds #1 Open Source Distributed MQTT Broker 2、下载安装 下载地址&#xff1a; Download EMQX 选择系统&#xff0c;版本&#xff0c;安装方法 3、springboot连接mqtt服务方法&#xff1a; 引包&#xff1a; <dependency><…