【MySQL】索引(上)

https://www.wolai.com/curry00/fzTPy3kSsMDEgEcdvo4G5w
https://www.bilibili.com/video/BV1Kr4y1i7ru/?p=69
https://jimhackking.github.io/%E8%BF%90%E7%BB%B4/MySQL%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/#%E7%B4%A2%E5%BC%95

索引是一种用于快速查询和检索数据的数据结构,排序好的数据结构。
优点:加快检索速度;通过创建唯一性索引,可以保证行数据的唯一性;通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗
缺点:创建和维护索引需要耗费时间,本身存储也要耗费一定空间

mysql索引类型

  • 按「数据结构」分类:B+tree索引、Hash索引、Full-text全文索引(是一种通过建立倒排索引,快速匹配文档的方式)、R-tree空间索引(空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少)。
  • 按「物理存储」分类:聚簇索引(主键索引)、二级索引(辅助索引)
    • 二级索引(Secondary Index)就是非聚簇索引,是因为二级索引的叶子节点 存储的数据是主键。也就是说,通过二级索引,可以定位主键的位置。
    • 主键索引就是聚簇索引,叶子节点存储就是数据
  • 按「字段特性」分类:主键索引、唯一索引、普通索引、前缀索引
    注意主键索引不允许为null,不允许相同,唯一索引允许多个null但不能相同,普通索引允许为null也允许相同,前缀索引只适用于字符串类型的数据,前缀索引是对文本的前几个字符创建索引。
  • 按「字段个数」分类:单列索引、联合索引
    建立在单列上的索引称为单列索引,比如主键索引;
    建立在多列上的索引称为联合索引;
    在这里插入图片描述

不同引擎对索引的支持情况
在这里插入图片描述

索引数据结构

哈希表、有序数组、B+树、B树、红黑树,二叉树

  • 哈希表:只适用于等值查询的场景,用这种索引做不了范围查询,必须全表扫描。查询效率高

  • 有序数组:有序数组在等值查询和范围查询场景中的性能就都非常优秀,但是一旦更新数据就得挪动后面的元素,成本太高

  • 二叉搜索树:为了维持 O(log(N)) 的查询复杂度,需要保持这棵树是平衡二叉树。为了做这个保证,更新的时间复杂度也是 O(log(N))。
    二叉树是搜索效率最高的,但是实际上大多数的数据库存储却并不使用二叉树。其原因是,索引不止存在内存中,还要写到磁盘上。你可以想象一下一棵 100 万节点的平衡二叉树,树高 20。一次查询可能需要访问 20 个数据块。

  • B树:在二分查找树的基础上,增加单个节点的数据存储数量,同时增加了树的子节点数,一次计算可以把查找范围缩小更多。
    插入节点过程:中间节点向上分裂,某个分支超过最大节点数了,最中间的节点,加入根节点中去 https://www.cs.usfca.edu/~galles/visualization/BTree.html(可视化演示网站)
    在这里插入图片描述
    在这里插入图片描述

    但是非叶子节点会存放索引数据和业务数据,为了查找对比计算,需要把数据加载到内存以及 CPU 高速缓存中时,都要把索引数据和无关的业务数据全部查出来。如果所对比的节点不是所查的数据,那么这些加载进内存的业务数据就毫无用处,全部抛弃。

  • B+ 树:为了拆分索引数据与业务数据的平衡多叉树。非叶子节点只保存索引数据,叶子节点保存索引数据与业务数据,叶子结点形成双向链表,所有元素都会出现在叶子节点。这样即保证了叶子节点的简约干净,数据量大大减小,又保证了最终能查到对应的业务数。既提高了单次 I/O 数据的有效性,又减少了 I/O 次数,还实现了业务。在这里插入图片描述

  • 红黑树:红黑树就是介于完全不平衡和完全平衡之间的一种二叉树,可以解决二叉树的这个问题(二叉树缺点:顺序插入时,会形成一个链表,查询性能大大降低。大数据量情况下,层级较深,检索速度慢,),通过每个节点有红黑两种颜色、从节点到任意叶子节点会经过相同数量的黑色节点等一系列规则,实现了树的层数最大也只会有两倍的差距,这样既能提高插入和删除的效率,又能让树相对平衡从而有还不错的查询效率。
    从整体上讲,红黑树就是一种中庸之道的二叉树,但是用来当mysql的索引还是有问题,用红黑树存放100万个数据,把树放满,这个树的高度会越变越高和二叉搜索树一样 在这里插入图片描述

1、B树和B+树的区别

  • B+树所有的数据都会出现在叶子节点,B+叶子节点有所有索引的冗余和其对应的数据,非叶子节点没有数据,B树没有冗余,非叶子节点有数据
  • B树检索的过程就相当于对于范围内的每个节点的关键字做二分查找,没到达叶子节点可能检索就结束了,检索B+树最后肯定会查询到底,效率比较稳定
  • B+树叶子节点之间相互之间也构成一个双向链表,B树没有。所以B树进行范围查询需要找到查询的下限,然后进行中序遍历。B+树直接对链表进行遍历就行

2、为什么mysql使用B+树?

  • B+树非叶子节点不放数据只放索引,所以可以存放更多的索引,比B树更矮胖,所以IO次数就比较少
  • B+树有很多冗余节点,所以插入、删除的效率就比较高,而B树删除插入调整很多
  • B+树叶子节点用双向链表相互连接了起来,所以范围查询效率比较高

3、MyISAM和InnoDB引擎中的B+树区别是什么?

  • MyISAM不管是不是主键索引,使用的都是非聚簇索引(叶子节点的data部分放数据记录的地址
  • InnoDB主键索引使用聚簇索引(叶子节点部分就是数据),二级索引则是非聚簇索引

聚簇索引和非聚簇索引

  • 聚簇索引:
    优点:查询速度快,对主键的排序查找和范围查找速度快
    缺点:依赖有序数据,更新代价比较大
  • 非聚簇索引:
    优点:更新代价小
    缺点:依赖有序的数据,可能会二次查询(回表)

1、什么是回表?
如果我用 product_no 二级索引查询商品,如下查询语句:

select * from product where product_no = '0002';

会先检二级索引中的 B+Tree 的索引值(商品编码,product_no),找到对应的叶子节点,然后获取主键值,然后再通过主键索引中的 B+Tree 树查询到对应的叶子节点,然后获取整行数据。这个过程叫「回表」,也就是说要查两个 B+Tree 才能查到数据

2、创建表时,InnoDB 存储引擎会怎么选择索引?

  • 如果有主键,默认会使用主键作为聚簇索引的索引键(key)
  • 如果没有主键,就选择第一个不包含 NULL 值的唯一列作为聚簇索引的索引键(key)
  • 在上面两个都没有的情况下,InnoDB 将自动生成一个隐式自增 id 列作为聚簇索引的索引键(key)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/28149.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI大模型探索之路-实战篇:智能化IT领域搜索引擎之知乎网站数据获取(流程优化)

系列篇章💥 No.文章1AI大模型探索之路-实战篇:智能化IT领域搜索引擎的构建与初步实践2AI大模型探索之路-实战篇:智能化IT领域搜索引擎之GLM-4大模型技术的实践探索3AI大模型探索之路-实战篇:智能化IT领域搜索引擎之知乎网站数据获…

深入解析数据结构之B树:平衡树中的王者

在计算机科学中,数据结构是算法和程序设计的基础。而在众多数据结构中,B树作为一种平衡树,在数据库和文件系统中有着广泛应用。本文将详细介绍B树的概念、特点、操作、优缺点及其应用场景,帮助读者深入理解这一重要的数据结构。 …

linux笔记8--安装软件

文章目录 1. PMS和软件安装的介绍2. 安装、更新、卸载安装更新ubuntu20.04更新镜像源: 卸载 3. 其他发行版4. 安装第三方软件5. 推荐 1. PMS和软件安装的介绍 PMS(package management system的简称):包管理系统 作用:方便用户进行软件安装(也…

窗口信息保存

读取 QSettings settings("MyOrganization", "MyApp"); QString savedText settings.value("lineEditText", "").toString(); _ui->lineEdit->setText(savedText); 写入 QSettings settings("MyOrganiz…

[leetcode 141环形链表]双指针解决环形链表

Problem: 141. 环形链表 文章目录 思路Code 思路 首先想到如果链表为空直接返回false 其次想到用双指针,一个一回走一步,另一个一回走两步 如果是环形,总有一个时刻,两指针会指向同一个节点,而且该结点不能为空(空是快指针遍历完单链表了) Code /*** Definition for singly-li…

【深度学习】解析Vision Transformer (ViT): 从基础到实现与训练

之前介绍: https://qq742971636.blog.csdn.net/article/details/132061304 文章目录 背景实现代码示例解释 训练数据准备模型定义训练和评估总结 Vision Transformer(ViT)是一种基于transformer架构的视觉模型,它最初是由谷歌研究…

blender bpy将顶点颜色转换为UV纹理vertex color to texture

一、关于环境 安装blender的bpy,不需要额外再安装blender软件。在python控制台中直接输入pip install bpy即可。 二、关于代码 本文所给出代码仅为参考,禁止转载和引用,仅供个人学习。 本文所给出的例子是https://download.csdn.net/downl…

【车载开发系列】汽车嵌入式开发常用工具介绍

【车载开发系列】汽车嵌入式开发常用工具介绍 【车载开发系列】汽车嵌入式开发常用工具介绍 【车载开发系列】汽车嵌入式开发常用工具介绍一. ChipON IDE For KungFu32二. ChipON PRO KF32三. GIT四. JLink五. S32DS六. parasoft ctest七. TCANLINPro八. vector Canoe 一. Chip…

【Python入门与进阶】综合练习题:学生成绩管理系统

综合练习题:学生成绩管理系统 题目描述: 请你设计一个简单的学生成绩管理系统,要求能够进行以下操作: 添加学生信息(包括姓名和学号)添加学生的成绩(包括科目和成绩)查询学生的平…

BerkeleyDB练习

代码; #include <db.h> #include <stdio.h>int main() {DB *dbp;db_create(&dbp, NULL, 0);printf("Berkeley DB version: %s\n", db_version(NULL, NULL, NULL));dbp->close(dbp, 0);return 0; } 编译运行

4-异常-log4j配置日志滚动覆盖出现日志丢失问题

4-异常-log4j配置日志打印滚动覆盖出现日志丢失问题(附源码分析) 更多内容欢迎关注我&#xff08;持续更新中&#xff0c;欢迎Star✨&#xff09; Github&#xff1a;CodeZeng1998/Java-Developer-Work-Note 技术公众号&#xff1a;CodeZeng1998&#xff08;纯纯技术文&…

Java学习 - MySQL数据库中 变量 和 流程控制 实例

变量 变量分类 系统变量 全局变量&#xff1a;对于服务器所有的连接有效会话变量&#xff1a;只在当前连接有效 自定义变量 用户变量&#xff1a;只在当前连接有效局部变量&#xff1a;仅在 BEGIN-END 中有效 系统变量 查看所有的系统变量 SHOW GLOBAL|SESSION VARIABLES;查…

决策树算法介绍 - 原理与案例实现

引言 决策树是一种重要的机器学习算法&#xff0c;广泛应用于分类和回归任务中。它的直观性和易解释性使其成为许多实际应用中的首选算法。本文将详细介绍决策树算法的基本原理、构建过程&#xff0c;并通过一个具体的案例实现&#xff0c;帮助读者全面理解这一算法。 决策树…

C#应用程序与数据库的集成几种方法

前言 应用程序集成数据库是许多软件项目的关键方面。无论构建的是Web应用程序、桌面应用程序还是移动应用程序&#xff0c;高效无缝地与数据库集成&#xff0c;对于存储、检索和操作数据都至关重要。本文将介绍数据库与C#应用程序集成的几种方法与使用注意事项。 数据库 开发…

LeetCode热题3.无重复的最长字串

前言: 经过前序的一系列数据结构和算法学习后&#xff0c;开始用leetCode热题练练手。 . - 力扣&#xff08;LeetCode&#xff09; 给定一个字符串 s &#xff0c;请你找出其中不含有重复字符的最长子串的长度。 示例 1: 输入: s "abcabcbb" 输出: 3 解释: 因为…

XGBoost预测及调参过程(+变量重要性)--血友病计数数据

所使用的数据是血友病数据&#xff0c;如有需要&#xff0c;可在主页资源处获取&#xff0c;数据信息如下&#xff1a; 读取数据及数据集区分 数据预处理及区分数据集代码如下&#xff08;详细预处理说明见上篇文章--随机森林&#xff09;&#xff1a; import pandas as pd im…

异常封装类统一后端响应的数据格式

异常封装类 如何统一后端响应的数据格式 1. 背景 后端作为数据的处理和响应&#xff0c;如何才能和前端配合好&#xff0c;能够高效的完成任务&#xff0c;其中一个比较重要的点就是后端返回的数据格式。 没有统一的响应格式&#xff1a; // 第一种&#xff1a; {"dat…

探索开源世界:2024年值得关注的热门开源项目推荐

文章目录 每日一句正能量前言GitCode成立背景如何使用GitCode如何把你现有的项目迁移至 GitCode&#xff1f;热门开源项目推荐actions-poetry - 管理 Python 依赖项的 GitLab CI/CD 工具项目概述技术分析应用场景特点项目地址 Spider - 网络爬虫框架项目简介技术分析应用场景项…

【RabbitMQ】异步消息及Rabbitmq安装

https://blog.csdn.net/weixin_73077810/article/details/133836287 https://www.bilibili.com/video/BV1mN4y1Z7t9/ 同步调用和异步调用 如果我们的业务需要实时得到服务提供方的响应&#xff0c;则应该选择同步通讯&#xff08;同步调用&#xff09;。 如果我们追求更高的效…