谈谈对数据库索引的认识

索引的概念

索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。
可以对表中的一列或多列创建索引,并指定索引的类型,各类索引有各自的数据结构实现。



索引的作用

默认情况下,进行条件查询操作,就是遍历表,一条一条数据都带入条件。
引入索引,就是要通过引入其他的数据结构(比如B+树),来加快查询的速度,减少遍历表的可能性



索引的使用场景

对某数据库表的某列或某几列创建索引时,考虑的因素:

  1. 数据量较大,且经常对这些列进行条件查询
  2. 该数据库表的插入操作,及对这些列的修改操作频率较低
  3. 磁盘空间足够,因为创建的索引会占用额外的磁盘空间

当满足以上条件时,可以对表中的这些字段创建索引,以提高查询效率。
反之,如果非条件查询列,或经常做插入、修改操作,或磁盘空间不足时,不考虑创建索引。


索引背后的数据结构

原有的用来查询的数据结构: 二叉搜索树(红黑树),哈希表


哈希表:只能查询key相等的情况,无法进行<(小于),>(大于)这样的范围查询.
原因:经过 hash 函数的映射,原来 key 之间的大小关系,不能反应到计算出来的 hash 值的大小关系,也无法决定下标的大小关系
结论:哈系表不适合作为数据库查询的数据结构


红黑树
(1)红黑树里面的元素是有序的,可以进行范围查询了,但是它在查找某些节点的效率不高
原因:
如下图所示:找左树最右节点的后继 => 即找节点22的后继:节点25
需要往父节点上一系列回溯,才能找到它
注:找右数最左节点的前驱也是一样的
此处可以通过"线索化"的方式来解决,但是要付出更多的存储空间,也是不合适的
在这里插入图片描述

(2)红黑树是二叉搜索树,当元素非常多的时候,就会使树的高度,变的比较高,树的高度越高,进行查询的效率就越低.
原因:
a) 高度每增加一层,比较次数就增加1
b) 数据库的数据/索引都是保存在硬盘上的.上述的每次比较,就都需要一次硬盘IO操作了
结论:红黑树不太适合于大规模在硬盘上管理数据的场景


B+ 树的前身:B 树的诞生

B树,本质上是一个N叉搜索树.
每个节点上可以存储多个元素,延伸出多个子树.
表示同样数量的数据,需要的节点数就少了,对应的树的高度也大大降低了.

B树结构模型如下图:
在这里插入图片描述

B 树的优势:

  1. 每个节点上的这些 key 是有序排列的,比较的时候可以直接二分查找.
  2. B树也会保证让其节点上保存的 key 不会太多,如果插入更多的元素,使 key 变多了,改节点分裂出更多的子树出来
  3. 多个数据,都是放在一块连续的存储空间上,进行比较的时候,一次硬盘IO就能读出整个节点,就可以直接完成上述比较 (进行多次比较,实际上只有一次硬盘IO

注:B 树 也被称为 B- 树

索引数据结构的最终形态:六边形战士 B+ 树 正式登场

B+ 树 是 B 树的升级版,同样的,B+ 树也是 N 叉搜索树

B+ 树结构模型如下图:
在这里插入图片描述
1)按照上述规则来排列数据, 此时叶子节点这一层,就包含了整个数据集合的全集
2)另外, B+树,会把叶子结点通过类似于链表这样的链式结构串起来。此时就可以通过上述链式结构非常方便的遍历整个表中的所有数据,同时也非常方便进行范围查询。比如,查询 id >= 5 and id < 9 此时进行的范围查询就非常简单高效

B+ 树相比于 B 树的优势:

  1. 非常方便进行遍历和范围查询

  2. 当前任何一次查询操作,最终都是要落到叶子节点完成的,所以,查询任何数据,经历的硬盘IO的次数都是一样的。这个时候,查询操作消耗的时间是稳定的;如果是B树的结构, 有的元素,直接在非叶子节点就查到了,IO次数更少,就会出现有些 key 查的快,有些 key 查的不快(IO次数有很大影响) 不稳定

  3. 由于叶子节点,是数据的全集,对应的非叶子节点中,都是重复出现的数据。就可以把表每一行的数据,最终都关联到叶子节点这一层.非叶子节点中只保存一个单纯的 key 值即可
    例子:student(id, name, classId, gender, score)
    此时,比如使用id这一列来做索引.这里B+树的非叶子节点,都只需要保存一个id这样的值就行了.到了叶子节点这里,每个叶子节点不光要保存 id,还要把后续的name, classld等信息也保存起来.


我们看到数据库的"表格"只是一个逻辑上的结构实际上底层的结构,就是这个B+树的结构,就会按照主键的索引的这个B+树的叶子节点来保存每一行的数据。
如果你的表,创建主键了,自然是通过你创建的主键的索引的B+树来组织所有行;如果你没创建主键, mysql其实生成了一个隐藏的主键,按照隐藏主键构造的树来组织。
这样组织之后,非叶子节点占用的空间就比较小(非叶子节点只存id)此时,非叶子节点就可以缓存到内存中(这份数据必然要在硬盘上也保存一份,为了提高查询速度,就可以把这部分结构放到内存中了)这样查询速度又大大提高了(非叶子节点中的比较不再收到硬盘IO的制约了)

注:B+树存在的前提,使用了innodb这个存储引擎,mysql支持多种存储引擎,不同的存储引擎使用的索引的数据结构是不同的.

针对哪个列创建索引,就是针对哪个列构建B+树.
主键索引的B+树,叶子节点是带有数据行的.其他的列的索引,叶子节点,则是主键id
针对非主键列进行索引查询,查到的结果是一个主键id,还需要去主键索引中再做一次查询(称为"回表")

针对索引列进行查询,就是从树根节点往下一层一层的查询
针对非索引列查询,就拿着最底下一层叶子节点,遍历链表就行了.


索引的使用

  • 查看索引
show index from 表名;

示例:查看班级表已有的数据

show index from class;
  • 创建索引
    对于非主键、非唯一约束、非外键的字段,可以创建普通索引
create index 索引名 on 表名(字段名);

示例:创建学生表中学生ID的索引

create index index_student_id on student(student_id);
  • 删除索引
drop index 索引名 on 表名;

示例:删除学生表中学生ID的索引

drop index student_id on student;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/752070.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

企业数据流动安全管理软件(深度解析文章)

企业数据重要性不言而喻&#xff0c;而同时数据的流动和共享也带来了安全风险&#xff0c;如何确保企业数据在流动过程中的安全性&#xff0c;也成为了企业需要面临的重要问题。 企业数据流动安全管理软件的主要功能是监控和管理企业数据的流动过程。 它能够对企业内部的数据…

launchctl及其配置、使用、示例

文章目录 launchctl 是什么Unix / Linux类似的工具有什么哪个更常用配置使用常用子命令示例加载一个 launch agent:卸载一个 launch daemon:列出所有已加载的服务:启动一个服务:停止一个服务:禁用一个服务:启用一个服务: 附com.example.myagent.plist内容有趣的例子参考 launch…

vb.net+zxing.net随机彩色二维码、条形码

需要zxing库支持ZXing.NET Generate QR Code & Barcode in C# Alternatives | IronBarcode 效果图&#xff1a; 思路&#xff1a;先生成1个单位的二维码&#xff0c;然后再通过像素填充颜色&#xff0c;颜色数组要通过洗牌算法 洗牌算法 Dim shuffledCards As New List(…

牛客NC278 删除链表中重复的结点【中等 链表 Java,Go,PHP】

题目 题目链接&#xff1a; https://www.nowcoder.com/practice/fc533c45b73a41b0b44ccba763f866ef 这题有一次面试某团的第一道题 思考 链表的基本操作参考答案Java import java.util.*; /*public class ListNode {int val;ListNode next null;ListNode(int val) {this.v…

【Linux杂货铺】进程的基本概念

目录 &#x1f308;前言&#x1f308; &#x1f4c1;进程的概念 &#x1f4c2;描述进程-PCB &#x1f4c2; 查看进程 &#x1f4c2; 查看正在运行的程序 &#x1f4c2;杀死进程 &#x1f4c2;通过系统调用获取进程标识符 &#x1f4c2;通过系统调用创建进程 &#x1f…

初阶结构体

在这篇文章中我们只讲一些结构体的一些基础的知识&#xff0c;后续会继续补充关于结构体的高阶知识。 1.结构体声明 1.1结构体的基本知识 结构是一些值的集合&#xff0c;这些值称为成员变量。结构的每个成员可以是不同类型的变量。 结构可以用来描述复杂对象&#xff0c;在…

day10-SpringBootWeb案例-1

一、准备工作 1 需求&环境搭建 步骤&#xff1a; 准备数据库表(dept、emp)创建 springboot 工程&#xff0c;引入对应的起步依赖&#xff08;web、mybatis、mysql 驱动、lombok&#xff09;配置文件 application.properties 中引入 mybatis 的配置信息&#xff0c;准备对应…

CI/CD实战-gitlab代码仓库 2

gitlab安装部署 实验虚拟机最小需求&#xff1a;4g内存&#xff0c;4核cpu 下载源&#xff1a;Index of /gitlab-ce/yum/el7/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 安装依赖性&#xff1a; 安装软件&#xff1a; 修改依赖性配置文件 重新自动化配置 登录…

快速排序(数据结构)

1. 前言&#xff1a; 这两种排序经常使用&#xff0c;且在算法题中经常遇见。 这里我们简单分析讨论一下。 1. 快速排序 平均时间复杂度&#xff1a;O&#xff08;nlogn&#xff09; 最坏时间复杂度&#xff1a; O&#xff08;n^2&#xff09; 1.1. 左右向中遍历: 取最右侧4…

HarmonyOS NEXT应用开发—发布图片评论

介绍 本示例将通过发布图片评论场景&#xff0c;介绍如何使用startAbilityForResult接口拉起相机拍照&#xff0c;并获取相机返回的数据。 效果图预览 使用说明 通过startAbilityForResult接口拉起相机&#xff0c;拍照后获取图片地址。 实现思路 创建CommentData类&#…

腾讯云轻量应用服务器2核4G5M代表什么意思?

腾讯云服务器2核4G5M带宽配置是代表什么&#xff1f;代表2核CPU、4G内存、5M公网带宽&#xff0c;这是一款轻量应用服务器&#xff0c;系统盘为60GB SSD云硬盘&#xff0c;活动页面 txybk.com/go/txy 活动打开如下图&#xff1a; 腾讯云2核4G5M服务器 如上图所示&#xff0c;这…

HCIA——TCP协议详解

目录 1、TCP概念及协议头部格式 1.1TCP特点 1.2TCP协议协议头部格式 1.3字段进行介绍 1.3.1源端口和目的端口 1.3.2序号(seq) 1.3.3确认序号(ack) 1.3.4数据偏移 1.3.5标志位 1.3.6窗口 1.3.7校验和 1.3.8紧急指针 2、TCP的可靠性 2.1 TCP可靠性的保障 2.2排序机…

Android Studio实现内容丰富的安卓博客发布平台

获取源码请点击文章末尾QQ名片联系&#xff0c;源码不免费&#xff0c;尊重创作&#xff0c;尊重劳动 项目编号078 1.开发环境android stuido jdk1.8 eclipse mysql tomcat 2.功能介绍 安卓端&#xff1a; 1.注册登录 2.查看博客列表 3.查看博客详情 4.评论博客&#xff0c; 5.…

HBase在表操作--显示中文

启动HBase后&#xff0c;Master和RegionServer两个服务器&#xff0c;分别对应进程为HMaster和HRegionServe。&#xff08;可通过jps查看&#xff09; 1.进入表操作 hbase shell 2.查看当前库中存在的表 list 3.查看表中数据&#xff08;注&#xff1a;学习期间可用&#…

将FastSAM中的TextPrompt迁移到MobileSAM中

本博文简单介绍了SAM、FastSAM与MobileSAM,主要关注于TextPrompt功能的使用。从性能上看MobileSAM是最实用的,但其没有提供TextPrompt功能,故而参考FastSAM中的实现,在MobileSAM中嵌入TextPrompt类。并将TextPrompt能力嵌入到MobileSAM官方项目提供的gradio.py部署代码中,…

【JVM】生产内存占用异常优化 (一)

记录一次 - 内存占用优化 某个导出&#xff0c;导出数据量过大总是导致OOM&#xff0c;但是根据需求&#xff0c;导出数据大小并没有那么大 按照导出数据的查询来看 SELECTg.inventory_code,g.visit_record_code,g.recovery_price AS transactionAmount FROM crm_goods g ...…

小迪安全41WEB 攻防-通用漏洞XMLXXE无回显DTD 实体伪协议代码审计

#知识点&#xff1a; 1、XML&XXE-原理&发现&利用&修复等 2、XML&XXE-黑盒模式下的发现与利用 3、XML&XXE-白盒模式下的审计与利用 4、XML&XXE-无回显&伪协议&产生层面 #思路点&#xff1a; 参考&#xff1a;https://www.cnblo…

Linux 块设备驱动

Linux 三大驱动分别是&#xff1a;字符设备驱动、块设备驱动、网络设备驱动。 块设备是针对存储设备的&#xff0c;比如 SD 卡、EMMC、NAND Flash、Nor Flash、SPI Flash、机械硬盘、固态硬盘等。因此块设备驱动其实就是这些存储设备驱动&#xff0c;块设备驱动相比字符设备驱…

CentOS 7 编译安装 Git

CentOS 7 编译安装 Git 背景来源删除旧版本 Git安装依赖包下载 Git 源代码检验相关依赖&#xff0c;设置安装路径编译安装添加 Git 环境变量重新加载配置文件查看版本号参考文献 背景来源 为什么要安装新版本呢&#xff1f; 因为无聊&#xff0c;哈哈哈&#xff0c;其实也不是…

Linux下进程的调度与切换

&#x1f30e;进程的调度与切换 文章目录&#xff1a; 进程的调度与切换 进程切换 进程调度       活动状态进程队列       位图判断       过期队列 总结 前言&#xff1a; 在Linux操作系统中&#xff0c;进程的调度与切换是操作系统核心功能之一&#xff…