MySQL索引重要知识点

1.什么是索引?

       索引在项目中是比较常见的,它是帮助MySQL高效获取数据的数据结构,主要是用来提高数据检索的效率,降低数据库的I0成本,同时通过索引列对数据进行排序,降低数据排序的成本,也能降低了CPU的消耗。

2.索引的底层数据结构

       MySQL的默认的存储引擎InnoDB采用的B+树的数据结构来存储索引,选择B+树的主要的原因是:

  • 阶数更多,路径更短:B+树的每个节点可以有更多的子节点(即阶数更高),这意味着树的高度更低,路径更短,从而加快查询速度。
  • 磁盘读写代价更低:B+树的非叶子节点只存储键值和指针,而叶子节点存储实际数据。这样设计的好处是,可以在一个节点中存储更多的键值,减少了磁盘I/O操作,因为查询时大多数操作都发生在非叶子节点上。
  • 便于扫库和区间查询:B+树的叶子节点形成一个双向链表,使范围查询和顺序遍历更加高效。通过遍历叶子节点链表,可以快速访问某个范围内的所有数据。

3.B树与B+树的对比

       B树:

(1)节点存储:

  • 内部节点:存储键值和指向子节点的指针。
  • 叶子节点:存储键值和实际数据。

(2)查询:

  • 可以在任何节点上结束查询,因为所有节点(包括内部节点和叶子节点)都存储实际数据。
  • 查询效率较高,但路径较长时效率可能会降低。

(3)插入和删除:

  • 插入和删除操作需要在树的内部节点和叶子节点上进行调整,这可能会涉及到多次磁盘I/O操作。

B+树:

(1)节点存储:

  • 内部节点:仅存储键值和指向子节点的指针,不存储实际数据。
  • 叶子节点:存储键值和实际数据,并通过链表连接。

(2)查询:

  • 所有查询必须进行到叶子节点才能获取实际数据。
  • 查询路径较长,但每个节点存储更多的键值和指针,减少了树的高度。

(3)插入和删除:

  • 插入和删除操作只会影响叶子节点,不需要调整内部节点,减少了磁盘I/O操作。

B树与B+树的对比总结:

  • 查询效率B+树更稳定:B树可以在内部节点结束查询,而B+树需要进行到叶子节点。因此,B树的某些查询可能更快,但B+树通过更高的阶数和较低的树高来弥补这一点。
  • B+树便于扫库和区间查询:B+树的叶子节点通过链表连接,支持高效的范围查询和顺序访问,B树在这方面效率较低。
  • 插入和删除:B+树的插入和删除操作相对简单,只需要调整叶子节点,而B树可能需要调整多个节点。
  • 磁盘读写代价B+树更低:B+树的内部节点只存储键值和指针,可以减少磁盘I/O操作次数,而B树内部节点存储实际数据和键值,可能增加I/O操作。

4.聚集索引和非聚集索引(二级索引)

  • 聚集索引:聚集索引主要指将数据与索引放到了一块,B+树的叶子节点保存了整行数据。聚集索引必须有,而且只能有一个,因为数据的物理顺序只能有一种,一般情况下是主键作为聚簇索引的。
  • 二级索引:二级索引是将数据与索引分开存储,B+树的叶子节点保存的是对应的主键,二级索引可以存在多个,一般我们自定义的索引是二级索引。

聚集索引选取规则:

  • 如果存在主键,主键索引就是聚集索引。
  • 如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引。
  • 如果表没有主键,或没有合适的唯一索引,则InnoDB会自动生成一个rowid作为隐藏的聚集索引。

5.什么是回表查询?

       回表查询跟聚簇索引和非聚簇索引是有关系的,回表的意思就是通过二级索引找到对应的主键值,然后再通过主键值找到聚集索引中所对应的整行数据,这个过程就是回表。

6.什么是覆盖索引?

       覆盖索引是指select查询语句使用了索引,在返回的列,必须在索引中全部能够找到,如果我们使用id查询,它会直接走聚集索引查询,一次索引扫描,直接返回数据,性能高。

       如果按照二级索引查询数据的时候,返回的列中没有创建索引,有可能会触发回表查询,尽量避免使用select*,尽量在返回的列中都包含添加索引的字段。

7.MySQL超大分页怎么处理?

       超大分页一般都是在数据量比较大时,我们使用了limit分页查询,并且需要对数据进行排序,这个时候效率就很低,我们可以采用覆盖索引和子查询来解决。

       先分页查询数据的id字段,确定了id之后,再用子查询来过滤,只查询这个id列表中的数据就可以,因为查询id的时候,走的覆盖索引,一次索引扫描,直接返回数据,所以效率可以提升很多。

8.索引创建原则

       索引创建原则很多,不过都有一个大前提,就是表中的数据要超过10万以上,我们才会创建索引,并且添加索引的字段是查询比较频繁的字段,一般也是像作为查询条件,排序字段或分组的字段这些。还有就是,我们通常创建索引的时候都是使用复合索引来创建,一条sql的返回值,尽量使用覆盖索引,如果字段的区分度不高的话,我们也会把它放在组合索引后面的字段。如果某一个字段的内容较长,我们会考虑使用前缀索引来使用,当然并不是所有的字段都要添加索引,这个索引的数量也要控制,因为添加索引也会导致新增改的速度变慢。

       原则:

1). 针对于数据量较大,且查询比较频繁的表建立索引。(单表超过十万数据

2). 针对于常作为查询条件(where)、排序(order by)、分组(group by)操作的字段建立索引。

3). 尽量选择区分度高的列作为索引,尽量建立唯一索引,区分度越高,使用索引的效率越高。

4). 如果是字符串类型的字段,字段的长度较长,可以针对于字段的特点,建立前缀索引。

5). 尽量使用联合索引,减少单列索引,查询时,联合索引很多时候使用覆盖索引,节省存储空间,避免回表,提高查询效率。

6). 要控制索引的数量,索引并不是多多益善,索引越多,维护索引结构的代价也就越大,会影响增删改的效率。

7). 如果索引列不能存储NULL值,请在创建表时使用NOT NULL约束它。当优化器知道每列是否包含NULL值时,它可以更好地确定哪个索引最有效地用于查询。

9.什么情况下索引会失效?

       索引失效的场景很多,比如索引在使用的时候没有遵循最左匹配法则,第二个是,糊查询,如果%号在前面也会导致索引失效。如果在添加索引的字段上进行了运算操作或者类型转换也都会导致索引失效。我们之前还遇到过一个就是,如果使用了复合索引,中间使用了范围查询右边的条件索引也会失效;所以,通常情况下,想要判断出这条sql是否有索引失效的情况,可以使用explain执行计划来分析。

       索引失效情况:

  • 违反最左前缀法则。指的是查询从索引的最左前列开始,并且不跳过索引中间的列。
  • 范围查询右边的列,不能使用索引。中间使用了>,<范围查询,右边的列不生效。
  • 不要在索引列上进行运算操作, 索引将失效
  • 字符串不加单引号,造成索引失效。(字符串不加单引号,MySQL的查询优化器,会自动的进行类型转换,造成索引失效。)
  • 以%开头的Like模糊查询,索引失效

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/46824.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java.sql.SQLException: Unknown system variable ‘query_cache_size‘【Pyspark】

1、问题描述 学习SparkSql中&#xff0c;将spark中dataframe数据结构保存为jdbc的格式并提交到本地的mysql中&#xff0c;相关代码见文章末尾。 运行代码时报出相关配置文件错误&#xff0c;如下。 根据该报错&#xff0c;发现网络上多数解决方都是基于java开发的解决方案&a…

uniapp字符串转base64,无需导入依赖(多端支持)

使用示例 import { Base64Encode, Base64Decode } from "@/utils/base64.js" base64.js const _keyStr = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/=";export const Base64Encode = (text)

网络准入控制设备是什么?有哪些?网络准入设备臻品优选

小李&#xff1a;“小张&#xff0c;最近公司网络频繁遭遇外部攻击&#xff0c;我们得加强一下网络安全了。” 小张&#xff1a;“是啊&#xff0c;我听说实施网络准入控制是个不错的选择。但具体什么是网络准入控制设备&#xff1f;我们有哪些选择呢&#xff1f;” 小李微笑…

iredmail服务器安装步骤详解!如何做配置?

iredmail服务器安全性设置指南&#xff1f;怎么升级邮件服务器&#xff1f; iredmail是一个功能强大的邮件服务器解决方案&#xff0c;它集成了多个开源软件&#xff0c;使您能够快速部署和管理邮件服务。AokSend将逐步引导您完成安装过程&#xff0c;无需深入的编程知识即可轻…

AI智能名片在Web 3.0技术栈中的应用与前景研究

摘要&#xff1a;在Web 3.0的浪潮中&#xff0c;AI智能名片作为一种创新的数字工具&#xff0c;正逐步渗透到商业交流的各个层面。本文深入探讨了AI智能名片在Web 3.0技术栈中的具体应用&#xff0c;详细分析了其背后的技术支撑、应用场景、优势以及面临的挑战。通过案例分析、…

A Survey on Multimodal Large Language Models综述

论文题目:A Survey on Multimodal Large Language Models 论文地址:https://arxiv.org/pdf/2306.13549 话题:多模态LLMs综述 MLLMs Paper: https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models 1. 摘要 近期,以GPT-4V为代表的跨模态大型语言模型(MLLM…

Java版【植物大战僵尸+源码】

上期回顾&#xff1a; 今天给大家推荐一个Gtihub开源项目&#xff1a;PythonPlantsVsZombies&#xff0c;翻译成中就是植物大战僵尸。 《植物大战僵尸》是一款极富策略性的小游戏。可怕的僵尸即将入侵&#xff0c;每种僵尸都有不同的特点&#xff0c;例如铁桶僵尸拥有极强的抗…

用 LLM 构建企业专属的用户助手

TL;DR 本文主要介绍了 PingCAP 如何使用大型语言模型&#xff08;Large Language Model&#xff0c;LLM&#xff09;构建一个搭载企业专属知识库的智能客服机器人。除了采用行业内通行的基于知识库的问题解答方法&#xff0c;我们还尝试让模型在“小样本&#xff08;Few-Shot&…

Leetcode 100361100367.切割蛋糕的最小总开销

Medium&#xff1a;动态规划搜索&#xff08;实际就是优化后的dfs&#xff09; class Solution { public: int f[25][25][25][25] {0};int dp(int row1, int col1, int row2, int col2, vector<int>& horizontalCut, vector<int>& verticalCut){if(row1 …

Autosar RTE配置-Assembly和Delegation的使用-基于ETAS软件

文章目录 前言Assembly和Delegation的含义Delegation的使用Assembly的使用总结 前言 RTE中的Compostion内部的SWC之间的连接使用Assembly Connector进行连接。这样的连接一般都是一个SWC的Pport对应另一个SWC的Rport。而Autosar软件中往往不只一个Composition(一般可以以核的数…

Ubuntu的磁盘扩容遇到的问题

1.先用终端上的命令查看磁盘的使用情况 #查看磁盘空间容量的占用情况 $ df -h #查看当前文件夹中&#xff0c;各个文件占用磁盘空间的情况 $ du -sh* 如果容量少的话&#xff0c;需要尽快扩容 2.开机前的扩容 2.1 VMware 扩展磁盘空间 关闭当前客户机&#xff0c;在编辑虚拟…

第三季度加密市场动荡:市场缺乏炒作题材,波动加剧

摘要 根据 Arkham 的数据&#xff0c;德国政府联邦刑事调查局 (BKA) 可能已完成抛售&#xff0c;其持有量从 6 月中旬的约 50,000 BTC&#xff08;35.5 亿美元&#xff09;减少到 7 月 12 日的数据为 0 BTC。市场担忧美国经济在今年晚些时候或 2025 年初陷入衰退&#xff0c;导…

Go Web开发框架之Gin

&#x1f49d;&#x1f49d;&#x1f49d;欢迎莅临我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:「stormsha的主页」…

MATLAB quiver矢量图 设置colorbar

给三维矢量图按照不同高度设置箭头颜色 figure clf X surfaceuz(:,1); Y surfaceuz(:,2); Z surfaceuz(:,3); hold onzcolor jet; % qquiver3(X,Y,Z,X,Y,W) for i 1:length(surfaceuz)quiver3(X(i),Y(i),Z(i),X(i),Y(i), Z(i),...Color,zcolor(floor((Z(i) - -0.1) * 2…

ArgMed-Agents:通过多个智能体论证方案增强大模型,进行可解释的临床决策推理

ArgMed-Agents&#xff1a;通过多个智能体论证方案增强大模型&#xff0c;进行可解释的临床决策推理 提出背景ArgMed-Agents 框架目的解法拆解逻辑链 临床讨论的论证方案&#xff08;ASCD&#xff09;论证方案用于决策&#xff08;ASDM&#xff09;论证方案用于副作用&#xff…

宝塔面板以www用户运行composer

方式一 执行命令时指定www用户 sudo -u www composer update方式二 在网站配置中的composer选项卡中选择配置运行

【堆 优先队列 第k大】2551. 将珠子放入背包中

本文涉及知识点 堆 优先队列 第k大 LeetCode2551. 将珠子放入背包中 你有 k 个背包。给你一个下标从 0 开始的整数数组 weights &#xff0c;其中 weights[i] 是第 i 个珠子的重量。同时给你整数 k 。 请你按照如下规则将所有的珠子放进 k 个背包。 没有背包是空的。 如果第…

汇昌联信电商做拼多多运营如何提高效率?

汇昌联信电商做拼多多运营如何提高效率?在电商领域&#xff0c;效率的高低往往直接关系到企业的成败。拼多多作为国内领先的电商平台之一&#xff0c;吸引了大量商家入驻&#xff0c;竞争异常激烈。对于汇昌联信电商而言&#xff0c;提高在拼多多平台的运营效率&#xff0c;不…

逆向案例二十——请求头参数加密,某政府农机购置与应用补贴申请办理服务系统,sm3和sm4的加密

网址&#xff1a;农机购置与应用补贴申请办理服务系统 抓包分析&#xff0c;发现请求头参数有加密&#xff0c;表单有加密&#xff0c;返回的数据也是加密的。 请求头Source是固定的&#xff0c;其他的Sign,以及Timsestamp是加密的 请求载荷也是加密的 返回的数据也是加密的。…

Qt实现MDI应用程序

本文记录Qt实现MDI应用程序的相关操作实现 目录 1.MDM模式下窗口的显示两种模式 1.1TabbedView 页签化显示 1.2 SubWindowView 子窗体显示 堆叠cascadeSubWindows 平铺tileSubWindows 2.MDM模式实现记录 2.1. 窗体继承自QMainWindow 2.2.增加组件MdiArea 2.3.定义统一…