MySQL是如何选择索引的?

2.3.5. 索引选择

MySQL是如何选择索引的?

优化器决定了具体某一索引的选择,也就是常说的执行计划。而优化器的选择是基于成本(cost),哪个索引的成本越低,优先使用哪个索引。

SQL 优化器会分析所有可能的执行计划,选择成本最低的执行,这种优化器称之为:CBO(Cost-based Optimizer,基于成本的优化器)。

Cost  = Server Cost + Engine Cost= CPU Cost + IO Cost

CPU Cost 表示计算的开销,比如索引键值的比较、记录值的比较、结果集的排序……这些操作都在 Server 层完成;

IO Cost 表示引擎层 IO 的开销,MySQL 8.0 可以通过区分一张表的数据是否在内存中,分别计算读取内存 IO 开销以及读取磁盘 IO 的开销。

优化器认为一条 SQL 需要创建基于磁盘的临时表,这时的成本是最大的,索引键值的比较、记录之间的比较,其实开销是非常低的,但如果要比较的记录数非常多,则成本会变得非常大。

MySQL索引出错案例分析

索引创建在有限状态上:

B+ 树索引通常要建立在高选择性的字段或字段组合上,如性别、订单 ID、日期等,因为这样每个字段值大多并不相同。像性别这种字段只有男女两种,是低选择性的字段,因此无须在性别字段上创建索引。

在有些低选择性的列上,是有必要创建索引的。比如电商的核心业务表。

在电商业务中会有一个这样的逻辑:会定期扫描支付状态为支付中的订单,然后强制让其关闭,从而释放库存,给其他有需求的买家进行购买。一般仅为已完成、支付中、超时已关闭这几种。绝大部分都是已完成,只有绝少部分因为系统故障原因,会在 15 分钟后还没有完成订单,因此订单状态是存在数据倾斜的。

例如支付状态只有已完成、支付中、超时已关闭三种,有一百万条数据,优化器会认为每个状态占用三分之一数据,使用全表扫描,避免二级索引回表效率会更高。

然而,由于数据倾斜,订单状态为支付中的数据非常少(例如有1万条),这时根据索引的查询效率会更高。

这时可以利用 MySQL 8.0 的直方图功能,创建一个直方图,让优化器知道数据的分布,从而更好地选择执行计划。

建立索引时要注意的事:

  • 经常频繁用作查询条件的字段应酌情考虑为其创建索引。
  • 表的主外键或连表字段,必须建立索引,因为能很大程度提升连表查询的性能。
  • 建立索引的字段,一般值的区分性要足够高,这样才能提高索引的检索效率。
  • 建立索引的字段,值不应该过长,如果较长的字段要建立索引,可以选择前缀索引。
  • 建立联合索引,应当遵循最左前缀原则,将多个字段之间按优先级顺序组合。
  • 经常根据范围取值、排序、分组的字段应建立索引,因为索引有序,能加快排序时间。
  • 对于唯一索引,如果确认不会利用该字段排序,那可以将结构改为Hash结构。
  • 尽量使用联合索引代替单值索引,联合索引比多个单值索引查询效率要高。

同时,还需有些注意点:

  • 值经常会增删改的字段,不合适建立索引,因为每次改变后需维护索引结构。
  • 一个字段存在大量的重复值时,不适合建立索引,比如之前举例的性别字段。
  • 索引不能参与计算,因此经常带函数查询的字段,并不适合建立索引。
  • 建立联合索引时,一定要考虑优先级,查询频率最高的字段应当放首位。
  • 当表的数据较少,不应当建立索引,因为数据量不大时,维护索引反而开销更大。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/12733.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python操作鼠标键盘和爬虫

一.pyautogui 库 pyautogui 是一个 Python 库,允许控制鼠标和键盘。可以通过它编写 Python 脚本来自动执行各种任务,例如点击按钮、输入文本、移动鼠标等。这个库非常适合用来编写自动化脚本来完成重复性的工作,比如网页表单填写、屏幕截图、…

STC8增强型单片机开发——定时器Timer

一、定时器 定时器是一种计时装置,通常由一个晶体振荡器提供时钟信号,可以计时一定的时间后执行相应的操作。在单片机中,定时器一般是由计数器和时钟源组成的,可以用来产生一定时间间隔的中断信号,或者用于测量输入信号…

开放式运动耳机哪款好用?五款高性能值得信赖产品推荐

身为户外运动的达人,我发现开放式运动耳机简直是咱们运动时的最佳拍档,不管是跑步还是健身,开放式运动耳机最为舒适,它的妙处就在于不用塞进耳朵,这样既安全又卫生,户外动起来更放心。但市面上好坏参半&…

AIGC行业:探索发展风口,把握市场脉搏

AIGC行业现在适合进入吗 简介: AIGC行业:探索发展风口,把握市场脉搏 随着人工智能技术的快速发展,AIGC(人工智能生成内容)行业正逐渐成为科技界的新宠。在当前的时代背景下,我们不禁要问&…

Chisel中对对<: 和:的理解(其实是Scala中的理解)

在 Scala 语言和 Chisel 硬件构造语言中&#xff0c;<: 和 : 是用于类型注解的两个不同的符号&#xff0c;它们在泛型编程和类型系统中扮演重要角色。下面是它们各自的意义和用途&#xff1a; <:&#xff08;子类型关系&#xff09; <: 符号在 Scala 中表示子类型关…

Nginx详细介绍一

Nginx是一个高性能的HTTP和反向代理服务器&#xff0c;它也可以作为邮件服务器使用。 Nginx基本介绍 基本概念&#xff1a; Nginx可以处理大量的并发连接&#xff0c;具有很高的稳定性和低资源消耗的特点。它主要用于Web服务、反向代理、负载均衡和HTTP缓存等场景。 安装与配…

【半夜学习MySQL】内置函数(含日期、字符串、数学等函数常用用法介绍及示例详解)

&#x1f3e0;关于专栏&#xff1a;半夜学习MySQL专栏用于记录MySQL数据相关内容。 &#x1f3af;每天努力一点点&#xff0c;技术变化看得见 文章目录 日期函数字符串函数数学函数其他函数 日期函数 函数名称描述current_date()当前日期current_time()当前时间current_time()…

php8.2使用laravel V11.0

报错&#xff1a;You must enable the openssl extension in your php.ini to load information from https://mirrors.aliyun.com/composer 1、搜索&#xff1a;extension_dir去掉;号 2、搜索&#xff1a;extensionopenssl去掉;号

幻兽帕鲁Palworld服务器手动部署

目录 帕鲁官方文档手动安装steamcmd通过steamcmd安装帕鲁后端客户端连接附录&#xff1a;PalServer.sh的启动项附录&#xff1a;配置文件 帕鲁官方文档 https://tech.palworldgame.com/ 手动安装steamcmd 创建steam用户 sudo useradd -m steam sudo passwd steam下载steamc…

你写HTML的时候,会注重语义化吗?

其实说到语义化&#xff0c;多年前端开发经验的老手估计也不会太在意&#xff0c;有时候工期太紧&#xff0c;有时候自己疏忽&#xff0c;也就不那么在意了&#xff0c;直接DIVCSS一把梭下去了。 目录 什么是HTML 什么是HTML语义化 HTML语义化所带来的好处 我把CSS样式引入…

_pickle.UnpicklingError: STACK_GLOBAL requires str

导致这个报错的原因是我跑yolo的时候修改数据集了&#xff0c;里面的label.cache没有删除&#xff0c;咱只要删除掉缓存就行&#xff01;&#xff01; 我这里是已经删除掉了&#xff0c;所以图片里面没有&#xff0c;一般就是在箭头所示位置有.cache文件的

Vue3知识总结-4

Vue3知识总结-4 文章目录 Vue3知识总结-4插槽Slots渲染作用域默认内容具名插槽插槽中的数据传递具名插槽传递数据 组件声明周期声明周期示意图 组件生命周期的应用动态组件组件保持存活组件被卸载 异步组件依赖注入 插槽Slots 在某些场景中&#xff0c;可能想要为子组件传递一…

xxljob分片广播+多线程实现高效定时同步elasticsearch索引库

需求&#xff1a;为了利用elasticsearch实现高效搜索&#xff0c;需要将mysql中的数据查出来&#xff0c;再定时同步到es里&#xff0c;同时在同步过程中通过分片广播多线程提高同步数据的效率。 1. 添加映射 使用kibana添加映射 PUT /app_info_article {"mappings&quo…

HL7协议

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 1.介绍2.传输协议规范2.1. MLLP2.1.1. 数据头定义2.1.2. 转义字符集 2.2. 规范说明2.3. 消息格式说明 3.HL7结构介绍3.1. 患者建档&#xff08;ADT^A28&#xff09;…

linux c++获取当前程序的运行路径

比如我的程序名为:aaa 存放路径是:/homo/code/ 我在/home/ccc 目录执行shell文件。shell文件的内容为 #!/bin/bash /homo/code/aaa我希望获取的路径是 /homo/code/ 而不是脚本的路径 给出完整接口代码 #include <iostream> #include <string> #include <stri…

人工智能领域向量化技术加速多模态大模型训练与应用

目录 前言1、TextIn文档解析技术1.1、文档解析技术1.2、目前存在的问题1.2.1、不规则的文档信息示例 1.3、合合信息的文档解析1.3.1、合合信息的TextIn文档解析技术架构1.3.2、版面分析关键技术 Layout-engine1.3.3、文档树提取关键技术 Catalog-engine1.3.4、双栏1.3.5、非对称…

matlab实现马尔科夫链

在MATLAB中实现马尔科夫链算法通常涉及定义状态转移矩阵、初始化状态向量以及迭代状态转移过程。以下是一个简单的步骤和示例代码&#xff0c;用于演示如何在MATLAB中实现马尔科夫链。 步骤 定义状态转移矩阵&#xff1a;状态转移矩阵P描述了从一个状态转移到另一个状态的概率…

注册海外公司为什么?

注册海外公司通常是为了实现以下目标之一&#xff1a; 国际化业务扩张&#xff1a; 一些企业可能希望在海外注册子公司&#xff0c;以便在国际市场上开展业务。这样的公司可能是跨国企业&#xff0c;已经在多个国家有业务&#xff0c;或者是希望进入新的国际市场的企业。 税收…

计算机服务器中了locked勒索病毒怎么解决,locked勒索病毒解密恢复工具

在网络技术飞速发展的时代&#xff0c;通过网络开展各项工作业务成为众多企业的首选&#xff0c;网络也为企业的生产运营提供了极大便利&#xff0c;大大提升了企业办公效率&#xff0c;但是利用网络避免不了网络威胁的存在&#xff0c;数据安全问题一直是企业关心的主要话题。…

不知道代理IP怎么挑?一文带你了解挑选的关键点!

IP代理在如今的网络环境中扮演者至关重要的角色。通过使用代理IP&#xff0c;可以增强用户个人信息和网络的安全。但想要挑选到适合自己的代理IP&#xff0c;并非是一件易事。今天就为大家带来挑选代理IP的关键注意点&#xff0c;帮你轻松筛选出最佳的选择。 稳定性与速度&…