MySQL的hash索引

 MySQL有B+Tree 索引及Hash索引等索引类型,B+Tree索引类型是MySQL采用最多的索引类型。Hash索引使用场景比较有限,文章将从Hash索引的底层结构出发,来分析Hash索引的利与弊。

1 hash数据结构

hash数据结构由键、哈希函数及哈希表组成。

:可以是任何字符串或整数,作为哈希函数的输入。

哈希函数:接收输入键并返回值,该值为哈希表的数组元素的索引。

哈希表:以关联方式将数据存储在数组中,其中每个数据值都有自己的唯一索引。

1.1 为什么需要哈希数据结构

我们可以用数组来存储数据,但是在进行数据检索时,需要一个个检索,时间复杂度为O(n),我们通过哈希数据结构,可以将复杂度缩短为O(1)。

1.2 哈希函数

唯一性

能生成唯一的哈希值。

固定性

生成的哈希值长度是固定的。

不可逆性

一种单向函数,无法从哈希值推导出原始输入。

确定性

给定相同的输入,哈希函数总能生成相同的哈希值。

散列性

输出值看起来是随机的,并且即使输入值只有一点微小的变化,映射出来的哈希值也截然不同。

表 哈希函数的特点

哈希函数主要有以下作用:

  1. 具有极强的错误检测能力,输入有很小的不同,输出将会有很大的不同。
  2. 数据完整性验证,验证数据在传输或存储过程是否被篡改。当数据被传输或存储时,将原始数据进行哈希求值。然后将哈希值与接收到的数据的哈希值比较,如果两个哈希值不同,则说明数据已被篡改。
  3. 密码存储。
  4. 哈希表。

哈希函数性能从以下方面来评价:

  1. 高效可计算。
  2. 均匀地分布键。
  3. 尽量减少碰撞。
  4. 具有较低的负载系数(项目数/表的大小),较高的值会减少空间开销哎,但会增加查找成本。

1.2.1 极简的哈希函数-MOD

哈希值 = 键值 MOD X; 即取键值除以X的余数。X最好是素数,这样可以确保哈希值分布更均匀。

比如有键值:2,5,7,9,11。X取值为7.则对应的哈希值分别为:2,5,0,2,4。

这种函数计算键值速度快,但是X取值需要特别的考虑。

1.3 碰撞

不同的键值可能产生相同的哈希值(比如上面的键值2和9),这种情况称为碰撞。在哈希表中,面对这种情况该如何存储值。有两种方案:1)链接法;2)开放寻址。

1.3.1 链接法

发生碰撞时,在对应的哈希表数组位置建立个链式结构,将值分别插入到链式结构中。

图 链接法示意图

1.3.2 开放寻址

所有原始都存储在哈希表本身中,每个哈希表数组元素包含一条记录或NULL。查找元素时,会逐个检查表槽,直到找到所需的元素或者明确该元素不在表中。

线性探测

  1. 根据哈希函数计算哈希值为k;
  2. 检查hashTable[k]是否为空,为空则直接存储。
  3. 不为空,使用 k= (k+1)%size,检查新k的位置是否为空,为空则直接存储。
  4. 不为空,则重复第3步,直到找到可存储的空间。

二次探测

计算原始哈希值,并添加任意二次多项式的连续值,直到找到空槽。

双重哈希

利用两个函数f1及f2,先用f1计算哈希值,如果位置不为空,则借助f2来计算新的哈希值。 (f1(k) + i * f2(k))%n,其中n表示哈希表大小,k是键值,i是碰撞次数。

表 开放寻址的三种算法

2 MySQL的hash索引

MySQL的hash索引采用的是链式哈希表结构。是基于内存的支持,增删改查的时间复杂度都是O(1)。它只适合等值查找,其他查找时,发挥不了作用。

因为hash结构及其基于内存的缘故,hash索引有以下的缺陷:

  1. 绝对部分数据存放在磁盘,hash索引无法减少磁盘I/O次数,其只适用于小数据量的等值查询。
  2. 不同的键值经过hash计算后,最后的位置非常不确定,没有任何顺序。所以不适合范围、模糊查找及排序。
  3. 一旦哈希表扩容,就会导致所有的索引值重新计算存储位置,效率低。

2.1 自适应哈希索引

看似哈希索引百无一用,但是在MySQL中,有一种哈希索引发挥着关键的作用:自适应哈希索引。

索引根据存储形式分为聚集索引及二级索引。当我们使用二级索引进行查询时,MySQL会根据二级索引查询到的主键值,进行回表查询(即再根据主键值来获取该条数据)。频繁的回表查询将会降低查询效率。

自适应哈希索引,是为了避免频繁回表而创建的。MySQL会判断哪些二级索引值是热查询,为它们建立自适应索引,查询时,根据这个索引直接获取数据,而无需通过主键再获取数据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/239141.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GBASE南大通用数据库GBase JDBC的格式

对于 GBASE南大通用数据库GBase JDBC ,JDBC URL 的格式如下,方括号([, ])里的项是可选的: jdbc:gbase://[host][:port]/[database][?propertyName1][propertyV alue1][&propertyName2][propertyValue2]... 如果没有指定数据库&#xf…

Redis BitMap(位图)

这里是小咸鱼的技术窝(CSDN板块),我又开卷了 之前经手的项目运行了10多年,基于重构,里面有要实现一些诸如签到的需求,以及日历图的展示,可以用将签到信息存到传统的关系型数据库(MyS…

如何无损放大图片?教你三种方法轻松提高画质

如何无损放大图片?如果你在网上找到的素材图片分辨率低且模糊不清,又找不到原图的出处,那么如何无损放大图片呢?以下三个技巧可以帮你解决这个问题。 技巧一:使用专业的图像处理工具 水印云一款专业的图像处理工具可以…

MybatisPlus代码生成器

MybatisPlus代码生成器可以根据设计好数据库表&#xff0c;自动帮助我们完成对应表的controller层&#xff0c;service层&#xff0c;entiy层和mapper层的基础代码&#xff0c;简化开发 1&#xff09;导入依赖 <dependency><groupId>org.apache.velocity</grou…

Flutter本地化(国际化)之App名称

文章目录 Android国际化IOS国际化 Flutter开发的App&#xff0c;如果名称想要跟随着系统的语言自动改变&#xff0c;则必须同时配置Android和IOS原生。 Android国际化 打开android\app\src\main\res\values 创建strings.xml 在values上右键&#xff0c;选择New>Values Res…

6. 行为模式 - 观察者模式

亦称&#xff1a; 事件订阅者、监听者、Event-Subscriber、Listener、Observer 意图 观察者模式是一种行为设计模式&#xff0c; 允许你定义一种订阅机制&#xff0c; 可在对象事件发生时通知多个 “观察” 该对象的其他对象。 问题 假如你有两种类型的对象&#xff1a; ​ 顾…

MyBatis关联查询(三、多对多查询)

MyBatis关联查询&#xff08;三、多对多查询&#xff09; 需求&#xff1a;查询角色及角色赋予的用户信息。 分析&#xff1a;一个用户可以拥有多个角色&#xff0c;一个角色也可以赋予多个用户&#xff0c;用户和角色为双向的一对多关系&#xff0c;多对多关系其实我们看成是…

云闪付支付:一种新型的移动支付方式

随着科技的发展&#xff0c;我们的生活方式也在不断地改变。其中&#xff0c;移动支付已经成为我们生活中不可或缺的一部分。而在这个领域中&#xff0c;云闪付支付无疑是一种新型的、高效便捷的支付方式。那么&#xff0c;云闪付支付究竟是什么&#xff0c;它又有哪些特点呢&a…

华为交换机配置BGP的基本示例

BGP简介 定义 边界网关协议BGP&#xff08;Border Gateway Protocol&#xff09;是一种实现自治系统AS&#xff08;Autonomous System&#xff09;之间的路由可达&#xff0c;并选择最佳路由的距离矢量路由协议。早期发布的三个版本分别是BGP-1&#xff08;RFC1105&#xff0…

树莓派-Pico控制舵机

目录 前言一、SG90舵机是什么&#xff1f;参数介绍工作原理 二、与舵机信号线的接线图三、给树莓派Pico注入灵魂&#xff08;代码&#xff09;总结 前言 这价格便宜的树莓派Pico总觉得应该拿来做点什么&#xff0c;它总不能只用来点亮几个灯就没别的用途了吧&#xff0c;所以就…

一键启动脚本,Karfka,RocketMQ

文章目录 前言KarfkaRocketMQ 前言 服务器上有一些应用&#xff0c;启动步骤比较繁琐&#xff0c;需要依次启动多个服务。服务之间存在依赖关系。例如&#xff1a;必须服务1启动成功才能启动服务2。现将启动服务的步骤写成了sh脚本&#xff0c;大家可以参考这个脚本写一个自己…

Python的内存管理与垃圾回收机制

内存管理 Python的内存管理主要由Python的内存管理器负责。Python的内存管理器会负责为对象分配内存&#xff0c;并在不再需要时将其回收。这种管理方式通常称为“自动内存管理”。 在Python中&#xff0c;当你创建一个对象&#xff08;例如&#xff0c;一个列表或字典&#…

C++ Qt开发:Charts绘图组件概述

Qt 是一个跨平台C图形界面开发库&#xff0c;利用Qt可以快速开发跨平台窗体应用程序&#xff0c;在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置&#xff0c;实现图形化开发极大的方便了开发效率&#xff0c;本章将重点介绍QCharts二维绘图组件的常用方法及灵活运用。 …

Redis 6 性能大揭秘:如何优化缓存命中率?

Redis 6的性能优化&#xff0c;特别是关于如何优化缓存命中率。 这篇文章会包含10个代码示例&#xff0c;帮助深入理解和应用相关的技巧 1、 监控缓存命中率 在优化之前&#xff0c;首先要了解当前的缓存命中率。Redis提供了INFO命令来查看性能指标&#xff0c;包括命中率。…

NVMe介绍

NVMe介绍 1 概述2 操作原理2.1 Queue基本原理2.2 Admin与I/O Queue2.3 Submission与Completion Queue2.4 Submission与Completion Queue对应关系 3 多路径I/O和命名空间共享3.1 1Port1Controller3.2 1Port2Controller3.3 2Port2Controller3.4 SR-IOV 本文属于《 NVMe协议基础系…

Quartz.net 正则表达式触发器

1、创建项目 项目类型控制台应用程序&#xff0c;.Net Framework框架版本 4.7.2 2、引入框架 NuGet\Install-Package Quartz -Version 3.8.0 3、创建Job 自定义Job实现接口IJob&#xff0c;在Execute方法实现定时逻辑&#xff0c; using Quartz; using System; using Sys…

Angular.js 实现带手柄自由调整页面大小的功能

因为目前是处于在angular项目中&#xff0c;所以下面分别一个记录简易的angular.js和在angular项目中使用的版本&#xff0c;仅供大家参考。 Angular.js <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta …

Echarts饼图tooltip渐变色,内部legend百分比保留整数方法

业务场景&#xff1a;1、tooltip的背景需要渐变色&#xff0c;写 html 标签&#xff0c; 2、饼图内部的百分比需要保留整数 &#xff0c;使用formatter&#xff0c; export function genChartPieOption(pieData) {const res {replaceMerge: [series,], // 解决刷新之后y轴丢失…

web前端游戏项目-堆木头游戏【附源码】

web前端游戏项目-堆木头游戏 《堆木头》游戏玩法简单&#xff0c;通过鼠标点击放木头的按钮&#xff0c;叠加在一起&#xff0c;构建出各种结构。游戏适合所有年龄段的孩子&#xff0c;可以锻炼孩子的动手能力和手眼协调能力&#xff0c;激发孩子的创造力和想象力 运行效果 …

一分钟学会“沉浸式翻译”插件的安装与使用

一、安装 安装地址&#xff1a;https://immersivetranslate.com/ 选择对应的浏览器进入安装即可 二、简单的翻译使用方法 第一次安装需要先刷新界面才可以达到翻译效果 核心需要修改的地方在以下三个&#xff1a; 第一处&#xff1a;设置翻译服务&#xff0c;免费版的可以直接…