SQL进阶理论篇(五):什么是Hash索引

文章目录

  • 简介
  • MySQL中的Hash索引
  • 与B+树的区别
  • 总结
  • 参考文献

简介

hash,即哈希,也被称为是散列函数。

Hash在数据库中的应用,可以帮助我们大幅度提升检索数据的效率。

大名鼎鼎的MD5其实就是Hash函数的一种变体。

Hash算法,是通过某种确定性的算法(如MD5、SHA1、SHA2、SHA3)来将输入转换为输出。相同的输入永远会得到相同的输出。

MySQL中的Hash索引

采用Hash进行检索的效率非常高,基本上一次检索就可以找到数据,而B+树需要从上至下依次访问多个节点之后才能找到数据,从效率上来讲,Hash的效率要高于B+树。

Hash索引的示意图如下:

在这里插入图片描述

键值Key通过Hash映射后找到自己的桶bucket。这里的bucket指的是一个能存储一条或者多条记录的存储单位。一个桶可以理解成是一个链表,当遇到Hash冲突的时候(Hash值相同),会在桶里进一步进行键值的查找,从而找到最终的数据行。

什么是Hash冲突呢?

如果桶的数量小于输入的数量,那么势必会出现不同的输入被映射到同一个桶里的情况,这时候就会产生Hash冲突,如果Hash冲突的量很大,就会影响读取的性能。

在简单的应用下,Hash的字节数一般比较少,比如4个字节。多的情况下可以是16位或者是32位。比如说采用MD5函数,就可以得到一个16位或者32位的数值,32位的MD5就已经足够安全了,重复率非常低。

与B+树的区别

  • Hash索引无法进行区间查询,因为Hash索引指向的数据是无序的。B+树可以,是因为B+树的叶子节点是个有序链表。
  • Hash索引不支持联合索引的最左侧原则(其无法使用联合索引的部分索引,要用的话只能全用),而B+树支持。这是因为Hash索引在计算Hash值的时候,是将所有索引键合并后统一计算Hash值,而不会对每个索引键单独计算Hash。
  • Hash索引不支持order by排序,因为其指向的数据是无序的,无法排序优化;
  • Hash索引无法进行模糊匹配,因为即使输入数据有一丁点差异,输出都会千差万别。

对于等值查询来讲,通常Hash索引的效率更高,除非是索引项的重复值过多,即Hash冲突的现象过于严重。这是因为遇到Hash 冲突的时候,就需要遍历桶中的链表来一个一个比较,从而找到待查询的关键字,这个遍历的过程是很耗时的。所以,Hash索引通常不会用到重复值多的列上。比如说性别。

总结

可以看到,Hash索引有着诸多的限制,因此在数据库中,B+树索引的应用面是更加广泛的。但也有一些特殊的场景下,使用Hash索引会更好,比如说键值型数据库中,redis存储的核心就是Hash表。

另外,MySQL的Memory存储引擎也支持Hash存储。而InnoDB引擎也有一个“自适应Hash索引”的功能,就是当某个索引值使用的非常频繁的时候,它会在 B+ 树索引的基础上再创建一个 Hash 索引,这样让 B+ 树也具备了 Hash 索引的优点。

参考文献

  1. 25丨Hash索引的底层原理是什么?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/224092.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

富文本 unpkg.com地址无法访问可替代方案

一、背景: 项目中使用的 wangEditor富文本,使用的地址为:https://unpkg.com ,但无法访问,富文本加载不出来,一直转圈圈 二、解决方案: 2.1、方案一 : 将项目中 https://unpkg.co…

k8s容器部署mysql5.7全流程分享

文章目录 一、前言二、打开dockerhub 看到mysql的版本为 5.7三、K8S 容器编排3.1、编写POD的相关信息3.2、编写mysql的data存储位置3.3、编写mysql的my.cnf的挂载文件3.4、编写mysql的service端口 四、启动并禁用root账户4.1 登录,默认密码1234564.2 配置账户权限 五…

Linux系统编程(二):标准 I/O 库(下)

参考引用 UNIX 环境高级编程 (第3版)嵌入式Linux C应用编程-正点原子 1. 标准 I/O 库简介 标准 I/O 库是指:标准 C 库中用于文件 I/O 操作(如:读、写文件等)相关的一系列库函数的集合 标准 I/O 库函数相关的函数定义都在头文件 &…

【MySQL学习之基础篇】概述

文章目录 1. mysql的启动和停止命令2. 客户端连接3. 数据模型 1. mysql的启动和停止命令 通过指令启动或停止,以管理员身份运行cmd,进入命令行执行如下指令: (1)启动myaql net start mysql(2)…

PyTorch: 基于【VGG16】处理MNIST数据集的图像分类任务【准确率98.9%+】

目录 引言在Conda虚拟环境下安装pytorch步骤一:利用代码自动下载mnist数据集步骤二:搭建基于VGG16的图像分类模型步骤三:训练模型步骤四:测试模型运行结果后续模型的优化和改进建议完整代码结束语 引言 在本博客中,小…

商城后台管理系统--->新闻简报(富文本编辑器,文章,图片上传)

在商城的项目里面需要添加新闻,使用富文本编辑器,我用的是 wangEditor这个编辑器挺好用的,而且也方便简单,官网也是中文的wangEditor 这是做的添加新闻的页面 我用的是SCUI框架,引入的是npm,具体可看官网 npm install wangedit…

nginx配置kibana代理

1、nginx配置 location /kibana/ {proxy_pass http://192.168.0.32:5601;proxy_redirect off;proxy_set_header Host $host;proxy_set_header X-Real-IP $remote_addr;proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;} 2、kibana配置 server.basePath&#xf…

【Docker实战】基于Dockerfile搭建LNMP+wordpress

一、项目背景和要求 公司在实际的生产环境中,需要使用Docker 技术在一台主机上创建LNMP服务并运行Wordpress网站平台。 然后对此服务进行相关的性能调优和管理工作 二、架构: nginx172.111.0.10docker-nginxmysql172.111.0.20docker-mysqlPHP172.111…

C++试卷

_____________ ________ … 一、单项选择题。(每小题2分, 共20分) 1、下列合法的变量名是( C )。 (A)8d (B) 1_2h   (C)_int (D&…

map 和 multimap 存储区别 、取消自动排序 unordered_map

测试代码 std::map<int, CString > Map1;Map1.insert({ 6, L"HN400*200*11*8" });Map1.insert({ 5, L"HN200*200*11*8" });Map1.insert({ 7, L"HN100*200*11*8" });Map1.insert({ 4, L"HN200*200*11*8" });Map1.insert({ 4, L…

【开发工具】最新VMWare无法识别USB设备,驱动错误,未知错误【2023.12.15】

解决方案1&#xff1a;在这里改下连接方式 多试试 解决方案2 控制面板卸载程序&#xff0c;进行VMWare的修复 解决方案3 对于Windows7系统&#xff0c;切换解决方案1的usb类型为3.1&#xff0c;并下载这个intel的驱动包到虚拟机里 https://www.intel.com/content/www/us/en/do…

科目三 换挡为什么要踩离合器

换挡时需要踩离合器为了切断动力传输&#xff0c;让变速器空转&#xff0c;齿轮才会同步&#xff0c;从而轻松挂挡。 在起步时&#xff0c;当车速达到15km/h时&#xff0c;从一挡换到二挡。 当车速达到25km/h时&#xff0c;可以换成三挡&#xff0c; 达到35km/h左右时&#xf…

华南理工C++试卷

诚信应考 , 考试作弊将带来严重后果&#xff01; 《C程序设计试卷》 注意事项&#xff1a;1. 考前请将密封线内填写清楚&#xff1b; 2. 所有答案请答在试卷的答案栏上&#xff1b; 3&#xff0e;考试形式&#xff1a;闭卷 4. 本试卷共 五 大题&#xff0c;满分100分&#xff…

高效电商策略:小红书集成CRM与广告推广无代码化

无代码开发的优势 随着科技的不断进步&#xff0c;无代码开发&#xff08;No-Code Development&#xff09;已经成为快速构建系统和应用的新趋势。无代码开发指的是不需要传统编程知识&#xff0c;通过图形化的用户界面和模型驱动逻辑来创建应用程序。这种方式让非技术背景的用…

金蝶云星空协同开发环境应用内执行SQL脚本

文章目录 金蝶云星空协同开发环境应用内执行SQL脚本 金蝶云星空协同开发环境应用内执行SQL脚本

中文字符串逆序输出

今天碰到这个题&#xff0c;让我逆序输出中文字符串&#xff0c;可给我烦死了&#xff0c;之前没有遇到过&#xff0c;也是查了资料才知道&#xff0c;让我太汗颜了。 英文字符串逆序输出很容易&#xff0c;开辟一块空间用来存放逆序后的字符串&#xff0c;从后往前遍历原字符串…

操作系统笔记——储存系统、文件系统(王道408)

文章目录 前言储存系统地址转换内存扩展覆盖交换 储存器分配——连续分配固定大小分区动态分区分配动态分区分配算法 储存器分配——非连续分配页式管理基本思想地址变换硬件快表&#xff08;TLB&#xff09;多级页表 段式管理段页式管理 虚拟储存器——基于交换的内存扩充技术…

解决Adams许可文件被篡改问题,确保仿真分析的合法性和安全性

在工程仿真领域&#xff0c;Adams软件是一款广泛使用的动力学分析工具。然而&#xff0c;有时用户会遇到Adams许可文件被篡改的问题&#xff0c;这会给仿真工作带来很大的困扰和风险。为了帮助大家解决这一难题&#xff0c;我们推出了一篇关于Adams许可文件被篡改问题的宣传文章…

题目:区间或 (蓝桥OJ 3691)

题目描述: 解题思路: 本题采用位运算.先求出全部数组每一位各自的前缀和,然后再判断区间内每一位区间和是否为0,不为0则乘上相应的2^n并将各个为的2^n相加,得ans. 实现原理图 题解: #include<bits/stdc.h> using namespace std;const int N 1e5 9;int a[N], prefix[35…

线程核绑定

● CPU频率&#xff1a; ○ CPU内部的数字时钟信号频率&#xff0c;又称为时钟频率&#xff0c;并不能代表CPU的真实性能水平。 ○ 由于RC电路的限制&#xff0c;信号的时钟频率不能太大。 ● 超频&#xff1a; ○ 提高硬件的工作频率&#xff0c;让它们在高于其额定的频率状态…