第6/24周 聚集索引

上个星期我向你介绍了堆表(heap tables)。我们说过,在SQL Server表可以是堆表(Heap Table)或者聚集表(Clustered Table)——一个在它上面有聚集索引(Clustered Index)定义的表。今天我们来谈论聚集索引(Clustered Index)的更多细节,还有如何选择正确的聚集键(Clustered Key)。

每次你在SQL Server创建一个主键约束(Primary Key constraint),这个约束(默认情况)是通过唯一聚集索引(Unique Clustered Index)来执行的。这意味着你选择的那列(或多列,当你定义复合主键(composite primary key)时)必须是唯一值。作为一种副作用,你的表数据是按那列(或那些列)物理排序的。让我们一起看下在SQL Server里聚集索引(Clustered Index)的优点和缺点。

优点

聚集表最大的优点是,数据是在你的存储子系统里是按聚集键(Clustered Key)物理排序的。你可以拿传统电话本与聚集表(Clustered Table)做比较:电话本是按姓来聚合排序的,这意味着Aschenbrenner排在Bauer之前,Bauer排在Meyer之前。因此聚集表(Clustered Table)和堆表(heap tables)完全不一样,堆表没有物理上的排序顺序。

你可以从聚集表(Clustered Table)获得真正的巨大受益。想象下你在便利查找一条具体的记录,在WHERE语句里那列是你用来限制你数据的主键(Clustered Key)。在那个情况下,SQL Server在执行计划里会选择聚集索引(Clustered Index Seek)查找运算符。查找运算符会非常,非常高效,因为SQL Server使用B-tree结构来找相关的数据。这个查找运算符的复杂度总是O(log N)。如果你想学习更多关于B+tree在内部是如何使用的,你可以观看我关于这个话题的SQL Server Quickie。在过去的2010年里,我也写了关于这个话题的很多博客帖子。

当你在电话本找名为Aschenbrenner的号码是一样的,你知道那个名只能在电话本的开头部分找到,因为电话本是按这个数据(名)排序的。因此你可以避免整个电话本的扫描,而SQL Server可以避免在叶子节点聚集索引(Clustered Index)的完全扫描。

只要在你的聚集索引(Clustered Index)里没有索引碎片(index fragmentation),当你使用扫描运算符访问聚集索引时,你会使用循序存取(sqquential I/O)。索引碎片(index fragmentation)指的是你在叶节点里的页,逻辑上和物理上的排列顺序是不一样的。你可以通过Index RebuildIndex Reorganized操作来修复索引碎片(index fragmentation)。在第24周,当我们涉及数据库维护时,我们会谈到这2个操作间的区别。

是否有索引碎片取决于你选择的聚集键(Clustered Key)列。只要你使用自增长值(像 INT IDENTIY,或订单日期(OrderDate)列),记录插在聚集索引(Clustered Index)的末端。这意味着在你索引里,碎片不会被引入。因为SQL Server只在你聚集索引(Clustered Index)末端追加数据。但在一些极少的情况下,也会产生索引碎片(index fragmentation)。因此我们现在会谈到聚集索引(Clustered Index)拥有的缺点,还有聚集键(Clustered Key)的错误选择。

缺点

数据只插在聚集索引(Clustered Index)的末端会引入被称为最后页插入加锁竞争(Last Page Insert Latch Contention)的问题,因为在你的聚集索引(Clustered Index)的末端你只有一个热区(hotspot),那里各个查询在遍历(traversing through)B-tree结构时互相竞争。下图演示了这个现象。

Last Page Insert

 

为了克服这个问题,你可以选择随机聚集键(random Clustered Key)作为你的聚集索引(Clustered Index),那样的话,你就可以把插入的数据散步到聚集索引(Clustered Index)里各个不同地方。但是随机聚集键(random Clustered Key)会引入被称为硬页分裂(Hard Page Splits)的问题,因为SQL Server需要把新数据页分配到在聚集索引(Clustered Index)叶子级别之内的一些地方。硬页分裂(Hard Page Splits)同样也有在事务日志(transaction log)性能上的负面影响,因为相比在你聚集索引(Clustered Index)末端记录一个普通的INSERT(被称为软页分裂(Soft Page Splits)),记录一个硬页分裂(Hard Page Splits)需要更多的工作。

作为一个副作用,随机聚集键(random Clustered Key)会引入索引碎片(index fragementation),因为你的逻辑和物理排列顺序已经不再一样。随机存取(random I/O) 会扼杀你在传统的旋转存储的扫描操作性能,因为当读取各个数据页的时候,磁头必须在硬盘的盘片上前后移动。

小结

聚集索引(Clustered Index)伸缩性(scale)很好,因为它内部采用了B-tree数据结构。当在你表进行索引查找(index seek)运算符时,SQL Server可以很高效的利用这个结构。但是选择一个正确并合适的聚集键(Clustered Key)是个很耗时的工作,因为你要考虑每个情况下所有优点和缺点(什么时候用增值型(increasing value),什么时候用随机值型(random value))。

了解聚集索引的更多细节信息,可以看下索引深入浅出:聚集索引的B树结构。

下星期我会谈论SQL Server里非聚集索引(Non-Clustered Indexes)的更多信息。你会学到什么是非聚集索引(Non-Clustered Indexes),还在聚集索引(Clustered Indexe)里定义的聚集键(Clustered Key),非聚集索引(Non-Clustered Indexes)与它有怎样的依赖关系。好好享受接下来的7天,到时候我们会再次见面。

围观PPT:

0602_06_聚集索引.rar

转载于:https://www.cnblogs.com/woodytu/p/4483010.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/419955.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

广西2021普通高考成绩查询,2021广西高考成绩什么时候出

2021广西高考成绩什么时候出2021-04-22 10:39:21文/叶丹2021广西高考成绩公布时间:预计6月23日。预计6月23日对考生开放高考成绩查询通道,并公布录取最低控制分数线。届时考生可查询高考成绩,请考生密切关注广西招生考试院官网、官方微博、官…

vmware安装中标麒麟高级服务器操作系统 V7.0

vmware安装中标麒麟高级服务器操作系统 V7.0 1、下载中标麒麟高级服务器操作系统 V7.0镜像2、安装中标麒麟高级服务器操作系统 V7.02.1、新建虚拟机2.2、安装虚拟机 3、配置中标麒麟高级服务器操作系统 V7.03.1、登录系统3.2、配置静态IP地址 和 dns3.3、查看磁盘分区3.4、查看…

2021年衢州高考的成绩查询,2021年衢州高考状元是谁分数多少分,历年衢州高考状元名单...

2020年衢州一年一度的高考考试已经结束,今年衢州高考状元是谁呢,衢州高考状元出自哪个高中学校,文理科分数是多少分,一起来了解。一、2020年衢州高考状元名单资料2020年衢州高考状元名单和学校相关信息,截至目前发文时…

计算机主机机箱面板指示灯,电脑主机指示灯不亮了是什么原因

公告: 为响应国家净网行动,部分内容已经删除,感谢读者理解。话题:电脑主机指示灯不亮了是什么原因?回答:是指示灯坏了。或者是主机主板出了问题。参考回答:绿灯不亮是电源问题红灯不亮是硬盘或者…

影响中国历史的十篇政治美文

转载于:https://www.cnblogs.com/yymn/p/4488728.html

什么是计算机网络教学反思,《计算机网络实训之常用的网络工具》教学反思

《计算机网络实训之常用的网络工具》教学反思常用的网络工具是网络管理员必须要掌握好的内容,本实验在学习完相关理论知识的基础上,让学生动手实践,亲自试验常用网络工具的使用。因为直观明了,马上见效,学生有了即时体…

用计算机打字英语单词,常用计算机专业英语词汇-前401-500单词

常用计算机专业英语词汇-前401-500单词贡献者:邓鹏类别:中英混合 时间:2020-10-28 16:48:34 收藏数:2 评分:0返回上页举报此文章请选择举报理由:广告/谣言/欺诈政治敏感色情/违法信息垃圾文章其他收藏到我的…

定期定量采购_?采购计划员必备:各种物料采购计划与订单制定的技巧与方法...

采购与供应链全套资料包点击这里领取领取01采购计划管理planl1、制订采购计划的目的采购计划是企业根据市场供求情况、企业的生产经营能力和物料消耗规律等,对计划期内物料和其他物品的采购管理活动所作的预见性安排和部署。采购计划主要是确定采购的数量、时间和方…

angular html清除元素,在Angular js中单击时删除HTML元素

这是我的指示.在身体上显示一个Div.app.directive("autosuggest",function($rootScope) {return {scope: {doneFlag : "",groupFlag : "",inviteesFlag : "",init: &},templateUrl : "title.html",link: function(scope…

科研找到属于自己的思想

转载于:https://www.cnblogs.com/yymn/p/4495400.html

kafka内存不断增加_分布式发布订阅消息系统Kafka 为什么快

Kafka 为什么能那么快 | Kafka高效读写数据的原因无论 kafka 作为 MQ 也好,作为存储层也罢,无非就是两个功能(好简单的样子),一是 Producer 生产的数据存到 broker,二是 Consumer 从 broker 读取数据。那 Kafka 的快也就体现在读写…

前端学习(1477):计算属性文档分析

当数据的逻辑很复杂的时候 下载计算属性中

万能点位图软件_红色网格衣+很多漂亮的花边像素图,绣手帕花边的十字绣图...

下雨天手工——万能像素图十字绣刺绣,珠绣拼豆豆,钩针棒针提花,手工万能图解,点击文字,进入相应文章。【像素图1~100期大合集】【2019像素图大合集】【像素图,人见人爱的用法合集!】【钩针像素毯…

html escape函数,JavaScript中escape()函数的使用方法

导语:我们在传递参数时,为了避免服务器端出现乱码,常常会要用到编码函数,urlencode、HtmlEncode、base64_encode等。本文给大家详细讲解JavaScript中escape()函数的使用方法。在很多脚本语言的应用当中,escape函数是一个可转换编码…

LeetCode House Robber 家庭劫犯(dp)

题意:有一个整数序列,从中挑出一些数字,使得总和是最大,前提是,相邻的两个数字中只能挑其一。比如1 2 3 就只能挑2或者1和3。 思路:很直观的题,dp思想。降低规模,从小规模开始考虑。…

matlab画线不同颜色_怎样画线框图才有意义?

本文由 Jonathan 译自 https://medium.muz.li/how-to-succeed-in-wireframe-design-2ab3cd5c4bc9我们常轻忽身边习以为常的事物,觉得没有必要为一些看似简单又可有可无的东西浪费时间——例如线框图。虽然没必要凡事都寻根问底,但当面对复杂问题时&#…

[转]你所不知道的超级瘦腿运动——空中蹬自行车

转自:http://weibo.com/p/1001603808616690912493?frompage_100505_profile&wvr6&modwenzhangmod 看似平淡无奇,实则大有文章。普通的蹬法1000个也没用,海龟版本的蹬法每天30个就可以修炼出绝世美腿、平坦小腹、并且有效改善X、O型腿…

jenkins是什么_使用 Jenkins 自动发布服务到 Kubernetes

使用 Jenkins 自动发布服务到 KubernetesJenkins 是什么一个比较流行的开源 CI/CD 工具CI/CD : 持续集成/持续部署Kubernetes 是什么容器化工具 -- 一个开源的,用于管理云平台中多个主机上的容器化的应用,Kubernetes的目标是让部署容器化的应用简单并且高…