使用SQL Server分区表功能提高数据库的读写性能

首先祝大家新年快乐,身体健康,万事如意。
一般来说一个系统最先出现瓶颈的点很可能是数据库。比如我们的生产系统并发量很高在跑一段时间后,数据库中某些表的数据量会越来越大。海量的数据会严重影响数据库的读写性能。
这个时候我们会开始优化系统,一般会经过这么几个过程:

  1. 找出SQL慢查询,针对该SQL进行优化,比如改进SQL的写法,查看执行计划对全表扫描的字段建立索引

  2. 引入缓存,把一部分读压力加载到内存中

  3. 读写分离

  4. 引入队列,把并发的请求使其串行化,来减轻系统瞬时压力

  5. 分表/分库

对于第五点优化方案我们来细说一下。分表分库通常有两种拆分维度:1.垂直切分,垂直切分往往跟业务有强相关关系,比如把某个表的某些不常用的字段迁移出去,比如订单的明细数据可以独立成一张表,需要使用的时候才读取 2.水平切分,比如按年份来拆分,把数据库按年或者按某些规则按时间段分成多个表。
拆分表之后每个表的数据量将会变小,带来的好处是不言而喻的。不管是全表扫描,还是索引查询都会有比较高的提升。如果把不同的表文件落在多个磁盘上那数据库的IO性能还能进一步提高。
如果纯手工拆分,比如按年份拆分成多个表,那么上层业务代码也得进行调整。每次读写都得判断该使用哪张表。如果是跨多个年份的分页查询更加难搞。人肉分表基本上不可能实现的,对于上层编码简直是个噩梦。所以针对分表分库我们通常会使用某些中间件,比如Mycat,Sharding-JDBC等中间件。使用这些组件确实能实现分表分库,并且对业务层代码屏蔽了数据库架构的改动,但是配置略显麻烦。如果你使用的是SQL Server数据库,并且目前还不需要分库,只需要分表,那么其实使用内置的分区表功能是最简单的方案。只需要打开SQL Server Management Studio简单设置几下就可以了,对于你上层应用完全是无感的,你的代码、数据库连接串都不需要改动。
以下我们通过2个简单的测试,来简单的演示下如何进行表分区操作,以及测试下分区前后性能变化。

测试写性能

我们的测试方案:新建一张logs表,按年份写入数据。2019年写入1000000数据,2020年也写入100000数据。为了加快写入的速度,每个年份并行10个线程同时写,每个线程写100000数据,一共1000000数据。然后把logs表改成分区表再用同样的方式写入2000000数据。记录耗时 比较两次的耗时。
硬件为一台14年产的笔记本,OS为win10。挂载2块硬盘,1块为5400转的机械硬盘,1块为15年加的SSD。磁盘性能可以说极为垃圾。未分区时表文件会落在机械硬盘上。

未分区情况下测试

使用脚本建表:

CREATE TABLE [dbo].[logs]([id] [uniqueidentifier] NOT NULL,[log_txt] [varchar](200) NULL,[log_time] [datetime] NULL,CONSTRAINT [PK_logs] PRIMARY KEY CLUSTERED
([id] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
)

新建一个控制台程序编写代码:

class Program{static void Main(string[] args){Console.WriteLine("Hello World!");Task.Run(() =>{InsertData(2019);});Task.Run(() =>{InsertData(2020);});Console.ReadLine();}static void InsertData(int year){var tasks = new List<Task>();Stopwatch sw = new Stopwatch();sw.Start();for (int i = 0; i < 10; i++){tasks.Add(Task.Run(()=> {using (var conn = new SqlConnection()){conn.ConnectionString = "Persist Security Info = False; User ID =sa; Password =dev@123; Initial Catalog =fq_test; Server =.\\mssql2016";conn.Open();int index = 0;for (int j = 0; j < 100000; j++){var logtime = new DateTime(year, new Random().Next(1, 12), new Random().Next(1, 28));conn.Execute("insert into logs2 values (newid(),'下订单',@logtime)", new{logtime});Console.WriteLine("logtime:{0} index {1}", logtime, index++);}}}));}Task.WaitAll(tasks.ToArray());sw.Stop();Console.WriteLine("Year {0} complete , total time: {1}.", year, sw.ElapsedMilliseconds);}}

写完2000000数据耗时1369454毫秒。

分区情况下进行测试

开始分区

把一个表设置为分区表大概有5个步骤:

  1. 添加文件组

  2. 在文件组添加文件

  3. 新建分区函数

  4. 新建分区方案

  5. 开始分区

以下演示下如何使用SQL SERVER Management Studio管理器进行表分区:

选中数据库=>属性=>文件组,添加group1,group2两个文件组。

选中数据库=>属性=>文件。添加file1,文件组选group1,路径选择一个文件目录。这里选择E盘data目录。添加file2,文件组选择group2,路径选择一个文件目录。这里选择X盘的data目录。这样当分区的时候数据就会落在这2个目录下。这里的路径可以选择在同一个硬盘,但是为了更高的读写性能,如果有条件建议直接指定在不同的硬盘下。

选中logs表=>存储=>创建分区,启动分区向导工具。

新建一个分区函数,点击下一步。

新建一个分区方案,点击下一步。

选择一个分区列,数据会根据该列进行水平拆分。

这里选择logtime,因为时间是比较适合水平切分的一个维度。

值得数据拆分的范围。

范围选择“右边界”。

右边界跟左边界的差异在于对边界值的处理。

右边界是<,左边界是<=,也就是包含边界值。


我们这里设置group1存储2019的数据,group2存储2020的数据。

所以group1的边界值设置为2020-01-01,group2的边界值设置为2021-01-01 。

设置完是这个样子,需要3个文件组。

当出现不在group1,group2范围内的数据就会存储在第三个文件组内。

建好分区函数、分区方案后,可以选择生成脚本或者立即执行。

这里选择“立即执行”。

当执行完成后,表里的数据会按照分区方案设置的边界分散到多个文件上。

在分区情况下进行测试

先清空logs表所有的数据,然后使用同样的代码进行测试。

测试结果显示写完2000000数据耗时:

568903毫秒。

可以看到数据库写性能大副提高,大概提高了1倍不止的性能。

这也比较符合两块磁盘同时IO的预期。

测试读性能

我们的测试方案:新建一张log2表,使用上面的代码按年份写入2000000数据。然后使用select语句同时读取2019,2020年的数据。把log表转换成分区表,重新测试select的时间。比较两次读取数据的时间。
sql语句:

select * from log2 where (logtime > '2019-05-01' and logtime < '2019-06-01') or (logtime > '2020-05-01' and logtime < '2020-06-01')

首先在未分区的表上测试查询性能,花费时间为3s。

把表按前面的方法进行分区拆分,查询花费时间为1s。

读性能大概为未分区时的3倍。

总结

经过简单的测试,SQL Server的分区表功能能大副提高数据库的读写性能。通过SQL Server Management Stduio的简单设置就可以对数据库表进行分区操作,并且对应用层的代码完全是无感的,比用分表分库中间件来说简单多了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/304756.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

回顾周杰伦17年间的歌词,才知道他都唱了些什么

每当提到周杰伦的歌时&#xff0c;你首先会想到的是什么呢&#xff1f;双截棍&#xff1f;中国风&#xff1f;还是是方文山&#xff1f;或者更会有人回答说&#xff1a;根本听不清的歌词…… 回想起来&#xff0c;周杰伦的歌可以说陪伴了我们一代甚至是几代人的成长。无论是《晴…

最近公共祖先_[LeetCode] 236. 二叉树的最近公共祖先

题目链接&#xff1a; https://leetcode-cn.com/problems/lowest-common-ancestor-of-a-binary-tree难度&#xff1a;中等通过率&#xff1a;57.2%题目描述:给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。百度百科中最近公共祖先的定义为&#xff1a;"对于有根树…

开启事物_《原神》全新角色甘雨登场 「浮生孰来」活动祈愿开启_新闻资讯_最新手游时评_原创手游资讯...

璃月地区的方方面面&#xff0c;都由「璃月七星」治理。由他们决议得出的策略牵动着市场的走向&#xff0c;因此每一条都要慎重再三。而会议之后&#xff0c;是谁摘录出要点&#xff0c;编入长长的条例中的&#xff0c;人们便不得而知了。璃月的千头万绪&#xff0c;就是这样被…

AI浪潮席卷而来,现在加入还来得及吗?

当你的朋友圈刚被 AlphaGo、Master 刷屏&#xff0c;没几天就听说日本有公司开始用 AI 取代员工、百度将人工智能列为未来10年最重要战略。同时一夜之间&#xff0c;似乎所有大公司都开始做无人驾驶…… 人工智能正以前所未有的速度&#xff0c;渗透、改造着各行各业。而加速这…

使用 Benchmark.NET 测试代码性能

今天&#xff0c;我们将研究如何使用Benchmark.Net来测试代码性能。借助基准测试&#xff0c;我们可以创建基准来验证所做的更改是否按预期工作并且不会导致性能下降。并非每个项目都需要进行基准测试&#xff0c;但是如果您正在开发的是NuGet程序包或通用dll&#xff0c;则很有…

【直观理解】一文搞懂RNN(循环神经网络)基础篇

推荐阅读时间8min~15min 主要内容简介&#xff1a;神经网络基础、为什么需要RNN、RNN的具体结构、以及RNN应用和一些结论 1神经网络基础 神经网络可以当做是能够拟合任意函数的黑盒子&#xff0c;只要训练数据足够&#xff0c;给定特定的x&#xff0c;就能得到希望的y&#x…

给新手程序员的16个工作必备小妙招,省下时间去LOL吧!

写在前面&#xff1a; 这个文章核心并不是程序优化的具体技巧&#xff0c;而是拿到一个问题如何思考和利用工具的通用方法。比如即使我们不知道 profiler 这个东西&#xff0c;通过搜索"代码 每一行 时间"也可以很快知道有这样的工具叫做 profiler&#xff0c;并且学…

xftp怎么有root权限_许多人都不懂的Linux系统里的特殊权限!!你真的了解嘛?...

有的朋友一听Linux系统文件还有特殊权限&#xff0c;那头就要爆炸了&#xff0c;那还是接着看看/tmp目录和/usr/bin/passwd文件&#xff0c;怎么回事啊&#xff01;&#xff01;&#xff01;看见没有啊&#xff01;不是应该只有rwx 吗&#xff1f;还有其他的特殊权限( s 跟t )啊…

我是怎样爬下6万共享单车数据并进行分析的(附代码)

共享经济的浪潮席卷着各行各业&#xff0c;而出行行业是这股大潮中的主要分支。如今&#xff0c;在城市中随处可见共享单车的身影&#xff0c;给人们的生活出行带来了便利。相信大家总会遇到这样的窘境&#xff0c;在APP中能看到很多单车&#xff0c;但走到那里的时候&#xff…

使用 Tye 辅助开发 k8s 应用竟如此简单(三)

使用 Tye 辅助开发 k8s 应用竟如此简单&#xff08;一&#xff09;使用 Tye 辅助开发 k8s 应用竟如此简单&#xff08;二&#xff09;续上篇&#xff0c;这篇我们来进一步探索 Tye 更多的使用方法。本篇我们来了解一下如何在 Tye 中如何对数据库进行链接。Newbe.Claptrap 是一个…

mybatis collection标签_一对多的关系,在MyBatis中如何映射?

# 使用collection标签需求&#xff1a;根据用户id查询用户信息的同时获取用户拥有的角色&#xff0c;一个用户可以拥有1个或多个角色。一般情况下&#xff0c;不建议直接修改数据库表对应的实体类。所以这里我们延用之前博客中新建的类SysUserExtend&#xff0c;并添加如下代码…

上传文件白名单_十大常见web漏洞——文件上传漏洞

漏洞介绍在我们浏览网页时&#xff0c;文件上传是非常常见的&#xff0c;比如我们会上传头像、附件、视频等文件&#xff0c;文件上传漏洞通常由于网页代码中的文件上传路径变量过滤不严造成的&#xff0c;如果文件上传功能实现代码没有严格限制用户上传的文件后缀以及文件类型…

Java编程比C编程好吗?《精通Unix下C语言与项目实践》读书笔记(15)

《精通Unix下C语言编程与项目实践》读书笔记(new)文章试读 不拘一个遍程序系列&#xff1a;编程序不能一个脑袋钻到底&#xff0c;有时要学会变通&#xff0c;即所谓的曲线救国。一、二、三、四职场规划&#xff1a;一些杂七杂八的职场感悟吧。不值钱的软件人才 精力充沛与事业…

C# Lambda表达式详解,及Lambda表达式树的创建

每次写博客&#xff0c;第一句话都是这样的&#xff1a;程序员很苦逼&#xff0c;除了会写程序&#xff0c;还得会写博客&#xff01;当然&#xff0c;希望将来的一天&#xff0c;某位老板看到此博客&#xff0c;给你的程序员职工加点薪资吧&#xff01;因为程序员的世界除了苦…

将span隐藏的函数_分类汇总函数Subtotal和Aggregate应用技巧解读

在实际的数据统计分析中&#xff0c;经常会遇到很多复杂的因素&#xff0c;例如&#xff0c;对隐藏的行或计算结果返回错误类型的值不予统计等等……如果此时还用常规的Sum系列、Count系列、Average系列等函数去做数据统计分析&#xff0c;将会是难上加难或者根本无法完成。此时…

粉丝回馈 | 用30天换来了这辈子独一无二的纪念

不知不觉2017年已经临近尾声了&#xff0c;超模君和小木决定趁年末&#xff0c;要给粉丝们一份用心的回馈&#xff0c;感谢这一年来大家对我们的支持与厚爱~ 经过几天几夜的苦思冥想、辗转反侧。。。超模君和小木最终确定了一份超模定制版纪念品&#xff0c;定制版&#xff01;…

地图统计_连吃七八个都不够!太仓不完整包子统计地图来了!

在上班的路上总会顺道买上几个包子&#xff0c;不止是因为方便美味&#xff0c;圆鼓鼓的外型就像个太阳一样能带来满满的能量。这次叔打卡了8家高人气包子店&#xff0c;不知道有没有你经常光顾的那家呢&#xff1f;留言区还抽3位吃货送现金红包哦&#xff01;长春路包子铺?地…

使用 Tye 辅助开发 k8s 应用竟如此简单(四)

使用 Tye 辅助开发 k8s 应用竟如此简单&#xff08;一&#xff09;使用 Tye 辅助开发 k8s 应用竟如此简单&#xff08;二&#xff09;使用 Tye 辅助开发 k8s 应用竟如此简单&#xff08;三&#xff09;续上篇&#xff0c;这篇我们来进一步探索 Tye 更多的使用方法。本篇我们来了…

炸锅了!Google称2029年人类开始实现永生不死!疾病,衰老,痛苦将彻底消失!?

这个世界上最公平的&#xff0c;恐怕就是生老病死了。即使一个人一生的成就再大&#xff0c;财富再多&#xff0c;最终都敌不过自然规律&#xff0c;走向死亡。 然而 谷歌的首席未来科学家Ray kurzweil 却发布了一个惊天消息&#xff1a; 到了2029年&#xff0c; 人类将开始正…