【分库分表篇】分区和分表的区别

在这里插入图片描述

分区和分表的区别

✔️ 解析
✔️拓展知识仓
- ✔️分区的方式
- ✔️MySQL 数据库支持的分区类型为水平分区

✔️ 解析

数据库中数据量过多，表太大的时候，不仅可以做分库分表，还可以做表分区，分区和分表类似，都是按照一定的规则将一张大表进行分解。

听上去好像也差不多，不就是将表拆分吗? 那具体有什么差别呢?

主要是分区和分表后数据的数据存储方式有变化。

在Innodb中 (8.0之前)，表存储主要依赖两个文件，分别是.frm文件和ibd文件。.frm文件用于存储表结构定义信息，而.ibd文件则用于存储表数据。

假如我们有一张users表，想要对他进行分区和分表，区别如下：

MySQL InnoDB存储引擎在分区表时，会将每一个分区分别存放在一个单独的 .ibd 文件中，所有的 .ibd 文件组合构成表的物理结构，即 Table Space。

对于上面分区的 users表，存储时会在 MySQL的 data 目录下创建一个用户名+表名+分区名.ibd 的文件(如: users_p1.ibd) ，用来存储 users 表中第一个分区的数据，同样会有 users_p2.ibd 和users_p3.ibd 来存储第二和第二个分区的数据：

users_p1.ibd
users_p2.ibd
users_p3.ibd
users p4.ibd
users .frm

MySQL InnoDB存储引擎在分表时，会将每一个分表分别存放在一个单独的 .frm 文件中，所有的 .frm 文件组合构成表的逻辑结构，即 Table Definition。

对于上面分表的users表，存储时会在 MySQL的data目录下创建后缀名为“users_1.frm”的表格文件，存储users 表中第一个分表的数据，同样会有 users_2.frm 和 users_3.frm 来存储第二和第=分表的数据:

users_1.ibd
users_1.frm
users_2.ibd
users_2.frm
users_3.ibd
users_3.frm
users_4.ibd
users_4.frm

在做了分区后，表面是还是只有一张表，只不过数据保存在不同的位置上了 (同一个.frm文件)，在做数据读取的时候操作的表名还是users表，数据库会自己去组织各个分区的数据。

而在做了分表之后，不管是表面上，还是实际上，都已经是不同的表了 (多个.frm文件)，数据库操作的时候，需要去指定具体的表名。

一般来说，数据量变大时，我们应该先考虑分区，分区搞不定再考虑分表。

因为分表可以在分区的基础上，进一步减少查询时的系统开销。因为分表后，单表数据量小，页缓存率更高，I/O读写性能更优，另外分表也能降低了锁带来的阻塞，也可以提高事务处理效率。还有就是小的表可以提升备份和恢复的速度，并且是有更好的横向扩展件。

✔️拓展知识仓

✔️分区的方式

表分区的方式有水平分区、垂直分区:

1 . 水平分区 : 将表根据行进行划分，即把一个表的数据划分成多个表的数据，每个表形成一个分区，这些细分出来的部分存放在多个不同的分区表中(比如按年份等)。每块数据都存放在不同的表中，可以显著提高操作的效率。

2 . 垂直分区 : 将表根据表字段进行划分，将表中的列(或字段)分割成多个数据表，用于存储不同的业务场景内的数据。使分区后的数据表垂直分离，可以有效减少数据库查询中非必要的访问。

✔️MySQL 数据库支持的分区类型为水平分区

常见的表分区实践中，可以按照以下一些原则进行分区：

1 . 按照系统负载，将数据分到不同的区域中
2 . 按照应用程序查询模式，将数据库分为不同的分区
3 . 按照月份或者年份分区
4 . 通过实践哈希法可以将记录放置到不同的分区中
5 . 基于范围查询，使用分段来将记录放置到不同的分区中，以便提高查询效率

MySQL水平分区的创建方法：

CREATE TABLE orders (order_id INT PRIMARY KEY,order_date DATE,customer_id INT,total_amount DECIMAL(10，2)
) PARTITION BY RANGE (YEAR(order_date)) (PARTITION P0 VALUES LESS THAN (2020),PARTITION P1 VALUES LESS THAN (2021),PARTITION P2 VALUES LESS THAN (2022),PARTITION P3 VALUES LESS THAN MAXVALUE
);