MySQL中的表压缩功能

MySQL版本:8.0.22

os:linux ubuntu

语言:c++、c

在MySQL中支持3种类型的表压缩,依次为:传统压缩、TPC压缩、字典压缩。

第一种:传统压缩

传统的表压缩方式是在MySQL5.0.7之前使用的,现在已经废弃了,因为这种方式不但没有提升数据库的效率,反而降低了效率,导致buffer pool的使用率降低了。

create table时指定压缩后表的大小,即 KEY_BLOCK_SIZE 的大小,page默认大小为16KB。压缩是按page为单位进行压缩的。

SQL语句:

create table tt 
(c1 int primary key,c2 varchar(50)
) engine = innodb KEY_BLOCK_SIZE=8; KEY_BLOCK_SIZE 的取值为: 1,2,4,8,16

表示一个16KB的page压缩之后是8KB。如果一个page压缩之后的大小为9KB,那么需要2个8KB的page进行存储。如果一个page压缩之后的大小为6KB,那么只需要1个8KB的page进行存储即可。

KEY_BLOCK_SIZE的大小可以是 1、2、4、8、16,表示启用页压缩,然后按照 1K、2K、4K、8K、16K 的页大小存储数据。如果设置KEY_BLOCK_SIZE的大小为0,那么MySQL自动的将KEY_BLOCK_SIZE设置为innodb_page_size/2;

缺点:一个页在缓冲池中存在两个版本,压缩前的原始版本和压缩后的版本,这样导致缓冲池中能缓存page页的数量大大减少,在buffer pool中多产生一个page。对于一个16KB的page,一个存放的是原来的16KB的页数据,另一个是压缩后的page,压缩后以8KB为例,8KB中存放的是压缩后的数据再加上redo.log日志以及file header和file tailer部分。

因此,这种压缩方式会额外的多占用一个page用于存储压缩之后的page。

参考:MySQL :: MySQL 8.0 Reference Manual :: 15.9.1.2 Creating Compressed Tables

第二种:TPC压缩

TPC是Transparent page compression的简称,也就是 透明页压缩。这种方式是主流的压缩方式。

压缩是按page为单位进行压缩的,一个page的大小默认是16KB,也就是innodb page的默认大小,用于可以通过SQL : select @@innodb_page_size;查询page的大小;下面都采用一个page为16KB为单位。

SQL语句:

create table tt
(c1 int primary key,c2 varchar(128)
) engine = innodb compression=zlib;create table tt
(c1 int primary key,c2 varchar(128)
) engine = innodb compression=lz4;create table tt
(c1 int primary key,c2 varchar(128)
) engine = innodb compression=none;

建表时,compression=后面指定压缩的方式,支持下面3种写法:

COMPRESSION [=] {'ZLIB' | 'LZ4' | 'NONE'}

其中zlib和lz4是支持的压缩方式,NONE表示不压缩

一个page变成dirty page之后,后台线程就会将该dirty page flush到磁盘文件中。确定要flush到磁盘文件时,先将该page进行压缩(lz4/zlib),压缩之后以9KB为例,那么剩余的7KB(16K-9K)就会被填充为0x00,然后flush到磁盘文件后,调用文件系统空洞(Hole Punch)特性(实际上是fallocate())对文件进行“裁剪”,释放 0x00 占用的稀疏空间,实际存放到磁盘上的文件大小为7KB。

当前linux的内核以及大部分的文件系统,例如:XFS、EXT4、ZFS、btrfs、NTFS 等,都支持文件空洞特性。

查看压缩后的文件占用的存储空间大小的SQL如下:

SELECT SPACE, NAME, FS_BLOCK_SIZE, FILE_SIZE, ALLOCATED_SIZE FROM INFORMATION_SCHEMA.INNODB_TABLESPACES WHERE NAME='mysql/bmsql_customer';

FILE_SIZE:表示原始文件的大小

ALLOCATED_SIZE:表示压缩之后的大小

压缩率 = ALLOCATED_SIZE / FILE_SIZE

 参考:MySQL :: MySQL 8.0 Reference Manual :: 15.9.2 InnoDB Page Compression

第三种:字典压缩

基于字典的列压缩又叫压缩字典,但只适用于Percona分支。
优点是压缩率高, 每个列的数据类型都相同;

限制条件:
该列压缩方式仅用于InnoDB/XtraDB存储引擎,数据类型支持:
(1)、BLOB (including TINYBLOB, MEDIUMBLOB, LONGBLOG)
(2)、TEXT (including TINYTEXT, MEDUUMTEXT, LONGTEXT)
(3)、VARCHAR (including NATIONAL VARCHAR)
(4)、VARBINARY
(5)、JSON
应用于不受支持的列类型或存储引擎,则会报错。

使用MySQL自带的压缩键功能时的SQL语句:
在创建表语句或更改表语句中增加压缩标识
(1)、CREATE语句

CREATE TABLE ... (..., foo BLOB COLUMN_FORMAT COMPRESSED, ...);


(2)、ALTER语句

ALTER TABLE ... CHANGE [COLUMN] ... COLUMN_FORMAT COMPRESSED;ALTER TABLE ... MODIFY [COLUMN] ... COLUMN_FORMAT COMPRESSED;

还有一种是用户自定义压缩键,也就是在在建表时指定压缩和压缩键。

SQL语句如下:

SET @dictionary_data = 'wall' 'apple' 'peach' 'orange';CREATE COMPRESSION_DICTIONARY numbers (@dictionary_data);CREATE TABLE tt(c1 INT,c2 text COLUMN_FORMAT COMPRESSED,c3 BLOB COLUMN_FORMAT COMPRESSED WITH COMPRESSION_DICTIONARY numbers) ENGINE=InnoDB;

c2采用MySQL默认的压缩键;

c3采用用户自定义的压缩键;

不过这种方式使用起来还是有争议的,如果用户用不好压缩键导致压缩率低。

其他参考文献:MySQL :: MySQL 8.0 Reference Manual :: 13.1.20 CREATE TABLE Statement

总之:

现在主流的压缩方式为:TPC压缩和基于字典键的压缩。

如有疑问请发邮件:zgaoq@163.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/462768.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

net core体系-web应用程序-4asp.net core2.0 项目实战(1)-11项目日志解决方案

本文目录1. Net下日志记录2. NLog的使用 2.1 添加nuget引用NLog.Web.AspNetCore 2.2 配置文件设置 2.3 依赖配置及调用 2.4 日志类型介绍 2.5 产生的日志文件3. 基于Microsoft.Extensions.Logging封装 3.1 添加引用Microsoft.Extensions.Logging 3.2 实现…

strcasecmp()--忽略大小写比较字符串

strcasecmp()的功能是&#xff1a;忽略大小写比较字符串 头文件 #include <strings.h> 函数原型&#xff1a;int strcasecmp(const char *s1, const char *s2); 函数功能: 用来比较参数s1和s2字符串&#xff0c;比较时会自动忽略大小写的差异。 返回值: 若参数字符串…

NDK 获取android的imei和serial number

1&#xff0c;获取imei int setAndroidDeviceID(JNIEnv *env, jobject obj,jobject mContext) {if(mContext 0){return -1;}jclass cls_context (*env)->FindClass(env, "android/content/Context");if(cls_context 0){return -1;}jmethodID getSystemService …

《JS高级程序设计》PART3.对象基础

3.2对象应用 对象废除&#xff1a;如果一个对象有2个及以上引用&#xff0c;则要正确的废除该对象&#xff0c;必须将其所有引用都设置为null。 js和java一样&#xff0c;有垃圾回收机制&#xff0c;会自动收回已无引用指向的对象。 早绑定和晚绑定 绑定&#xff1a;把对象的…

python迭代-如何对迭代器做切片操作

如何对迭代器做切片操作 问题举例 读取某个文件内容的100~300行内容&#xff0c;我们是否可以使用 类似列表切片的方式得到一个100~300行文件内容的生成器 分析 列表的切片操作其实是在重载方法__getItem__方法 可以通过file.readlines()后再做切片&#xff0c;内存会加载整个文…

如何让linux服务器同步互联网时间

今天在工作中需要搭建一个数据库集群s1&#xff0c;需要将节点A、节点B和节点C都加入集群&#xff0c;先在A节点上创建集群&#xff0c;然后将B和C节点加入到集群&#xff0c;但是在B和C加入到集群之前&#xff0c;会判断B与A、C与A的时间戳是不是在设置的2s~5s内&#xff0c;如…

Conda常见命令

Anaconda,Miniconda,Conda,Pip的区别&#xff1a; Anaconda&#xff1a;用于科学计算的python发行版&#xff0c;里面预装好了conda&#xff0c;某个版本的python&#xff0c;众多packages,科学计算工具等。Anaconda利用工具/命令conda来进行package和environment的管理&#x…

MySQL一张innodb表列个数的限制和engine的选择

在MySQL innodb存储引擎中&#xff0c;一张表中列的个数最大为4096。 其中在MySQL中&#xff0c;创建表时可以任意指定engine的类型&#xff0c;但是&#xff0c;考虑到join、union、union all等复杂的场景时&#xff0c;尽量每张表都用统一的engine。

Hibernate读书笔记

伟大的信息管理与信息系统专业&#xff0c;万恶的信息管理与信息系统专业。说这句话我是有根据的&#xff1a;因为这个专业雄心勃勃的想把自己的子弟培养成全面发展的人才但是结果则不然。两方面的原因&#xff1a;一部分在学生&#xff0c;但是一部分在这个专业。让我极其郁闷…

基于报文地址的策略路由配置示例

【实验拓扑】本文实验采用的交换机是H3C模拟器&#xff0c;下载地址如下&#xff1a; http://forum.h3c.com/forum.php? modviewthread&tid109740&highlightH3C%E6%A8%A1%E6% 8B%9F%E5%99%A8 有兴趣的朋 友可以在论坛上去下载 【组网需求】普通的报文转发是依据报文的…

html字体加大标签与写法介绍

在html中字体加大的标签为<big>&#xff0c;一般用于重要文字&#xff0c;醒目文字&#xff0c;让用户容易看到&#xff01; 字体加大: <big>写上你想写的字</big> 效果&#xff1a;未加大 加大 效果中我们能轻易分辨&#xff0c;加大和未加大的文字区别&am…

CustomValidator

使用服务器验证时 要注意 IsValid 需要再次进行判断转载于:https://www.cnblogs.com/spchenjie/archive/2011/03/02/1968968.html

MySQL单机版Recycle Bin回收站功能

最近调研了阿里的Recycle Bin回收站功能&#xff0c;可以保证数据不丢失。 为了防止开发或运维人员的误操作&#xff0c;比如DROP TABLE/DATABASE、TRUNCATE TABLE&#xff0c;这类DDL语句不具有可操作的回滚特性&#xff0c;而导致数据丢失,AliSQL 8.0(基于MySQL)新特性支持回…

Delphi纯代码连SQLite数据库,同时支持数据库的加密解密

//摘自&#xff1a;http://bbs.witbase.com/thread-1141-1-1.html Delphi纯代码连SQLite数据库&#xff0c;同时支持数据库的加密解密 Delphi纯代码连SQLite数据库&#xff0c;同时支持数据库的加密解密本文的内容包括&#xff1a;&#xff08;1&#xff09;一个实现了加密解密…

用STATSVN统计公司SVN代码修改

直接用LOG&#xff0c;BOSS还是不满意&#xff0c;那只好架上JDK&#xff0c;用STATSVN了。 跑得还顺利&#xff0c;只是具体代码没跑出来。。 但共用一个帐号&#xff0c;害人呀&#xff0c;还好有提交注释里有程序员的名字。。 STATSVN文档很简单&#xff0c;简单报告也就一个…

Informix IDS 11零碎治理(918考试)认证指南,第 7 部分: IDS复制(24)

SDS&#xff1a;看管可以使用 onstat 或零碎看管接口&#xff08;SMI&#xff09;表查察 SDS 效能器统计信息。本节品评争论以下主题&#xff1a;onstat 选项 sysmaster 表 旧事日志输出 onstat 选项可以使用 onstat -g sds 饬令查察 SDS 效能器统计信息。onstat 的输出取决于运…

leafLet入门教程兼leafLet API中文文档参考

英文文档参考&#xff1a;https://leafletjs.com/reference-1.3.4.html#popup 博客参考&#xff1a;https://blog.csdn.net/qq_36595013/article/details/83144874#leafLet_API__243 使用说明参考&#xff1a;https://www.cnblogs.com/cainiaomeng/p/6072139.html转载于:https:…

MySQL源码解读之数据结构-LF_DYNARRAY

MySQL的代码中实现了一个Lock Free的Hash结构&#xff0c;称作LF_Hash。MySQL的不少模块使用了LF_Hash&#xff0c;比如Metadata Lock就依赖于它。但由于使用的方法不正确&#xff0c;导致了bug#98911和bug#98624。理解LF_Hash的实现细节&#xff0c;可以帮助我们用好LF_Hash。…

Flex通过Blazeds利用Remoteservice与后台java消息推送

Flex通过Blazeds利用Remoteservice与后台java消息推送 准备工作&#xff1a;Myeclipse中先建立一个Web project工程&#xff0c;然后导入Blazeds的文件&#xff0c;再转换为Flex项目类型。前言&#xff1a;Flex 通过开源的BlazeDS消息服务来支持订阅及发布消息。这个消息服务管…

如何运行一个Vue项目

一开始很多刚入手vue.js的人&#xff0c;会扒GitHub上的开源项目&#xff0c;但是发现不知如何运行GitHub上的开源项目&#xff0c;很尴尬。通过查阅网上教程&#xff0c;成功搭建好项目环境&#xff0c;同时对前段工程化有了朦朦胧胧的认知&#xff0c;因此将环境搭建过程分享…