mysql 分区 性能更差_用案例分析MySQL 5.7分区表性能下降的根本原因

前言:希望通过本文,使MySQL5.7.18的使用者知晓分区表使用中存在的陷阱,避免在该版本上继续踩坑。同时通过对源码的分享,升级MySQL5.7.18时分区表性能下降的根本原因,向MySQL源码爱好者展示分区表实现中锁的运用。

问题描述

MySQL 5.7版本中,性能相关的改进非常多。包括临时表相关的性能改进,连接建立速度的优化和复制分发相关的性能改进等等。基本上不需要做配置修改,只需要升级到5.7版本,就能带来不少性能的提升。

我们在测试环境,把数据库升级到5.7.18版本,验证MySQL 5.7.18版本是否符合我们的预期。观察运行了一段时间,有开发反馈,数据库的性能比之前的5.6.21版本有下降。主要的表现特征是遇到比较多的锁超时情况。开发另外反馈,性能下降相关的表都是分区表。更新走的都是主键。这个反馈引起了我们重视。我们做了如下尝试:

数据库的版本为5.7.18, 保留分区表,性能会下降。

数据库版本为5.7.18,把表调整为非分区表,性能正常。

把数据库的版本回退到5.6.21版本,保留分区表,性能也是正常

通过上述测试,我们大致判定,这个性能下降和MySQL5.7版本升级有关。

问题重现

测试环境的数据库表结构比较多,并且调用关系也比较复杂。为了进一步分析并定位问题,我们抽丝剥茧,构建了如下一个简单的重现过程

// 创建一个测试分区表t2:

CREATE TABLE `t2`(

`id` INT(11) NOT NULL,

`dt` DATETIME NOT NULL,

`data` VARCHAR(10) DEFAULT NULL,

PRIMARYKEY (`id`,`dt`),

KEY`idx_dt`(`dt`)

) ENGINE=INNODB DEFAULTCHARSET=latin1

/*!50100 PARTITION BY RANGE (to_days(dt))

(PARTITION p20170218 VALUES LESS THAN (736744)ENGINE = InnoDB,

PARTITIONp20170219 VALUES LESS THAN (736745) ENGINE = InnoDB,

PARTITIONpMax VALUES LESS THAN MAXVALUE ENGINE = InnoDB) */

// 插入测试数据

INSERT INTO t2 VALUES (1, NOW(), '1');

INSERT INTO t2 VALUES (2, NOW(), '2');

INSERT INTO t2 VALUES (3, NOW(), '3');

// SESSION 1 对id = 1的 记录 做一个更新操作,事务先不提交。

BEGIN;UPDATE t2 SET DATA = '12' WHERE id = 1;

// SESSION 2 对id = 2 的记录做一个更新。

BEGIN;UPDATE t2 SET DATA = '21' WHERE id = 2;

在SESSION 2,我们发现,这个更新操作一直在等待。ID是主键,按道理,主键id = 1 的记录更新,不至于影响到主键id = 2的记录更新。

查询information_schema下的innodb_locks这张表。这张表是用于记录InnoDB事务尝试申请但还未获取的锁,以及阻塞其他事务的事务所拥有的锁。有两条记录:

7441fb84ffe2618db463a9dbc9ac13f2.png

观察此时的innodb_locks表,事务id=40021锁住第3页的第2行记录,导致事务id=40022无法进行下去。

我们把数据库回退到5.6.21版本,则不能重现上述场景。

进一步分析

根据innodb_locks表提供的信息,我们知道问题在于InnoDB锁定了不恰当的行。该表是memory存储引擎。我们在memory 存储引擎的插入接口设置断点,得到如下堆栈信息。确定是红框部分,将锁信息写入到innodb_locks表中。

e61d353c14e8a8adc82c2bfad7cbb54a.png

并在函数fill_innodb_locks_from_cache中得以确认,每次写入行的数据,都是从如下代码中Cache对象中获取的。

0a1256d494c016b9254352ccdc0dfb39.png

我们知道Cache中保存了事务锁的信息,因此需要进一步查找Cache中的数据,是如何添加进去的。通过搜索cache对象在innodb代码中出现的位置,找到函数add_lock_to_cache。在此函数设置断点进行调试后,发现其内容与填写innodb_locks表的数据一致。确定该函数使用的lock对象,就是我们要找的锁对象。

ee65333dd4593b6f744e76d3b03dd770.png

针对lock_t 类型的使用位置进行排查。经过筛选和调试,发现函数RecLock::lock_add中,生成的行锁被加入到该锁所在的事务链表中。

1de60ea6cb507e986ad138e0a17656b5.png

RecLock::lock_add函数可以推出行锁的生成原因。因此,通过对该函数进行断点设置,查看函数堆栈,在如下堆栈内,定位到红框位置的函数:

eecf19f6635039db7b27912d897a267a.png

针对Partition_helper::handle_ordered_index_scan的如下代码进行跟踪,根据该段代码的分析,m_part_spec.end_part 决定了进行上锁的最大行数,此处即为非正常行锁生成的原因。

8675bbc6715008b43466de7e57542c0b.png

最终问题归结到m_part_spec.end_part 的生成原因。通过对end_part 使用地方进行排查,最终在get_partition_set函数中定位到该变量在使用前的初始设置值。从代码中可以看出,每次单条记录的update操作,在进行index scan上锁时,对分区表数目相同的行数进行上锁。这个是根本原因。

46a3c7069a0354d40bd56f7c16d313aa.png

验证结论

根据之前的分析,每次单条记录的update操作,会对分区表数目相同的行数进行上锁。我们尝试验证我们的发现。

新增如下两条记录:

INSERT INTO t2 VALUES (4, NOW(), '4');

INSERT INTO t2 VALUES (5, NOW(), '5');

// SESSION 1 对id = 1的 记录 做一个更新操作,事务先不提交。

BEGIN;UPDATE t2 SET DATA = '12' WHERE id = 1;

// SESSION 2 现在对id = 4 的记录做一个更新。

BEGIN;UPDATE t2 SET DATA = '44' WHERE id = 4;

我们发现,对id = 4的更新可以正常进行。不会受到id = 1 的更新影响。这是因为id=4的记录,超过了测试案例的分区个数,不会被锁住。在实际应用中,分区表所定义分区数不会如测试用例中的只有3个,而是数十个乃至数百个。这样进行上锁的结果,将加剧更新情况下的锁冲突,导致事务处于锁等待状态。如下图所示,每个事务都上N个行锁,那么这些上锁记录互相覆盖的可能性就极大的提高,也就导致并发下降,效率降低。

586757184dd3c0a53499b5a59b09eedf.png

结论

通过上述分析,我们非常确认,这个应该是MySQL 5.7版本的一个regression。我们提交了一个Bug到开源社区。Oracle确认是一个问题,需进一步分析调查这个Bug。

点关注,不迷路

好了各位,以上就是这篇文章的全部内容了,能看到这里的人呀,都是人才。之前说过,PHP方面的技术点很多,也是因为太多了,实在是写不过来,写过来了大家也不会看的太多,所以我这里把它整理成了PDF和文档,如果有需要的可以

f9b64ae5502d25c92381f6c90ffc0648.png

07a63a31ebb230dda4fd1458ef8fb05f.png

以上内容希望帮助到大家,很多PHPer在进阶的时候总会遇到一些问题和瓶颈,业务代码写多了没有方向感,不知道该从那里入手去提升,对此我整理了一些资料,包括但不限于:分布式架构、高可扩展、高性能、高并发、服务器性能调优、TP6,laravel,YII2,Redis,Swoole、Swoft、Kafka、Mysql优化、shell脚本、Docker、微服务、Nginx等多个知识点高级进阶干货需要的可以免费分享给大家,需要的可以加入我的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/558097.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java 数组 截取_Java成长孵化园---认识java(day09)

1、APIApplication Programming Interface应用编程接口一切可以调用的东西,都是API2、基础APIObject、String、StringBuilder/StringBuffer、正则表达式、基本类型的包装类、BigDecimal/BigInteger、Date、SimpleDateFormat3、java.lang.Objectlang包:la…

mysql id还原_一次线上DB问题排查(MySQL、事务、MVCC)

背景在司机数据库中,有一张用于存储司机车型的表,暂且称之为表t。该表结构如下所示:MySQL [comp_epower]> show create table t \G; *************************** 1. row *************************** Table: Create Table: CREATE TABLE …

mysql 可以用多个索引_mysql索引合并:一条sql可以使用多个索引

前言mysql的索引合并并不是什么新特性。早在mysql5.0版本就已经实现。之所以还写这篇博文,是因为好多人还一直保留着一条sql语句只能使用一个索引的错误观念。本文会通过一些示例来说明如何使用索引合并。什么是索引合并下面我们看下mysql文档中对索引合并的说明&am…

mysql三种引擎_MySQL常见的三种存储引擎

原文连接:https://www.cnblogs.com/yuxiuyan/p/6511837.htmlhtml简单来讲,存储引擎就是指表的类型以及表在计算机上的存储方式。数据库存储引擎的概念是MySQL的特色,Oracle中没有专门的存储引擎的概念,Oracle有OLTP和OLAP模式的区…

django win下安装mysql_python测试开发django-8.windows系统安装mysql8教程

前言MySQL 是最流行的关系型数据库管理系统,可以在本地搭建一个mysql的环境,便于学习。windows7/windows10mysql-8.0.11-winx64下载安装包也可以在此页面【https://dev.mysql.com/downloads/file/?id476233】,进入页面后可以不登录。后点击底…

php mysql ajax 注册验证 实例_Ajax小实例   用户注册异步验证

简介51cto的程序员应该都有sina微博吧!你会发现当你更改新浪会员名称,输入用户名Tab后,光标焦点移动到密码输出框时,用户名输出框的后面,就已经显示出了验证。验证信息是:你的用户名是否唯一,因…

同一事务中未提交的写能读到吗_03、MySQL事务的隔离性分析

事务可以用来保证数据库的完整性:要么都做,要么不做。在 MySQL 中,事务支持是在引擎层实现的。你现在知道,MySQL 是一个支持多引擎的系统,但并不是所有的引擎都支持事务。比如 MySQL 原生的 MyISAM 引擎就不支持事务&a…

python软件管理系统_conda:基于python的软件管理系统

python语言在发展的过程中,经历了python2到python3的迁移,对应的包也出现了多个版本。如何在一台服务器上同时安装不同版本的python,不同版本的package, 而且不互相干扰,是一个令人头痛的问题。为了解决这个问题,首先是virtualenv…

vscode远程Mysql数据库_windows系统vscode远程调试mysql

准备工作本文目标是可以从 WindowsVSCode 环境远程访问 Linux 的 mysql源码, 以及执行 GDB 远程调试首先准备以下软件在本地机器上:安装VS Code目前最新版本支持 Remote - Development 插件安装 VSCode 扩展 “Remote - Development”, 方法是左下角管理(⚙) ->扩展, 直接搜…

java io 文件路径_【IO流】java中文件路径(相对路径、绝对路径)相关类及方法...

1. URL菜鸟教程:Java URL处理 通常推荐对http等协议进行使用,若操作(file:)部分属性将无意义,建议getFile()。相关:URLConnections 类 可以打开连接进行IO 通过getResource方法可以获得相对于classPath的文件的URL2. FileTestvoid…

java 过滤脚本_【快学SpringBoot】过滤XSS脚本攻击(包括json格式)

XSS攻击是什么XSS攻击全称跨站脚本攻击,是为不和层叠样式表(Cascading Style Sheets, CSS)的缩写混淆,故将跨站脚本攻击缩写为XSS,XSS是一种在web应用中的计算机安全漏洞,它允许恶意web用户将代码植入到提供给其它用户使用的页面中…

java高级教程_Java高级教程02

1.Java线程1.1. 多线程和多进程多进程:操作系统能够同时进行多个任务: 每个app(word,播放器,浏览器)可以同时运行多线程:同一应用程序中哟多个顺序流同时执行线程是进程中的一部分1.2. 线程的执行过程:主要过程:多线程…

【LeetCode刷题笔记】动态规划(二)

647. 回文子串 解题思路: 1. 暴力穷举 , i 遍历 [0, N) , j 遍历 [i+1, N] ,判断每一个子串 s[i, j) 是否是回文串,判断是否是回文串可以采用 对撞指针 的方法。如果是回文串就计数 +1

数据结构 排序 java_Java数据结构之排序---选择排序

简单选择排序的介绍:从给定的序列中,按照指定的规则选出某一个元素,再根据规定交换位置后达到有序的目的。简单选择排序的基本思想:假定我们的数组为int [] arr new int[n],第一次我们从arr[0]~arr[n-1]中选择出最小的…

python百度aip移动目标监控系统_python利用百度云接口实现车牌识别

一个小需求---实现车牌识别。目前有两个想法调云在线的接口或者使用SDK做开发(配置环境和编译第三方库很麻烦,当然使用python可以避免这些问题)自己实现车牌识别算法(复杂)!一开始准备使用百度云文字识别C SDK来做,发现需要准备curl、jsoncpp…

centos tar安装mysql_centos系统通过tar.gz包安装mysql5.7.19

系统:centos6.5 64位系统1、下载mysql本人选的linux generic 通用版 64位2、把mysql传到服务器并解压到/usr/localtar -xzvf mysql-5.7.19-linux-glibc2.12-x86_64.tar -C /usr/local3、进入/usr/local目录:cd /usr/local4、为mysql安装目录创建软链接ln -s mysq…

aqs clh java_【Java并发编程实战】----- AQS(一):简介

在前面博客中,LZ讲到了ReentrantLock、ReentrantReadWriteLock、Semaphore、CountDownLatch,他们都有各自获取锁的方法,同时相对于Java的内置锁,他们具有明显的优势:花最小的空间开销创建锁、最少的时间开销获得锁、使…

gitlab ci 配置 java_GitLab CI/CD 配置

GitLab CI/CD 配置概念操作示例创建测试项目 sample-web,然后打开项目的 Runners 配置找到这个地方,后边要用然后搭建 gitlab-runner,CI/CD 需要通过它实现# 创建 gitlab-runner 目录mkdir -p /usr/local/gitlab-runner && cd /usr/l…

java失败javac成功_JAVA SE JDK-10安装、配置(解决java成功,javac失败问题)

本文是在win10环境下安装JDK-10在linux环境下安装JDK-10请点击:CentOS 7 安装、配置JDK-101、下载JDK包点击打开下载网站点击图中的Accept License Agreement,再选择Win版本进行下载2、安装JDK包下载完毕,运行安装程序修改安装路径(这里选择的…

java搭建聊天服务器_使用 ServerSocket 建立聊天服务器-2

1.从serverListener中可以看出,每一个客户端创建新的请求之后,都会把它分配给一个独立的chatsocket ,但是每一个ChatSocket都是相互独立的,他们之间并不能沟通,所以要新建一个类,将这些新建的线程管理起来,然后实现他们之间的相互通信.(类似于微信加群聊天的功能)由于一个聊天服…