执行结果各字段的含义
EXPLAIN + SQL语句
如:
EXPLAIN SELECT * FROM test
执行结果:
列名 | 描述 |
---|---|
id | 在一个大的查询语句中每个SELECT关键字都对应一个 唯一的id |
select_type | SELECT关键字对应的那个查询的类型 |
table | 表名 |
partitions | 匹配的分区信息 |
type | 针对单表的访问方法(重要) |
possible_keys | 可能用到的索引 |
key | 实际上使用的索引 |
key_len | 实际使用到的索引长度 |
ref | 当使用索引列等值查询时,与索引列进行等值匹配的对象信息 |
rows | 预估的需要读取的记录条数 |
filtered | 某个表经过搜索条件过滤后剩余记录条数的百分比 |
Extra | 一些额外的信息 |
EXPLAIN各列作用
为了让大家有比较好的体验,我们调整了下 EXPLAIN
输出列的顺序。
1. table
表名不论我们的查询语句有多复杂,里面包含了多少个表,到最后也是需要对每个表进行单表访问的,所以MySQL规定EXPLAIN语句输出的每条记录都对应着某个单表的访问方法,该条记录的table列代表着该表的表名(有时不是真实的表名字,可能是简称)
#1. table:表名
#查询的每一行记录都对应着一个单表
explain select count(*) from s1;
这里只用到s1这一张表,所以结果只有一条数据。
#s1:驱动表 s2:被驱动表
EXPLAIN SELECT * FROM s1 INNER JOIN s2;
# 驱动表和被驱动表是 优化器决定的,他认为哪个比较好久用哪个
由于驱动表和被驱动表是由优化器决定的,因此就像这里:s1 INNER JOIN s2 。不一定是s1就是驱动表,结果中s1不一定总在s2上面!
这里用了内连接,涉及两张表,结果就有两条数据。
用到多少个表,就会有多少条记录(临时表也算在记录里面)
2.id
正常来说一个select 一个id ,也有例外的可能,查询优化器做了优化
1.mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a';
这里只有一个select,所以结果也只有一种id2.mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2;
这里虽然有两张表,但只有一个select语句,因此执行结果中只有一种id。3.mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key1 FROM s2) OR key3 = 'a';
这里出现了子查询,有两个select,因此有两种id。先执行id越大(越接近1越小),越先执行。这里就先执行id为2的查询。
几种特殊情况
1.查询优化器优化
######查询优化器可能对涉及子查询的查询语句进行重写,转变为多表查询的操作########EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key2 FROM s2 WHERE common_field = 'a');
运行结果: id 只有一种,原因是查询优化器做了优化,变为了多表查询
2.Union去重
原本想的1个select 一个 id , 预计两个。
#Union去重 # union 去重,union all 不去重 EXPLAIN SELECT * FROM s1 UNION SELECT * FROM s2;
注:这里用的是union,会把s1和s2取交集的集合做成临时表,在这个临时表里面去重。因此有三条记录 可以看到第三条数据的Extra字段表示:Using temporary。说明当前表是临时表(一条记录就是一张表) 因为前面说了,多少种id对应多少个select语句。但这里只有两个select,所以第三条语句的id为NULL。# union all 不去重 所以不需要放在临时表里面 mysql> EXPLAIN SELECT * FROM s1 UNION ALL SELECT * FROM s2;
不去重,所以不用建立临时表,因此结果只有两条数据(两张表)
小结:
- id如果相同,可以认为是一组,从上往下顺序执行
- 在所有组中,id值越大,优先级越高,越先执行
- 关注点:id号每个号码,表示一趟独立的查询, 一个sql的查询趟数越少越好。因为id种类越多,表示嵌套越多。三层嵌套,三种id,就像Java中的时间复杂度O(n³)一样。而多表连接查询的方式就相当于加法只会有三个一样的id,一种id,三张表连接就像时间复杂度为O(x+y+z)一样,效率高很多。
3.select_type
一条大的查询语句里边可以包含若干个SELECT关键字,每个SELECT关键字代表着一个小的查询语句
,而每个SELECT关键字的FROM子句中都可以包含若干张表(这些表用来做连接查询),每一张表都对应着执行计划输出中的一条记录
,对于在同一个SELECT关键字中的表来说,它们的id值是相同的。
MySQL为每一个SELECT关键字代表的小查询都定义了一个称之为select_type
的属性,意思是我们只要知道了某个小查询的select_type属性
,就知道了这个小查询在整个大查询中扮演了一个什么角色
,我们看一下 select_type
都能取哪些值,请看官方文档:
名称 | 描述 |
---|---|
SIMPLE | Simple SELECT (not using UNION or subqueries) |
PRIMARY | Outermost SELECT |
UNION | Second or later SELECT statement in a UNION |
UNION RESULT | Result of a UNION |
SUBQUERY | First SELECT in subquery |
DEPENDENT SUBQUERY | First SELECT in subquery, dependent on outer query |
DEPENDENT UNION | Second or later SELECT statement in a UNION, dependent on outer query |
DERIVED | Derived table |
MATERIALIZED | Materialized subquery |
UNCACHEABLE SUBQUERY | A subquery for which the result cannot be cached and must be re-evaluated for each row of the outer query |
UNCACHEABLE UNION | The second or later select in a UNION that belongs to an uncacheable subquery (see UNCACHEABLE SUBQUERY) |
-
SIMPLE
# 查询语句中不包含`UNION`或者子查询的查询都算作是`SIMPLE`类型EXPLAIN SELECT * FROM s1;#连接查询也算是`SIMPLE`类型EXPLAIN SELECT * FROM s1 INNER JOIN s2;
-
PRIMARY
与UNION
与UNION RESULT
-
UNION RESULT
MySQL选择使用临时表来完成
UNION
查询的去重工作,针对该临时表的查询的select_type
就是UNION RESULT
,例子上边有。
#对于包含`UNION`或者`UNION ALL`或者子查询的大查询来说,它是由几个小查询组成的,其中最左边的那个 #查询的`select_type`值就是`PRIMARY`#对于包含`UNION`或者`UNION ALL`的大查询来说,它是由几个小查询组成的,其中除了最左边的那个小查询 #以外,其余的小查询的`select_type`值就是`UNION`#`MySQL`选择使用临时表来完成`UNION`查询的去重工作,针对该临时表的查询的`select_type`就是`UNION RESULT`
测试sql:
EXPLAIN SELECT * FROM s1 UNION SELECT * FROM s2;
说明:这里s1 union s2,s1(由优化器决定,不一定哪张表就在最左边,这里刚好是s1)在最左边,s1表的select_type 为 `PRIMARY`。由于发生了去重,产生临时表<union1,2> 该表的select_type 为 `UNION RESULT` 。而其他的表s2的`select_type`值就是`UNION`EXPLAIN SELECT * FROM s1 UNION ALL SELECT * FROM s2;
-
-
SUBQUERY
如果包含子查询的查询语句优化器不能够转为对应的
semi-join(多表连接)
的形式,并且该子查询是不相关子查询,并且查询优化器决定采用将该子查询物化的方案来执行该子查询时,该子查询的第个SELECT
关键字代表的那个查询 的select_type
就是SUBQUERY
,比如下边这个查询:#子查询:#如果包含子查询的查询语句不能够转为对应的`semi-join`的形式,并且该子查询是不相关子查询。#该子查询的第一个`SELECT`关键字代表的那个查询的`select_type`就是`SUBQUERY`EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key1 FROM s2) OR key3 = 'a';
说明:这里s1的id最小,表示该表的查询在最外面一层,因此其select_type = 'PRIMARY',而s2的子查询是不相关子查询,因此select_type = 'SUBQUERY'。
-
DERIVED
derived : 衍生,派生
#对于包含`派生表`的查询,该派生表对应的子查询的`select_type`就是`DERIVED`EXPLAIN SELECT * FROM (SELECT key1, COUNT(*) AS c FROM s1 GROUP BY key1) AS derived_s1 WHERE c > 1;
说明:首先有两个select对应两种id,这里的子查询用到了s1,table就是s1。而子查询的结果作为一张表供外面查询使用。因此外面表的table为derived2(2是子查询的id)。而子查询由于是派生出来作为表供查询的,因此select_type为'DERIVED'。
-
MATERIALIZED
materialized: 英 [məˈtɪəri:əˌlaɪzd] 具体化
#当查询优化器在执行包含子查询的语句时,选择将子查询物化之后与外层查询进行连接查询时, #该子查询对应的`select_type`属性就是`MATERIALIZED` EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key1 FROM s2); #子查询被转为了物化表
4.partitions (可略)
- 代表分区表中的命中情况,非分区表,该项为NULL。一般情况下我们的查询语句的执行计划的partitions列的值都是NULL。
- https://dev.mysql.com/doc/refman/5.7/en/alter-table-partition-operations.html
- 如果想详细了解,可以如下方式测试。创建分区表:
-- 创建分区表, -- 按照id分区,id<100 p0分区,其他p1分区 CREATE TABLE user_partitions (id INT auto_increment,NAME VARCHAR(12),PRIMARY KEY(id))PARTITION BY RANGE(id)(PARTITION p0 VALUES less than(100),PARTITION p1 VALUES less than MAXVALUE );
DESC SELECT * FROM user_partitions WHERE id>200;
查询id大于200(200>100,p1分区)的记录,查看执行计划,partitions是p1,符合我们的分区规则
5.type ☆
执行计划的一条记录就代表着MySQL对某个表的执行查询时的访问方法
,又称"访问类型”,其中的type
列就表明了这个访问方法是啥,是较为重要的一个指标。比如,看到type
列的值是ref
,表明MySQL即将使用ref
访问方法来执行对s1
表的查询。
完整的访问方法如下: system
, const
, eq_ref
, ref
, fulltext
, ref_or_null
,index_merge
, unique_subquery
, index_subquery
, range
, index
, ALL
。
我们详细解释一下:
-
system
当表中
只有一条记录
并且该表使用的存储引擎的统计数据是精确的,比如MyISAM、Memory,那么对该表的访问方法就是system
。比方说我们新建一个MyISAM
表,并为其插入一条记录:mysql> CREATE TABLE t(i int) Engine=MyISAM; Query OK, 0 rows affected (0.05 sec)mysql> INSERT INTO t VALUES(1); Query OK, 1 row affected (0.01 sec)
然后我们看一下查询这个表的执行计划:
mysql> EXPLAIN SELECT * FROM t; +----+-------------+-------+------------+--------+ | id | select_type | table | partitions | type | +----+-------------+-------+------------+--------+ | 1 | SIMPLE | t | NULL | system | +----+-------------+-------+------------+--------+ 1 row in set, 1 warning (0.00 sec)
这里如果是 innodb 会变成ALL , 因为innodb系统不会存条数字段。。MyISAM会存储这么一个字段
-
const
#当我们根据主键或者唯一二级索引列与常数进行等值匹配时,对单表的访问方法就是`const`EXPLAIN SELECT * FROM s1 WHERE id = 10005;EXPLAIN SELECT * FROM s1 WHERE key2 = '10066';
注意:这里id是主键,key2是唯一二级索引。改成key3,由于不唯一,所以type变为All
-
eq_ref
#在连接查询时,如果被驱动表是通过主键或者唯一二级索引列等值匹配的方式进行访问的#(如果该主键或者唯一二级索引是联合索引的话,所有的索引列都必须进行等值比较),则#对该被驱动表的访问方法就是`eq_ref`EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.id = s2.id;
从执行计划的结果中可以看出,MySQL打算将s2作为驱动表,s1作为被驱动表,重点关注s1的访问 方法是
eq_ref
,表明在访问s1表的时候可以通过主键的等值匹配
来进行访问。
注意:这个s2表的查询先执行,执行完以后s2.id就是一个具体的值。然后再执行s1.id(主键) = 某一个具体的值(s2.id的执行结果) 速度就也挺快的了。
-
ref
#当通过普通的二级索引列与常量进行等值匹配时来查询某个表,那么对该表的访问方法就可能是`ref`EXPLAIN SELECT * FROM s1 WHERE key1 = 'a';
tips: 类型相同才可以走索引
EXPLAIN SELECT * FROM s1 WHERE key3 = 10066; # 这个是不会走索引的 因为key3 是字符串 # 类型不一样,mysql会加函数,进行隐式转换,一旦加上函数,就不会走索引了。
隐式转换以后,索引可能失效!
-
ref_or_null
#当对普通二级索引进行等值匹配查询,该索引列的值也可以是`NULL`值时,那么对该表的访问方法#就可能是`ref_or_null`EXPLAIN SELECT * FROM s1 WHERE key1 = 'a' OR key1 IS NULL;
-
index_merge
#单表访问方法时在某些场景下可以使用`Intersection`、`Union`、#`Sort-Union`这三种索引合并的方式来执行查询EXPLAIN SELECT * FROM s1 WHERE key1 = 'a' OR key3 = 'a';
从执行计划的
type
列的值是index_merge
就可以看出,MySQL 打算使用索引合并的方式来执行 对s1
表的查询。 -
unique_subquery
#`unique_subquery`是针对在一些包含`IN`子查询的查询语句中,如果查询优化器决定将`IN`子查询#转换为`EXISTS`子查询,而且子查询可以使用到主键进行等值匹配的话,那么该子查询执行计划的`type`#列的值就是`unique_subquery`EXPLAIN SELECT * FROM s1 WHERE key2 IN (SELECT id FROM s2 WHERE s1.key1 = s2.key1) OR key3 = 'a';
-
index_subquery
EXPLAIN SELECT * FROM s1 WHERE common_field IN (SELECT key3 FROM s2 where s1.key1 = s2.key1) OR key3 = 'a';
-
range
#如果使用索引获取某些`范围区间`的记录,那么就可能使用到`range`访问方法 EXPLAIN SELECT * FROM s1 WHERE key1 IN ('a', 'b', 'c');#同上 EXPLAIN SELECT * FROM s1 WHERE key1 > 'a' AND key1 < 'b';
-
index
#当我们可以使用索引覆盖,但需要扫描全部的索引记录时,该表的访问方法就是`index` EXPLAIN SELECT key_part2 FROM s1 WHERE key_part3 = 'a';
索引覆盖,
INDEX idx_key_part(key_part1, key_part2, key_part3)
这3个构成一个复合索引key_part3 在复合索引里面,,查询的字段也在索引里面,干脆就直接遍历索引查出数据
思考: 好处,索引存的数据少,数据少页就少,这样可以减少io。
-
ALL
mysql> EXPLAIN SELECT * FROM s1;
一般来说,这些访问方法中除了All
这个访问方法外,其余的访问方法都能用到索引,除了index_merge
访问方法外,其余的访问方法都最多只能用到一个索引。
小结:
结果值从最好到最坏依次是:
system > const > eq_ref > ref >
fulltext > ref_or_null > index_merge >unique_subquery > index_subquery > range >
index > ALL
SQL 性能优化的目标:至少要达到 range 级别,要求是 ref 级别,最好是 consts级别。(阿里巴巴 开发手册要求)