在 MySQL InnoDB 存储引擎 中,索引主要分为 聚簇索引(Clustered Index) 和 非聚簇索引(Secondary Index)。它们的主要区别如下:
1. 聚簇索引(Clustered Index)
定义
- 聚簇索引是表数据存储的方式,即 索引和数据在一起,叶子节点存储的是完整的行记录。
- InnoDB 中的主键索引就是聚簇索引(如果没有主键,InnoDB 会选择一个
UNIQUE
索引作为聚簇索引;如果没有UNIQUE
,InnoDB 会自动生成一个隐藏的rowid
)。
存储结构
- 使用 B+ 树 结构存储,叶子节点存放 完整的行数据。
- 数据物理存储顺序和主键索引顺序一致。
特点
- 访问主键索引时,直接获取整行数据,查询速度快。
- 数据存储在主键索引的叶子节点上,表本身就是一棵 B+ 树。
- 适用于 基于主键的查询、范围查询。
- 更新、删除、插入操作可能导致数据的页分裂,影响性能。
示例
CREATE TABLE users (id INT PRIMARY KEY, -- 主键,自动成为聚簇索引name VARCHAR(50),age INT
);
在 users
表中,id
作为 聚簇索引,数据在磁盘上的存储顺序与 id
值的顺序相同。
2. 非聚簇索引(Secondary Index / 辅助索引)
定义
- 非聚簇索引是独立于数据存储的索引,叶子节点存储的是主键值,而不是完整的行数据。
- 访问非聚簇索引时,需要先查找索引,再通过主键回表查询数据,这种过程称为 回表查询(回溯查询,Bookmark Lookup)。
存储结构
- 也是 B+ 树 结构,但叶子节点存储的是主键值,而非完整的行记录。
特点
- 加速非主键列的查询(适用于
WHERE
条件非主键字段)。 - 需要二次查询(先通过非聚簇索引找到主键值,再回表查询完整数据)。
- 索引占用空间较大,需要额外存储主键值。
示例
CREATE TABLE users (id INT PRIMARY KEY, -- 主键(聚簇索引)name VARCHAR(50),age INT,INDEX idx_name (name) -- 非聚簇索引
);
如果执行:
SELECT * FROM users WHERE name = 'Alice';
查询过程如下:
- 先在 非聚簇索引 idx_name 中查找
Alice
,获取其 主键 id。 - 使用
id
在 聚簇索引 中回表查找完整的行数据。
3. 聚簇索引 vs. 非聚簇索引
对比项 | 聚簇索引(Clustered Index) | 非聚簇索引(Secondary Index) |
---|---|---|
存储结构 | 叶子节点存储 完整行数据 | 叶子节点存储 主键值 |
查询速度 | 主键查询快(无需回表) | 非主键查询慢(需要回表) |
插入速度 | 慢(影响数据存储顺序) | 较快(不影响主键顺序) |
更新操作 | 影响数据物理存储顺序,可能导致页分裂 | 更新可能导致回表查询增加 |
占用空间 | 只存储数据本身 | 需要存储 索引列 + 主键值,占用空间大 |
适用场景 | 主键查询,范围查询 | 查询非主键列,提高查询性能 |
4. 什么时候使用聚簇索引 vs. 非聚簇索引?
✅ 适合使用聚簇索引的场景:
- 主键查询多,如
WHERE id = 100;
- 范围查询多,如
BETWEEN 100 AND 200;
- 数据表的主键是有序递增的(如
AUTO_INCREMENT
),避免页分裂。
✅ 适合使用非聚簇索引的场景:
- 查询非主键字段时,如
WHERE name = 'Alice';
- 涉及联合查询,如
INDEX (name, age);
- 表很大,不希望频繁回表查询(可以使用 覆盖索引,避免回表)。
5. 可能的优化方案
-
覆盖索引(Covering Index):
-
避免回表,提高查询性能。
-
优化方法:如果查询的数据只包含索引字段,则直接从索引中获取数据,不需要回表。
-
示例:
CREATE INDEX idx_name_age ON users(name, age); SELECT name, age FROM users WHERE name = 'Alice'; -- 只查 name 和 age,不回表
-
-
使用合适的主键:
- 采用 自增主键,避免页分裂,提高插入性能。
- 避免使用 UUID、随机值作为主键,会导致索引失效、性能下降。
-
减少回表查询:
- 索引覆盖查询,如
SELECT name FROM users WHERE name = 'Alice';
- 适当调整索引列,如
INDEX (name, age)
避免多次回表。
- 索引覆盖查询,如
总结
- InnoDB 中的主键索引是聚簇索引,数据存储在 B+ 树的叶子节点上,查询主键时速度最快。
- 非聚簇索引存储的是主键值,查询时需要回表查询完整数据,适用于非主键查询场景。
- 优化索引可以减少回表查询,提高 MySQL 查询性能。