达梦DM数据库表索引
- 表索引
- 索引准则
- 其他准则
- 创建索引
- 显式地创建索引
- 其他创建索引语句
- 使用索引
- 重建索引
- 删除索引
表索引
达梦数据库表索引相关内容比较多,常用的可能也就固定的一些,这里主要说一下常用的索引,从物理存储角度进行分类,可分为聚集索引和非聚集索引
非聚集索引(又称为二级索引、辅助索引):将二级索引列和聚集索引列共同存储在 B+ 树叶子节点上。如果查找非聚集索引键值或聚集索引键值可直接在 B+ 树中找到;如果查找索引键值以外的数据,则需要回到一级索引中进行查找。每一个表可以有多个非聚集索引。
下面举个例子说明一下,创建表并插入数据
--创建表格T1,并插入数据。
CREATE TABLE T1 (ID int,NAME varchar(20),DEPARTMENT varchar(20));
INSERT INTO T1 VALUES(1,'Zhang San', 'A部');
INSERT INTO T1 VALUES(2,'Li Si', 'B部');
INSERT INTO T1 VALUES(3,'Wang Wu', 'C部');
INSERT INTO T1 VALUES(4,'Chen Liu', 'D部');
查看表结构
SP_TABLEDEF('SYSDBA','T1');
创建索引后查看表结构
--创建聚集索引,索引键为ID。
CREATE CLUSTER INDEX C1 on T1(ID);
--创建非聚集索引,索引键为NAME。
CREATE INDEX S1 on T1(NAME);
SP_TABLEDEF('SYSDBA','T1');
使用聚集索引查找
--使用聚集索引进行查找
EXPLAIN SELECT * FROM T1 WHERE ID=2;
使用非聚集索引查找
EXPLAIN SELECT ID FROM T1 WHERE NAME='Wang Wu';
先使用非聚集索引进行查找,再通过非聚集索引关联上聚集索引进行二次查找
EXPLAIN SELECT * FROM T1 WHERE NAME='Chen Liu';
一般情况下,在插入或装载了数据后,为表创建索引会更加有效率。如果在装载数据之前创建了一个或多个索引,那么在插入每行时 DM8 都必须更改和维护每个索引,使得插入效率降低
索引准则
包括以下准则:
- 如果需要经常地检索大表中的少量的行,就为查询键创建索引;
- 为了改善多个表的连接的性能,可为连接列创建索引;
- 主键和唯一键自动具有索引,在外键上很多情况下也创建索引;
- 小表不需要索引。
索引列选取规则: - 列中的值相对比较唯一 ;
- 取值范围大,适合建立索引;
- CLOB 和 TEXT 只能建立全文索引、BLOB 不能建立任何索引。
其他准则
如果查询中有多个字段组合定位,则不应为每个字段单独创建索引,而应该创建一个组合索引。当两个或多个字段都是等值查询时,组合索引中各个列的前后关系是无关紧要的。但是如果是非等值查询时,要想有效利用组合索引,则应该按等值字段在前,非等值字段在后的原则创建组合索引,查询时只能利用一个非等值的字段。
一个表可以有任意数量的索引。但是,索引越多,修改表数据的开销就越大,因此索引不是越多越好,而应该适当。
创建索引
显式地创建索引
可以用 CREATE INDEX 语句显式地创建索引
CREATE INDEX idx_deptid ON test1(dept_id);
创建索引时未指定表空间的话,默认与表在相同的表空间下
指定存储设置及表空间创建索引
--指定表空间
CREATE INDEX idx_user ON test1(user_name) STORAGE ( INITIAL 50, NEXT 50, ON TEST2023);
查看指定的表空间索引
说明:
如果表及其索引使用相同的表空间 能更方便地对数据库进行管理(如表空间或文件备份)或保证应用的可用性,因为所有有关的数据总是在一起联机。然而,将表及其索引放在不同的表空间(在不同磁盘上)产生的性能比放在相同的表空间更好,因为这样做减少了磁盘竞争。但是将表及其索引放在不同的表空间时,如果一个表上某索引所在的表空间脱机了,则涉及这张表的 SQL 语句可能由于执行计划仍旧需要使用被脱机的索引而不能成功执行。
其他创建索引语句
--创建聚集索引CREATE CLUSTER INDEX clu_emp_name ON emp(ename);--创建唯一索引 STORAGE (ON users) 指定表空间,可以不加,默认与表在相同表空间CREATE UNIQUE INDEX dept_unique_index ON dept (dname) STORAGE (ON users);
聚集索引的约束条件:
每张表中只允许有一个聚集索引,如果之前已经指定过 CLUSTER INDEX 或者指定了 CLUSTER PK,则用户新建立 CLUSTER INDEX 时系统会自动删除原先的聚集索引。但如果新建聚集索引时指定的创建方式(列,顺序)和之前的聚集索引一样,则会报错;
指定 CLUSTER INDEX 操作需要重建表上的所有索引,包括 PK 索引;
删除聚集索引时,缺省以 ROWID 排序,自动重建所有索引;
若聚集索引是默认的 ROWID 索引,不允许删除;
聚集索引不能应用到函数索引中;
不能在列存储表上新建/删除聚集索引;
建聚集索引语句不能含有 partition_clause 子句;
在临时表上增删索引会使当前会话上临时 b 树数据丢失;
不支持在含有多媒体类型的表上新建聚集索引。
--创建基于函数的索引
CREATE INDEX idx ON example_tab(column_a + column_b);
SELECT * FROM example_tab WHERE column_a + column_b < 10;
该索引是建立在 column_a + column_b 之上的,所以优化器可以为该查询使用范围扫描。优化器根据该索引计算查询代价,如果代价最少,优化器就会选择该函数索引,column_a + column_b 就不会重复计算
函数索引约束条件:参考文档
表达式不允许为时间间隔类型;表达式中不允许出现半透明加密列;函数索引表达式的长度理论值不能超过 816 个字符(包括生成后的指令和字符串);函数索引不能为 CLUSTER 或 PRIMARY KEY 类型;表达式不支持集函数和不确定函数,不确定函数为每次执行得到的结果不确定,系统中不确定函数包括:RAND、SOUNDEX、CURDATE、CURTIME、CURRENT_DATE、CURRENT_TIME、CURRENT_TIMESTAMP、GETDATE、NOW、SYSDATE、CUR_DATABASE、DBID、EXTENT、PAGE、SESSID、UID、USER、VSIZE、SET_TABLE_OPTION、SET_INDEX_OPTION、UNLOCK_LOGIN、CHECK_LOGIN、GET_AUDIT、CFALGORITHMSENCRYPT、SF_MAC_LABEL_TO_CHAR、CFALGORITHMSDECRYPT、BFALGORITHMSENCRYPT、SF_MAC_LABEL_FROM_CHAR、BFALGORITHMSDECRYPT、SF_MAC_LABEL_CMP;快速装载不支持含有函数索引的表;若函数索引中要使用用户自定义的函数,则函数必须是指定了 DETERMINISTIC 属性的确定性函数;若函数索引中使用的确定性函数发生了变更或删除,用户需手动重建函数索引;若函数索引中使用的确定性函数内有不确定因素,会导致前后计算结果不同的情况。在查询使用函数索引时,使用数据插入函数索引时的计算结果为 KEY 值;修改时可能会导致在使用函数索引过程中出现根据聚集索引无法在函数索引中找到相应记录的情况,对此进行报错处理;临时表不支持函数索引。
创建位图索引以及创建位图连接索引也可参考上述文档,这里不怎么用到,不再详解。
使用索引
创建测试表
CREATE TABLE T2 (ID int,NAME varchar(20),DEPARTMENT varchar(20),SALARY INT);
CREATE CLUSTER INDEX S21 on T2(ID); //聚集索引
CREATE INDEX S22 on T2(NAME,DEPARTMENT);
CREATE INDEX S23 on T2(NAME);
CREATE INDEX S24 on T2(DEPARTMENT);
CREATE INDEX S25 on T2(SALARY);
使用聚集索引S21查询
EXPLAIN SELECT SALARY FROM T2 WHERE ID=10;
使用非聚集索引S22查询
EXPLAIN SELECT DEPARTMENT FROM T2 WHERE NAME='Zhang San';
先使用非聚集索引S23再使用聚集索引
EXPLAIN SELECT * FROM T2 WHERE NAME='Zhang San';
首先,在 SSEK 中使用 S23 非聚集索引进行扫描定位,得到 NAME;
其次,因为 SELECT * 中查询项太多,需要在 BLKUP2 中通过 S23 回到聚集索引上进行二次查找,得到*中的其它数据。
重建索引
当一个表经过大量的增删改操作后,表的数据在物理文件中可能存在大量碎片,从而影响访问速度。另外,当删除表的大量数据后,若不再对表执行插入操作,索引所处的段可能占用了大量并不使用的簇,从而浪费了存储空间。
可以使用重建索引来对索引的数据进行重组,使数据更加紧凑,并释放不需要的空间,从而提高访问效率和空间效率
--SCHEAM_NAME 为索引所在的模式名,INDEX_ID 为索引 ID
SP_REBUILD_INDEX(SCHEMA_NAME varchar(256), INDEX_ID int);
-- SP_REBUILD_INDEX('SYSDBA', 1547892);
删除索引
删除索引操作
DROP INDEX emp_ename;
--删除不存在的索引会报错。若指定 IF EXISTS 关键字,删除不存在的索引,不会报错
DROP INDEX IF EXISTS emp_ename;
不能直接删除与已启用的 UNIQUE KEY 键或 PRIMARY KEY 键约束相关的索引。要删除一个与约束相关的索引,必须停用或删除该约束本身。