KING BASE
信息时代,数据是驱动业务决策和创新的核心资源。然而,随着数据量的不断增加,有效地处理和整合数据的过程变得愈发复杂。这时,多表连接视图悄然走进数据库世界,不仅能够将多个表中的数据整合在一起,更加便捷,同时还以其可更新的特性,为数据管理带来了全新的可能性。
目前,多表连接视图功能在主流数据库中都被支持,但各数据库的功能表现有所不同(如下图)。KingbaseES支持的连接视图功能项和Oracle表现一致,完全兼容Oracle多表连接视图,并且比MySQL支持的功能更多。为此,本文将带您深入探索KingbaseES数据库中的多表连接视图及其可更新性。
KingbaseES、Oracle和MySQL的功能对比
01
多表连接视图相关概念
多表连接视图是指构建视图的顶层查询引用了多个数据表,通过支持多表连接视图的更新操作,可以实现基于连接视图进行数据表的更新操作(DML),包括插入(INSERT)、更新(UPDATE)和删除(DELETE)。
视图(View)
视图是一种虚拟的表,是从一个或多个基本表中派生的,可以像表一样进行查询和更新操作。对于可更新视图,用户可以通过视图来更新基本表中的数据。
【单表视图】是指视图的查询只涉及单个数据表,如下例子中视图v1的查询中只包含表t1。
【多表视图】是指视图数据映射到多个基表。如下例子中视图v1是由表t1和t2组成,视图v1的数据与t1和t2中数据都存在映射关系。
键保留表(Key-Preserved Table)
如果一个表的主键,是连接结果集的键,则称该表是键值保护的,也可以简单理解为存在一个单向的映射,视图中的每一行数据能唯一映射到基表中的一行数据。键保留表是理解多表连接视图是否可更新的基础,当多表连接视图的基表中存在一个或多个键保留表时,则该视图为可更新视图。
目标基表(Target Base Table)
对于多表连接视图进行更新操作时,会转换为对其中某一个基表的更新操作,实际更新的表称为目标基表。
目标基表与键保留表的关系
目标基表必须为键保留表。
02
多表连接视图背后机制
视图的更新操作
用户可以通多对视图进行更新操作实现对表数据的更新,可以减少编程的工作量,同时隐藏数据表的结构,实现数据对用户间不同的可见性,保证数据安全。对视图执行更新操作,最终会将更新操作(Insert/Update/Delete)重定向到某一个基表,从而实现对于基表的数据更新操作,视图中可能存在多个可以更新的基表(键保留表),每一条DML语句只能作用于一个数据表,本文后续内容主要讨论多表连接视图的更新问题。
视图的可更新性判断
当存在一个或多个键保留表时,我们认为这个视图中的键保留表是可以更新的。为了满足键保留表的条件,查询中不能存在影响查询结果集一一映射关系的子句,如:聚集、分组、集合操作等,这也是存在键保留表的先前条件。
多表视图由于存在不同的JOIN方式,以及连接列主键的不同情形,这时如何判断一个基表为键保留表呢?多表连接视图的可更新性和其查询中的连接方式有很大关系,到底如何判断视图列是否可以更新呢?
简单的等值连接的两表JOIN会存在以下情况
两个表的连接列都不是主键:t1和t2组成视图v1且都不存在主键,则对于视图而言无键保留表。
两个表的连接列都是主键列:Join类型是全外连接时不存在键保留表。若为左连接,左侧表可能是键保留表,右侧表不是键保留表。
若为右连接,同理,只是结论完全相反。若为内连接,视图的每一行能映射到与两个基表中的唯一一行,所以两个表都为键保留表。
两个表的连接列只有一个是主键列
(1) Join类型是全外连接时不存在键保留表。
(2) Join类型如果为左连接,表T1的连接列不是主键,T2的连接列为主键,如图中组成的视图v1在T1中是可以找到唯一映射行的,满足键保留表的关系,所以T1为键保留表。同理右连接相反。
外连接与可更新视图
多表连接视图的可更新性和其查询中的连接方式有很大关系,因此为了更加准确的判断一个多表连接视图是否支持更新,需要对定义视图的查询进行必要的逻辑等价变换,在消除外连接后判断视图的可更新性。
如何判断视图列是否可以更新
视图的列为直接查询的基表列
更新的视图列必须是键保留表的相关列,即目标表必须为键保留表,最后的图例中只能更新视图中col_a和col_b两个列,另外两个列col_c和col_d是不能被更新的
不可更新连接列
目标基表的选择
当用户对一个视图进行更新(Insert/Update/Delete)时,我们如何进行能知道用户想要操作的真正目标基表呢?
对于单表视图来说只有一个表,所以目标基表是明确的。对于多表视图而言此过程需要根据用户的DML语句的输入来识别目标基表。
首先确认视图存在键保留表
对于INSERT和UPDATE的目标基表如何选择?根据DML的目标列确认目标基表,目标列不能涉及多个表
对于DELETE操作不存在视图的目标列信息,如何选择目标基表呢?选择第一个键保留表作为目标基表
视图重写过程
视图的更新实质上是对于基表的更新,在重写视图过程中涉及到哪些部分需要重写呢?
视图所有表达式的引用关系都需要重定向为对目标基表的引用。若目标基表是视图(嵌套视图),则需要合并嵌套视图的查询到上层查询当中。
对于单表视图的with check option,可以合并到WHERE条件中;而对于多表视图,非目标基表的条件对更新操作而言并无作用,所以只需要提取目标基表的条件即可。
03
数据管理绝佳之选
多表连接视图实用示例与优势
在以下示例中视图emp_dept由表emp和dep组成,列deptno为表dep的主键,emp为键保留表,此视图为可更新的视图。
如果我们无法通过连接视图直接进行更新操作,则需要编写一个更为复杂的SQL语句,并且要求对基表dep和emp有足够权限。示例如下:
总结
多表连接视图支持可更新是一种非常有用的技术,可以屏蔽复杂的数据操作逻辑,使得数据管理变得更为简单和高效,不会因DML行为而暴露基础表,同时也限制了用户的访问范围和权限,保护数据的安全性和隐私性。因此也被广泛应用于各种数据库系统和数据管理应用中。
正如我们在本文中所探讨的,多表连接视图不仅是数据的魔法,更是我们应对数据复杂性的有力工具。作为数据库领域国家队,人大金仓将积极探索更高效、更智能的数据管理方法,释放数据的无限力量!
供稿:产品研发中心
编辑:王堇
审核:日尧