软考又考了,数据库范式这次一定要弄懂!

0. 引言

今年数据库范式又作为选择题在软考中出题了,范式和反范式同样也在我们日常开发的数据库表设计工作中提供重要理论,今天我们来彻底弄懂几大范式的概念和区别,以及常见的反范式设计方法

1. 定义

1.1 基础概念

在实际讲解之前,我们先普及一些基础概念,方便初次接触的同学理解

  • 键(码/超键)

键也称为码,即能够唯一标识一条记录的属性或属性集,即可以是单个字段或者多个字段的组合。比如{员工id, 身份证号,姓名,电话}中,员工id,身份证号,电话都能唯一标识一个员工,则他们都是键,同时键也称为码
这里需要注意的是键没有声明最小化,也就是说{姓名,电话}组合起来也可以唯一标识一个员工,那么{姓名,电话}的组合我们也可以称为是一个键

  • 候选键(候选码/超级码)

候选键即能够唯一标识一条记录的最小属性集,所以候选键是没有任何多余属性的键
这里就是声明了最小化的,我们能说{姓名,电话}是一个键,但不是一个候选键,再最小化后可以说电话是一个候选键,员工id, 身份证号这些都可以唯一标识,且已经最小化了,所以都可以作为候选键

  • 主键(主码)

主键就是从候选键中挑选一个作为主键,而挑选的规则没有严格要求,但一般我们按照简单性来进行选择,比如选Integer类型不选String类型,选Long类型不选String类型,所以当员工id和身份证号时,我们更倾向于选择员工id作为主键

  • 外键(外码)

另一个关系(数据库表)中的主键,用来关联个关系集(表)
比如{订单id, 订单创建时间,总金额} 和 {商品id, 商品名称,订单id},在{商品id, 商品名称,订单id}中订单id就是外键

  • 自然键

自然生活中唯一能够标识一条记录的键,比如员工id和身份证号中,身份证号就是自然键,因为员工id在自然生活中并不存在,是我们在系统设计中人为定义的

  • 全码

所有的属性共同构成一个候选码时,这时该候选码为全码

  • 主属性

即候选码中的属性

1.2 第1范式

1NF: 属性值都是不可分的原子值

完整定义:在关系模式R中,当且仅当所有域只包含原子值,即每个属性都是不可再分的数据项,则称关系模式R是第一范式

案例:

第1范式的定义是比较好理解的,也就是强调原子性,属性是不可再分的

比如存在列字段:姓名、电话,根据业务场景判断,如果业务场景中有座机电话、手机电话,那么电话字段就不再保持原子性了,因为可以拆分为座机电话、手机电话,我们数据库设计就要调整为:姓名、座机电话、手机电话,才能让字段不能再拆分,保持原子性。

所以属性的原子性一方面还要根据业务场景来判断,结合业务场景出现的信息,如果已经不能再往下拆分了,那说明满足原子性了。

在这里插入图片描述

1.3 第2范式

2NF: 消除主属性对候选键的部分依赖

完整定义:当且仅当实体E是第一范式,且每个非主属性完全依赖主属性(即不存在部分依赖)时,则称实体E是第二范式

首先要明确什么是完全依赖,什么是部分依赖?
官方定义是这样的:

  • 部分函数依赖:设X,Y是关系R的两个属性集合,存在X→Y,若X’是X的真子集,存在X’→Y,则称Y部分函数依赖于X
  • 完全函数依赖:设X,Y是关系R的两个属性集合,X’是X的真子集,存在X→Y,但对每一个X’都有X’!→Y,则称Y完全函数依赖于X

举例子来说:

  1. 如果属性A能推导出C, 属性B也能推导出C, 那则说C部分依赖于AB,
  2. 如果AB一起可以推导出C, A和B单独都不能推导出C, 那说明C完全依赖于AB
  3. 如果C只能由A推导出,则C完全依赖于A

也就是说由一个或多个属性的集合中的一部分就能推导出某一属性,就说明这个属性部分依赖于这一集合。如果要这个集合全部组合在一起才能推导出这个属性,那么就说明这个属性完全依赖于这个集合。

案例

比如订单表中包含字段:订单id, 订单创建时间,总金额,商品id, 商品名称,明显主键是订单id, 总金额、创建时间、商品id都完全依赖于于订单id, 即只由订单id可以关联出这几个信息,但是一个订单中可能有多个商品,因此商品名称是完全依赖于商品ID,部分依赖于订单ID

所以关系{订单id, 订单创建时间,总金额,商品id, 商品名称}是不能满足第2范式的,我们对其拆分{订单id, 订单创建时间,总金额}, {商品id, 商品名称,订单id},拆分成两个保持完全依赖的关系,则其满足第2范式

在这里插入图片描述

1.4 第3范式

3NF: 消除非主属性对候选键的传递依赖

完整定义:当且仅当实体E是第二范式,且E中没有非主属性传递依赖于候选键时,则称实体E是第三范式

首先这里要理解什么是传递依赖

如果有A->B, B->C, 则A->C,这样的传递关系就称为依赖传递
举例来讲订单ID->商品ID, 商品ID->商品名称,则订单ID->商品名称,我们说商品名称传递依赖于订单ID

也就是说第3范式是要消除非主属性之间的传递依赖。这意味着非主属性不能依赖于其他非主属性

案例

U={订单ID,创建时间,商品ID,商品名称}, F={订单ID->创建时间,订单ID->商品ID, 商品ID->商品名称},则可以推导订单ID->商品名称,因为订单ID是候选键,商品名称是非主属性,且商品名称传递依赖于订单ID, 所以不满足第3范式

在这里插入图片描述

1.5 BC范式

BCNF(Boyce-Codd范式): 消除主属性对候选键的部分和传递依赖

完整定义:设R是一个关系模式,F是它的依赖集,R属于BCNF当且仅当其F中每个依赖的决定因素必定包含R的某个候选码

BC范式的定义比较难理解,翻译过来就是:每个属性都不部分依赖于候选键,也不传递依赖于候选键

第三范式要求的是非主属性不传递依赖于候选键,而BC是要求每个属性都不传递依赖和部分依赖于候选键,即包括候选键本身

案例

设定选课表(学号, 课程号, 教师编号),且每位老师只教一门课,而一门课可以有多个老师。
那么候选键就是(学号、课程号)、(学号、教师编号),即存在两个复合候选键,任意单个属性都无法组成候选键
于是可以得到(学号、课程号)-> 教师编号,(学号、教师编号)-> 课程号,教师编号 -> 课程号
因为第3范式要求非主属性不能依赖于其他非主属性,而该模式不存在非主属性,所以明显满足第3范式
同时这里可以看出,主属性课程号传递依赖于候选键(学号,教师编号),因此不满足BCNF。

在这里插入图片描述

2. 反范式常用手段

范式带来的影响就是减少数据冗余,但带来了更多的查询消耗,所以反范式的目标就是提高查询效率,其常用的手段有

  • 派生列冗余

所谓派生列,就是可以通过其他列推导出来的列,比如表字段有数量、单价,总金额就是派生列,因为其可以由单价*数量计算的来,但对他冗余,可以在查询时减少复杂计算带来的消耗,从而提高查询效率

  • 普通列冗余

普通列冗余主要是为了减少关联表查询时带来的io操作,从而提高查询效率,所以其场景是涉及多表关联查询时

  • 表结构重新设计

表结构重新设计带来的工作量比较大,其作用就是通过重新设计表结构,将常查询的字段组合到一张表,减少多次关联io操作,从而提高查询效率,因为设计表字段的重新组合,所以也有表垂直拆分的含义

  • 表数据水平拆分

数据水平拆分就是将行数据拆分存储,比如按照地区、时间范围进行水平拆分存储,其目的是减少一次查询的数据量,从而提高查询效率

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/28930.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

终于用上了桌面版本的chatGPT

最近经过不断的探索,也算是用上了桌面版本的chatgGPT,想要用同学,可以关注一下,后面我会出一期教程的~

docker安装elasticsearch8和kibana,带ik分词器

全文目录,一步到位 1.前言简介1.1 专栏传送门 2. elasticsearch和kibana安装2.1 准备工作2.1.1 下载elasticsearch2.1.2 下载kibana镜像 2.2 创建并运行es容器2.2.1 创建es网络2.2.2 创建es容器2.2.3 放行端口2.2.4 访问查看结果> 步骤一: 点击高级, 然后继续访问> 步骤二…

KIVY AliasProperty 运用报错汇总

案例1: 在Kivy中,AliasProperty 允许你创建一个属性的别名,该别名可以基于其他属性计算得到。但是,与普通的Python属性不同,Kivy的Property类(包括AliasProperty)并没有直接提供定义getter和s…

Tensorflow入门实战 T04-猴痘识别

本篇文章主要:tensorflow 运行环境:本地cpu 运行epoch:50 1、tensorflow官网 tensorflow的官网教程。初学者的 TensorFlow 2.0 教程 | TensorFlow Core 官网上有图像分类的相关详细描述还有代码示例。 2、完整代码展示 from tensorflo…

单调队列总结

单调队列的介绍 由于现在我也没接触过正经的单调队列的定义,因而引申为介绍, 单调队列,类似与单调栈,存储在单调队列里面的元素理应都是单调的,单调队列的基础使用deque(双端队列)去实现的&am…

【总线】AXI总线:FPGA设计中的通信骨干

目录 AXI4:高性能地址映射通信的基石 AXI4-Lite:轻量级但功能强大的通信接口 AXI4-Stream:高速流数据传输的利器 结语:AXI总线在FPGA设计中的重要性 大家好,欢迎来到今天的总线学习时间!如果你对电子设计、特别是FPGA和SoC设计…

FlowUs息流开启知识管理的新纪元|FlowUs息流公开知识库

在信息爆炸的时代,如何高效地管理和利用知识成为了一个挑战。FlowUs知识库以其超巨的性价比,为用户带来了全新的解决方案。它不仅仅是一个存储信息的工具,更是一个能够激发创造力和提高生产力的平台。 性价比之选 FlowUs以其合理的价格&…

ChromeDriver新手教程:一步步指导Chrome 114到127版本的驱动安装

114之前版本下载链接在这里 ​​​​​​125以后版本下载链接在此,只有后面status是绿色对勾的才可以下载,驱动大版本一致就可以使用,不需版本号一模一样;下载所需版本只需点击对应的版本名称即可跳转到对应版本的下载位置。 以…

学习笔记——网络管理与运维——SNMP(基本配置)

四、SNMP基本配置 1、SNMP配置举例 整个华为数通学习笔记系列中,本人是以网络视频与网络文章的方式自学的,并按自己理解的方式总结了学习笔记,某些笔记段落中可能有部分文字或图片与网络中有雷同,并非抄袭。完处于学习态度&#x…

windows系统把桌面的文件重定向到电脑的其他分区盘

当我们使用windows系统的电脑时,很喜欢把一些常用的文件放到桌面上。而桌面上的文件默认都是设定在C盘下的。时间长了,C盘容易爆红(空间不足)。下面我将介绍一种比较简单快捷的办法来解决这种问题--就是把桌面的文件重定向到电脑的其他分区盘。 首先我们…

[蓝桥杯真题]买二赠一

蓝桥杯真题;买二赠一,要求赠的一价格不能超过买的两者之间最小价格的二分之一 看到这个题的时候我信心满满的一顿操作猛如虎,全部写出来的时候内心想着,稳了!这次绝对稳了!然而。。。答案错误。。。 我只能去看了一下…

2024年春季学期《算法分析与设计》练习15

问题 A: 简单递归求和 题目描述 使用递归编写一个程序求如下表达式前n项的计算结果&#xff1a; (n<100) 1 - 3 5 - 7 9 - 11 ...... 输入n&#xff0c;输出表达式的计算结果。 输入 多组输入&#xff0c;每组输入一个n&#xff0c;n<100。 输出 输出表达式的计…

使用dev_dbg调试

首先内核要使能两个配置才可以使用。一般内核都是打开的。 CONFIG_DEBUG_FSy CONFIG_DYNAMIC_DEBUGy 当编译选项CONFIG_DYNAMIC_DEBUG打开的时候&#xff0c;在编译阶段&#xff0c;kernel会把所有使用dev_dbg()的信息记录在一个table中&#xff0c;这些信息我们可以从/sys/k…

谷歌发布Infini-Transformer模型—无限注意力机制长度,超越极限

Transformer 是一种基于自注意力机制的深度学习模型&#xff0c;最初应用于自然语言处理领域&#xff0c;现已扩展到图像、音频等多个领域。与传统的循环神经网络 (RNN) 不同&#xff0c;Transformer 不依赖于顺序数据处理&#xff0c;能够并行计算&#xff0c;从而显著提高效率…

Havoc工具

Team端 客户端 打开后需要生成监听器和agent 监听 生成payload 最后上线 HTTPS流量 HTTP流量 心跳

【ARMv8/ARMv9 硬件加速系列 3.3 -- SVE LD2D 和 ST2D 使用介绍】

文章目录 SVE 多向量操作LD2D(加载)LD2D 操作说明LD2D 使用举例ST2D(存储)ST2D 使用举例ST2D 存储示例代码ld2d 和 st2d 小结SVE 多向量操作 在ARMv8/9的SVE (Scalable Vector Extension) 指令集中,st2d和ld2d指令用于向量化的存储和加载操作,具体地,它们允许同时对两个…

物联边缘网关如何助力工厂实现智能化生产?以某智能制造工厂为例-天拓四方

随着工业4.0的深入推进&#xff0c;智能制造工厂成为了工业发展的重要方向。在这个背景下&#xff0c;物联边缘网关以其独特的优势在智能制造工厂中发挥着越来越重要的作用。以下将通过一个具体的智能制造工厂应用案例&#xff0c;来阐述物联边缘网关如何助力工厂实现智能化生产…

超级签名源码/超级签/ios分发/签名端本地linux服务器完成签名

该系统完全在linux下运行&#xff0c;不存在使用第三方收费工具&#xff0c;市面上很多系统都是使用的是第三方收费系统&#xff0c;例如&#xff1a;某心签名工具&#xff0c;某测侠等&#xff0c;不开源而且需要每年交费&#xff0c;这种系统只是在这些工具的基础上套了一层壳…

java文件传输小工具 java17+springboot3+thymeleaf

背景 在和同事工作中经常需要传输文件&#xff0c;但是公网传输太慢&#xff0c;业务方不是计算机专业直接用命令行沟通麻烦。 本小工具通过页面可视化方便用户使用&#xff0c;端口9090&#xff0c;启动默认展示当前登陆本机用户的桌面。 代码开源&#xff1a; https://git…

522. 最长特殊序列 II

题目 给定字符串列表 strs &#xff0c;返回其中最长的特殊序列的长度。如果最长特殊序列不存在&#xff0c;返回 -1。 特殊序列定义如下&#xff1a;该序列为某字符串独有的子序列&#xff08;即不能是其他字符串的子序列&#xff09;。 字符串 s 的子序列可以通过删去字符…