运维开发.MySQL.范式与反范式化

运维开发
MySQL.三大范式

- 文章信息 - Author: 李俊才 (jcLee95)
Visit me at CSDN: https://jclee95.blog.csdn.net
My WebSitehttp://thispage.tech/
Email: 291148484@163.com.
Shenzhen China
Address of this article:https://blog.csdn.net/qq_28550263/article/details/139157049
HuaWei:https://bbs.huaweicloud.com/blogs/428259

【介绍】:本文介绍MySQL中常用的三大范式,以及如何反范式化。

在这里插入图片描述


1. 概述

在数据库设计中,范式(Normalization)是用于 减少数据冗余提高数据完整性的规则

MySQL数据库设计中常用的三大范式是:

第一范式(1NF)、第二范式(2NF)和第三范式(3NF)。

2. 第一范式:原子性

2.1 概念

定义:第一范式要求数据库表中的每一列都是原子的,即每个字段都不能再分割。

要求

  • 每个表格的每一列都只能包含一个值;

  • 每个表格的每一列都必须是不可分割的基本数据项。

2.2 示例

假设我们有一个存储学生信息的表 students,其中包含学生的姓名、联系方式等信息。以下是一个不符合第一范式的表设计:

不符合第一范式的表设计

字段名称字段类型是否主键描述
学生IDINT学生唯一标识
姓名VARCHAR学生姓名
联系方式VARCHAR学生联系方式,包括电话和邮箱

在这个设计中,联系方式字段包含了多个信息(电话和邮箱),这违反了第一范式的原子性要求。

为了使表符合第一范式,我们需要将联系方式字段拆分为电话和邮箱两个字段,使每个字段只包含一个不可再次拆分的值。修改后的表设计如下:

符合第一范式的表设计

字段名称字段类型是否主键描述
学生IDINT学生唯一标识
姓名VARCHAR学生姓名
电话VARCHAR学生电话号码
邮箱VARCHAR学生邮箱地址

通过这种方式,每个字段都只包含一个不可再次拆分的值,满足了第一范式的要求。

3. 第二范式:完全依赖主键

3.1 概念

定义:第二范式在满足第一范式的基础上,要求表中的 每个非主键字段都完全依赖于主键,而不是部分依赖。

特点

  • 必须先满足第一范式。

  • 表中的非主键字段必须完全依赖于主键,而不能只依赖于主键的一部分(对于复合主键而言)。

3.2 示例

不符合第二范式的表设计

假设我们有一个学生信息表 students,其中包含学生编号、学生姓名、班级编号和班级名称等信息。表结构如下:

字段名称字段类型是否主键描述
学生编号INT学生唯一标识
学生姓名VARCHAR学生姓名
班级编号INT班级编号×
班级名称VARCHAR班级名称×

在这个设计中,主键只有学生编号一个字段。但是,班级名称 字段只依赖于 班级编号,而不完全依赖于主键 学生编号。这违反了第二范式的要求。

符合第二范式的表设计

为了使表符合第二范式,我们需要将班级编号和班级名称字段从学生信息表中移除,并将其放入一个单独的班级表中。修改后的表设计如下:

学生信息表 students:

字段名称字段类型是否主键描述
学生编号INT学生唯一标识
学生姓名VARCHAR学生姓名
班级编号INT班级编号

班级表 classes:

字段名称字段类型是否主键描述
班级编号INT班级唯一标识
班级名称VARCHAR班级名称

通过这种方式,学生信息表中的每个非主键字段都完全依赖于主键,满足了第二范式的要求。同时,班级名称字段被移到了班级表中,与班级编号形成完全依赖关系。

4. 第三范式:和主键直接相关

4.1 概念

定义:第三范式在满足第二范式的基础上,要求表中的非主键字段之间不能有传递依赖关系

特点

  • 必须先满足第二范式。

  • 表中的非主键字段之间不能有传递依赖,即非主键字段不能依赖于其他非主键字段。

4.2 示例

不符合第三范式的表设计

假设我们有一个学生信息表 students,其中包含学生编号、学生姓名、班级编号、班级名称和班主任等信息。表结构如下:

字段名称字段类型是否主键描述
学生编号INT学生唯一标识
学生姓名VARCHAR学生姓名
班级编号INT班级编号
班级名称VARCHAR班级名称
班主任VARCHAR班主任姓名

在这个设计中,虽然每个非主键字段都完全依赖于主键学生编号,满足了第二范式,但是班级名称和班主任字段依赖于班级编号字段,存在传递依赖关系。这违反了第三范式的要求。

符合第三范式的表设计

为了使表符合第三范式,我们需要将班级编号、班级名称和班主任字段从学生信息表中移除,并将其放入一个单独的班级表中。修改后的表设计如下:

学生信息表 students

字段名称字段类型是否主键描述
学生编号INT学生唯一标识
学生姓名VARCHAR学生姓名
班级编号INT班级编号

班级表 classes

字段名称字段类型是否主键描述
班级编号INT班级唯一标识
班级名称VARCHAR班级名称
班主任VARCHAR班主任姓名

通过这种方式,学生信息表中的非主键字段不再有传递依赖关系,满足了第三范式的要求。班级名称和班主任字段被移到了班级表中,与班级编号形成直接依赖关系。

5. 反范式化

5.1 概念

对于频繁查询的数据,如果严格遵循范式化设计,可能需要进行多表连接操作,导致查询性能下降

反范式化Denormalization)是一种在特定情况下 违反范式化规则 的数据库设计策略。它通过在表中引入冗余数据,可以避免多表连接,提高查询速度。

反范式化的目的是在数据库设计中 权衡范式化带来的好处(数据一致性、减少冗余)和查询性能之间的平衡。有时,为了获得更好的查询性能,我们可能需要在表中引入一些冗余数据,从而违反范式化规则。

5.2 应用场景

反范式化设计并不适用于所有情况。需要根据具体的业务需求、查询模式和性能要求来决定是否采用反范式化。

  1. 频繁查询的数据

对于频繁查询的数据,如果严格遵循范式化设计,可能需要进行多表连接操作,导致查询性能下降。通过在表中引入冗余数据,可以避免多表连接,提高查询速度。

  1. 数据仓库和报表系统

在数据仓库和报表系统中,数据通常是只读的,主要用于复杂的分析和统计查询。这种情况下,反范式化设计可以大大简化查询语句,提高查询性能。

  1. 需要快速响应的实时系统

对于需要快速响应的实时系统,如在线交易系统,反范式化设计可以减少查询时间,提供更好的用户体验。

  1. 数据冗余与数据一致性权衡

在某些情况下,数据冗余可能比数据一致性更重要。例如,在分布式系统中,为了提高可用性和性能,可能需要在不同的节点上保存相同的数据副本。

5.3 实现方式

  1. 在表中添加冗余字段

通过在表中添加冗余字段,可以避免多表连接操作。例如,在学生信息表中添加班级名称字段,虽然这个字段可以通过连接班级表获得,但直接在学生信息表中保存可以提高查询速度。

  1. 创建预聚合表

预聚合表是为了满足特定查询需求而创建的冗余表。它通过预先计算和存储聚合数据(如总和、平均值等)来加速查询。例如,创建一个销售额汇总表,存储按日期、产品类别等维度汇总的销售数据。

  1. 垂直分割

将一个大表拆分成多个小表,每个小表包含部分字段。这样可以减少单表的数据量,提高查询速度。例如,将用户信息表拆分为基本信息表和详细信息表。

5.4 示例

假设我们有一个电商系统,包含订单表(orders)和商品表(products)。

订单表 orders:

字段名称字段类型是否主键描述
order_idINT订单唯一标识
user_idINT用户ID
product_idINT商品ID
quantityINT购买数量

商品表 products:

字段名称字段类型是否主键描述
product_idINT商品唯一标识
product_nameVARCHAR商品名称
priceDECIMAL商品价格

如果我们需要经常查询订单的总金额,可以考虑在订单表中添加一个冗余字段 total_amount,用于存储订单的总金额。这样,我们就可以直接从订单表中获取总金额,而不需要每次都连接商品表并进行计算。

反范式化后的订单表 orders:

字段名称字段类型是否主键描述
order_idINT订单唯一标识
user_idINT用户ID
product_idINT商品ID
quantityINT购买数量
total_amountDECIMAL订单总金额

在这个设计中,我们引入了冗余字段 total_amount,它可以通过触发器或应用程序在插入或更新订单时自动计算和更新。
查询订单总金额的SQL语句从原来的:

SELECT o.order_id, SUM(p.price * o.quantity) AS total_amount
FROM orders o
JOIN products p ON o.product_id = p.product_id
GROUP BY o.order_id;

这条SQL查询语句计算每个订单的总金额。这里使用了JOIN操作来连接两个表:ordersproducts

在原始的设计中,为了计算每个订单的总金额,我们需要从orders表和products表中提取数据,并通过JOIN操作将这两个表连接起来。这是因为订单表中只存储了商品的ID和购买数量,而商品的价格存储在商品表中。因此,为了得到每个订单的总金额,必须将订单中的每个商品的购买数量与其价格相乘,然后对一个订单中的所有商品进行求和。

可以看到,这种设计虽然在数据存储上是范式化的(避免了数据冗余),但在查询性能上可能不是最优的,特别是在数据量大或查询频繁的情况下。每次查询订单的总金额时,都需要执行计算密集型的JOIN操作和多次乘法及求和操作,这会增加数据库的负载和响应时间。

为了优化这种情况,可以通过在orders表中添加一个冗余字段total_amount来存储每个订单的总金额。这样,每当订单被创建或更新时,应用程序或数据库的触发器就可以立即计算该订单的总金额,并将这个值存储在total_amount字段中。这意味着:

  1. 插入或更新操作时的计算:在订单创建或商品数量更新时,系统需要计算总金额并更新total_amount字段。这个计算只在订单数据变更时发生,而不是在每次查询时都进行。

  2. 查询操作的简化:由于每个订单的总金额已经预先计算并存储好,因此查询订单总金额时,只需直接读取total_amount字段的值。这避免了复杂的JOIN操作和运行时的计算,从而显著提高了查询效率。

因此,查询语句可以从复杂的 联表查询 简化为 直接 查询单表:

SELECT order_id, total_amount
FROM orders;

通过反范式化设计,我们避免了多表连接,提高了查询性能。但同时,我们需要在插入或更新订单时额外维护 total_amount 字段的值,以保证数据一致性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/19186.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

spdlog日志库源码:线程池thread_pool

线程池 线程池本质上一组事先创建的子线程,用于并发完成特定任务的机制,避免运行过程中频繁创建、销毁线程,从而降低程序运行效率。通常,线程池主要涉及到以下几个方面问题: 如何创建线程池?线程池如何执…

Ubuntu22.04之解决:登录计算机的密码与登录密钥环里的密码不再匹配(二百三十四)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒…

微信网页版登录插件v1.1.1

说到如今的微信客户端,大家肯定会有很多提不完的意见或者建议。比如这几年体积越来越大,如果使用频率比较高,那占用空间就更离谱了。系统迷见过很多人电脑C盘空间爆满,都是由于微信PC版造成的。 而且,它还加了很多乱七…

15、Spring系统-AOP

ProxyFactory选择cglib或jdk动态代理原理 ProxyFactory在生成代理对象之前需要决定到底是使用JDK动态代理还是CGLIB技术: 代理对象创建过程 JdkDynamicAopProxy 在构造JdkDynamicAopProxy对象时,会先拿到被代理对象自己所实现的接口,并且…

powershell 配合aria2实现简单的图片爬取

powershell 配合aria2实现简单的图片爬取 01 前言 现如今,提到爬虫,令人不得不提到Python,确实简单,也强大,到处都可以找到教程。故而今天换换口味,用powershell来实现,配合aria2的强大下载功…

目标检测 | R-CNN、Fast R-CNN与Faster R-CNN理论讲解

☀️教程:霹雳吧啦Wz ☀️链接:https://www.bilibili.com/video/BV1af4y1m7iL?p1&vd_sourcec7e390079ff3e10b79e23fb333bea49d 一、R-CNN R-CNN(Region with CNN feature)是由Ross Girshick在2014年提出的,在PAS…

Qt 配置Eigen矩阵库 - 并简单测试

Qt 配置Eigen矩阵库 - 并简单测试 引言一、在Qt中配置Eigen二、低通Demo源码三、参考链接以及其他 引言 Eigen是一个开源的C模板库,提供了线性代数和矩阵运算的功能。它被设计为一个高性能、可扩展和易用的库,可以用于科学计算、机器学习和计算机图形学等…

服务器感染了. rmallox勒索病毒,如何确保数据文件完整恢复?

导言: 近年来,随着信息技术的飞速发展,网络安全问题日益凸显。其中,勒索病毒作为一种严重的网络威胁,对个人和企业数据造成了巨大的威胁。本文将重点介绍.rmallox勒索病毒的特点、传播途径以及应对策略,旨…

【LeetCode算法】第94题:二叉树的中序遍历

目录 一、题目描述 二、初次解答 三、官方解法 四、总结 一、题目描述 二、初次解答 1. 思路:二叉树的中序遍历。访问二叉树的左子树,再访问二叉树的根节点,最后访问二叉树的右叉树。 2. 代码: void order(struct TreeNode* r…

文心智能体平台丨创建你的四六级学习小助手

引言 在人工智能飞速发展的今天,我们迎来了文心智能体平台。该平台集成了最先进的人工智能技术,旨在为用户提供个性化、高效的学习辅助服务。今天,我们将向大家介绍如何利用文心智能体平台,创建一个专属于你的四六级学习小助手。…

Scikit-Learn随机森林回归

Scikit-Learn随机森林回归 1、随机森林1.1、集成学习1.2、Bagging方法1.3、随机森林算法1.4、随机森林的优缺点2、Scikit-Learn随机森林回归2.1、Scikit-Learn随机森林回归API2.2、随机森林回归实践(加州房价预测)1、随机森林 随机森林是一种由决策树构成的集成算法,它在大多…

初探Flask:Pycharm社区版创建Flask项目

文章目录 一、创建工程二、引入Flask库1.使用命令行安装Flask2.在PyCharm中安装Flask 三、创建Flask框架基本文件四、运行项目 本文将带您一步步创建一个简单的Flask项目,包括设置Python环境、安装Flask库以及创建基本的项目结构。 一、创建工程 首先,确…

云原生网关 MSE-Higress

云原生网关 MSE-Higress 什么是云原生网关MSEMSE测评产品文档产品能力产品控制台 MSE与其他网关 什么是云原生网关MSE 在体验云原生网关 MSE-Higress功能之前,先了解一下什么是云原生网关 MSE,简单的说就是MSE就是遵循开源 Ingress/Gateway API 标准的下…

【java程序设计期末复习】chapter2 基本数据类型与数组

基本数据类型与数组 一,标识符和关键字 标识符 定义 用来标识类名、变量名、方法名、类型名、数组名、文件名的有效字符序列称为标识符,简单地说,标识符就是一个名字 。 性质 (1)标识符由字母、下划线、美元符号和…

008-Linux后台进程管理(作业控制:、jobs、fg、bg、ctrl + z、nohup)

文章目录 前言 1、& 2、ctrl z 3、jobs 4、fg:将后台进程调到前台执行 5、bg:将一个暂停的后台进程变为执行 6、&和nohup 总结 前言 有时候我们需要将一个进程放到后台去运行,或者将后台程序切换回前台,这时候就…

03 Prometheus+Grafana可视化配置

03 PrometheusGrafana可视化配置 大家好,我是秋意零。接上篇Prometheus入门安装教程 grafana官网下载安装包比较慢,如果没有魔法。可关注公众号【秋意零】回复101获取 Grafana官网下载:https://grafana.com/grafana/download 这里采用的二进制…

使用C语言实现学生信息管理系统

前言 在我们实现学生信息管理系统的过程中,我们几乎会使用到C语言最常用最重要的知识,对于刚学习完C语言的同学来说是一次很好的巩固机会,其中还牵扯到数据结果中链表的插入和删除内容。 实现学生信息管理系统 文件的创建与使用 对于要实现…

【小技巧】Keil C51 报错“*** ERROR L107: ADDRESS SPACE OVERFLOW****

软件:Keil C51 C51V961版本 电脑:Win10 报错提示: compiling System.c... linking... *** ERROR L107: ADDRESS SPACE OVERFLOW SPACE: DATA SEGMENT: ?DT?LCD LENGTH: 0034H Program Size: data174.0 xdata17 code1205 Target not create…

100个投资者99个选择使用这款EA,WeTrade发现1个事实

为什么100个投资者会有99个选择使用这款EA,是因为这款EA能提供两个版本吗?是因为能控制风险吗?都不是,WeTrade发现1个事实才是这么多投资者选择的原因,那就是能实现100%的盈利率。 我们都知道外汇狙击手EA提供两种版本,分别是标…

MVC和Filter

目录 MVC和三层架构模型的联系 Filter 概念 作用 应用场景 步骤 简单入门 MVC和三层架构模型的联系 m-->model即模型是三层架构模型的业务层(service)和持久层(dao) v-->views即视图是三层架构模型的表现层(web) c-->controller即控制器也…