SQL中的数据类型和规范化,助力数据存储优化

大家好,目前优化数据存储对于获得良好的性能始终至关重要,选择合适的数据类型并应用正确的规范化过程对于决定其性能至关重要。本文将介绍最重要和最常用的数据类型和规范化过程。

一、SQL中的数据类型

SQL中主要有两种数据类型:字符串和数字。除此之外,还有其他数据类型,如布尔型、日期和时间、数组、区间、XML等。

1.字符串数据类型

这些数据类型用于存储字符串。字符串通常作为数组数据类型实现,并包含一系列元素,通常是字符。

(1) CHAR(n)

它是一个固定长度的字符串,可以包含字符、数字和特殊字符。n表示它可以容纳的字符串的最大长度(以字符为单位)。

它的最大范围是从0到255个字符,这种数据类型的问题是,即使实际字符串的长度小于指定的长度,它也会占用全部指定的空间。额外的字符串长度会用额外的内存空间填充。

(2) VARCHAR(n)

Varchar与Char类似,但可以支持大小可变的字符串,并且没有填充。该数据类型的存储大小等于字符串的实际长度。

它最多可以存储65535个字符。由于其大小可变的特性,它的性能不如CHAR数据类型好。

(3) BINARY(n)

它类似于CHAR数据类型,但只接受二进制字符串或二进制数据。它可以用于存储图像、文件或任何序列化对象。还有另一种数据类型VARBINARY(n),它类似于VARCHAR数据类型,但也只接受二进制字符串或二进制数据。

(4) TEXT(n)

这种数据类型也用于存储字符串,但最大大小为65535字节。

(5) BLOB(n)

代表二进制大对象,可以容纳最多65535字节的数据。

除此之外,还有其他数据类型,如LONGTEXT和LONGBLOB,它们可以存储更多字符。

2.数字数据类型

(1) INT()

它可以存储一个4字节(32位)的整数数字。这里的n表示显示宽度,最大可以达到255。它指定了用于显示整数值的最小字符数。

范围:

  • a) -2147483648<=Signed INT<=2147483647

  • b) 0<=Unsigned INT<=4294967295

(2) BIGINT()

它可以存储一个大小为64位的大整数。

范围:

  • a) -9223372036854775808<=Signed BIGINT<=9223372036854775807

  • b) 0<=Unsigned BIGINT<=18446744073709551615

(3) FLOAT():

它可以存储浮点数,其小数点位以一定精度近似。它存在一些小的舍入误差,因此在需要精确精度的情况下不适用。

(4) DOUBLE():

这种数据类型表示双精度浮点数。与FLOAT数据类型相比,它可以存储具有更高精度的小数值。

(5) DECIMAL(n, d):

该数据类型表示精确的十进制数,精度固定,用d表示。参数d指定小数点后的位数,参数n表示数字的大小。d的最大值为30,其默认值为0。

3.一些其他数据类型

(1) BOOLEAN

这种数据类型只存储True或False两种状态。它用于执行逻辑操作。

(2) ENUM

它代表枚举。它允许你从预定义选项列表中选择一个值。它还能确保存储的值仅来自指定的选项。

例如,考虑一个只能是“红色”、“绿色”或“蓝色”的属性颜色。当我们将这些值放入ENUM中时,颜色的值只能是这些指定的颜色之一。

(3) XML

XML代表可扩展标记语言(eXtensible Markup Language)。这种数据类型用于存储XML数据,XML数据用于结构化数据表示。

(4) AutoNumber

它是一个整数,当每条记录被添加时,它会自动递增其值。它用于生成唯一或连续的数字。

(5) Hyperlink

它可以存储文件和网页的超链接。

关于SQL数据类型的讨论到此为止。其他数据类型还有很多,但本文所讨论的是最常用的数据类型。

二、SQL中的规范化

规范化是从数据库中移除冗余、不一致和异常的过程。冗余表示相同数据的重复值存在,而数据库中的不一致表示相同数据以多种格式存在于多个表中。

数据库异常可以定义为数据库中不应存在的任何突然变化或不一致。这些变化可能是由于各种原因引起的,例如数据损坏、硬件故障、软件错误等。异常情况可能导致严重后果,如数据丢失或不一致,所以尽快检测和修复异常情况至关重要,主要有三种类型的异常情况。本文将简要讨论每种类型。

  • 插入异常:

当新插入的行在表中导致不一致时,就会发生插入异常。例如,我们想要将一个员工添加到组织中,但是他的部门没有分配给他。那么我们就无法将该员工添加到表中,这就产生了一个插入异常。

  • 删除异常:

当我们想要从表中删除某些行,并且还需要删除数据库中的其他数据时,就会发生删除异常。

  • 更新异常:

当我们想要更新某些行并导致数据库的数据不一致时,就会发生这种异常。

规范化过程包含一系列准则,可使数据库设计高效、优化,并且不含冗余和异常。有几种常见的规范化形式,如第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、BCNF等。

1. 第一范式(1NF)

第一范式确保表中不包含复合或多值属性。这意味着单个属性中只有一个值。如果每个属性都是单值的,那么关系就符合第一范式。

例如:

图片

在表1中,属性STUD_PHONE包含多个电话号码。但是在表2中,该属性被分解为第一范式。

2. 第二范式(2NF)

表格必须符合第一范式,并且关系中不能存在任何部分依赖关系。部分依赖意味着非主属性(不是候选键的一部分的属性)部分依赖于候选键的任何一个真子集。为了使关系符合第二范式,非主属性必须完全依赖于整个候选键。

例如,考虑一个名为Employee的表,具有以下属性:

EmployeeID (Primary Key)
ProjectID (Primary Key)
EmployeeName
ProjectName
HoursWorked

在这里,EmployeeID和ProjectID共同构成主键。不过,你可以注意到EmployeeName和EmployeeID之间存在部分依赖关系。这意味着EmployeeName只依赖于主键的一部分(即EmployeeID)。要实现完全依赖,EmployeeName必须同时依赖于EmployeeID和ProjectID。因此,这违反了第二范式的原则。

为了使这种关系符合第二范式,我们必须将表拆分成两个独立的表。第一个表包含所有雇员的详细信息,第二个表包含所有项目的详细信息。

因此,Employee表具有以下属性:

EmployeeID (Primary Key)
EmployeeName

Project表具有以下属性:

Project ID (Primary Key)
Project Name
Hours Worked

现在可以看到,通过创建两个独立的表,部分依赖关系已经被消除。而且两个表的非主属性依赖于完整的主键集合。

3. 第三范式(3NF)

在第二范式之后,关系仍然可能存在更新异常。如果我们只更新了一个元组而不更新其他元组,就会出现这种情况。这将导致数据库的不一致性。

第三范式的条件是表应该符合第二范式,并且非主属性不存在传递依赖关系。传递依赖发生在非主属性不直接依赖于主属性,而是依赖于另一个非主属性的情况下。主属性是候选键的一部分。

考虑一个关系R(A,B,C),其中A是主键,B和C是非主属性。假设A→B和B→C是两个函数依赖关系,那么A→C就是传递依赖关系。这意味着属性C不是由属性A直接确定的。B在它们之间起中间人的作用。

如果一个表存在传递依赖关系,那么我们可以通过将表拆分为独立的关系来将其转化为第三范式。

4.Boyce-Codd范式

尽管第二范式和第三范式消除了大部分冗余,但仍然没有完全消除冗余。如果函数依赖关系的左侧不是候选键或超键,就可能存在冗余。候选键由主属性形成,超级键是候选键的超集。为了解决这个问题,还存在另一种类型的函数依赖关系,称为Boyce-Codd范式(BCNF)。

对于一个表来说,要达到BCNF,函数依赖关系的左侧必须是候选键或超键。例如,对于一个函数依赖关系X→Y,X必须是候选键或超键。

考虑一个包含以下属性的Employee表:

  1. 员工ID(主键)

  2. 员工姓名

  3. 部门

  4. 部门负责人

图片

EmployeeID是唯一标识每一行的主键。Department属性表示特定员工所在的部门,而Department Head属性表示担任该特定部门负责人的员工的EmployeeID。

现在,我们将检查这个表是否符合BCNF。条件是函数依赖关系的左侧必须是超键。下面是该表的两个函数依赖关系。

  • 函数依赖关系1:员工ID→员工姓名,部门,部门负责人

  • 函数依赖关系2:部门→部门负责人

对于FD1,员工ID是主键,也是超键。但对于FD2,部门不是超键,因为多个员工可能属于同一个部门。

因此,这个表违反了BCNF的条件。为了满足BCNF的属性,我们需要将该表拆分为两个独立的表:Employee表和Department表。Employee表包含员工ID、员工姓名和部门,而Department表则包含部门和部门负责人。

图片

图片

现在我们可以看到,在这两个表中,所有的函数依赖关系都依赖于主键,即不存在非三维依赖关系。

 

综上,本文讨论了SQL中最常用的数据类型以及数据库管理系统中重要的规范化技术,在设计数据库系统时,我们的目标是使其具有可扩展性,最小化冗余并确保数据完整性。通过选择适当的数据类型,我们可以在存储、精度和内存消耗之间取得微妙的平衡,同时规范化过程有助于消除数据异常并使数据库模式更有组织性。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/144943.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

小程序action-sheet结合自定义tabbar显示

要实现此效果&#xff0c;遇到的问题&#xff1a;背景在电脑端调试的情况正常的情况下&#xff0c;手机端点击事件工单&#xff0c;返回回来的时候action-sheet卡住在屏幕上&#xff0c;点击遮罩层都不消失。更奇怪的是 这种情况并不是每次发生&#xff0c;而是有时候发生&…

给VSCode插上一双AI的翅膀

#AI编程助手哪家好&#xff1f;DevChat“真”好用# 文章目录 前言一、安装DevChat1.1、访问地址1.2、注册1.3、在VSCode里安装DevChat插件1.3.1、未安装状态1.3.2、已安装状态 二、设置Access Key2.1. 点击左下角管理&#xff08;“齿轮”图标&#xff09;—命令面板&#xff…

DNS域名解析服务

1.概述 1.1.产生原因 IP 地址:是互联网上计算机唯一的逻辑地址&#xff0c;通过IP 地址实现不同计算机之间的相互通信&#xff0c;每台联网计算机都需要通过I 地址来互相联系和分别&#xff0c;但由于P 地址是由一串容易混淆的数字串构成&#xff0c;人们很难记忆所有计算机的…

【7】Spring Boot 3 集成组件:缓存组件 spring cache + spring data redis

目录 【7】Spring Boot 3 集成组件&#xff1a;缓存组件 spring cache spring data redis什么是缓存抽象声明式注解JSR-107对应SpEL上下文数据 引入依赖cache 支持的缓存类型缓存类型配置NONESIMPLEREDIS自定义配置 CAFFEINE Hazelcast...总结 个人主页: 【⭐️个人主页】 需要…

企业邮箱认证指南:安全与高效的邮箱认证方法

企业邮箱是专门为企业提供的电子邮件服务&#xff0c;安全性和专业性更高。在开始使用企业邮箱之前&#xff0c;很多人会有一些问题&#xff0c;比如企业邮箱需要认证吗、如何开通企业邮箱&#xff0c;以及哪款企业邮箱好。 1、企业邮箱在使用前需要认证吗&#xff1f; 答案是肯…

esp-01刷固件/下载软件到内部单片机的方法

此文章为转载&#xff0c;非原创 一、准备 需要准备三个东西&#xff1a; 1.esp模块。ESP-01 和 ESP-01s 的引脚及 flash 容量基本完全兼容&#xff0c;只是内部硬件设计粗糙与否的区别&#xff0c;所以理论上都适用。 2.官方固件。此部分可以从安信可官方教程中下载&#xff0…

MySQL库的操作『增删改查 ‖ 编码问题 ‖ 备份与恢复』

✨个人主页&#xff1a; 北 海 &#x1f389;所属专栏&#xff1a; MySQL 学习 &#x1f383;操作环境&#xff1a; CentOS 7.6 阿里云远程服务器 &#x1f381;软件版本&#xff1a; MySQL 5.7.44 文章目录 1.创建数据库2.数据库中的编码问题2.1.字符集与校验集2.3.支持的字符…

数据结构:AVLTree的插入和删除的实现

个人主页 &#xff1a; 个人主页 个人专栏 &#xff1a; 《数据结构》 《C语言》《C》 文章目录 前言一、AVLTree二、AVLTree的插入插入新增节点调整平衡因子旋转左单旋(新增节点位于较高右子树的右侧)右单旋(新增节点位于较高左子树的左侧)右左双旋(新增节点在较高右子树的左子…

Unity中Shader雾效的实现方法三

文章目录 前言一、声明雾效所需要的内置变体二、在 v2f 中&#xff0c;定义 float4 worldPos &#xff1a;TEXCOORD1三、在顶点着色器中添加&#xff0c;会自动取o.worldPos.w裁剪空间下的坐标z值.在这里插入图片描述 四、在片元着色器&#xff0c;添加以下两句话1、UNITY_EXTR…

三江城115m²3室2厅2卫,现代简约不单是居所更是对生活的向往。福州中宅装饰,福州装修

【前言】 简洁有力&#xff0c;静默无声。 以简约精致的方式&#xff0c;展现现代都市生活&#xff1b; 经典不因潮流褪色&#xff0c;不为悦人只为悦己。 项目信息 项目名称 | 三江城 设计地址 | 福建福州 项目面积 | 115㎡ 项目户型 | 3室2厅 设计风格 | 现代简约 全…

LeetCode(23)找出字符串中第一个匹配项的下标【数组/字符串】【简单】

目录 1.题目2.答案3.提交结果截图 链接&#xff1a; 找出字符串中第一个匹配项的下标 1.题目 给你两个字符串 haystack 和 needle &#xff0c;请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标&#xff08;下标从 0 开始&#xff09;。如果 needle 不是 hays…

黑马程序员微服务第四天课程 分布式搜索引擎1

分布式搜索引擎01 – elasticsearch基础 0.学习目标 1.初识elasticsearch 1.1.了解ES 1.1.1.elasticsearch的作用 elasticsearch是一款非常强大的开源搜索引擎&#xff0c;具备非常多强大功能&#xff0c;可以帮助我们从海量数据中快速找到需要的内容 例如&#xff1a; …

2016Outlook显示正在启动无法进入Outlook

2016Outlook显示正在启动无法进入Outlook 故障现象&#xff1a; 因上次非正常关闭&#xff0c;导致Outlook启动时&#xff0c;一直处于启动界面&#xff0c;无法进入主界面正常工作 故障截图&#xff1a; 故障原因&#xff1a; 数据文件异常导致 解决方案&#xff1a; 1、关…

YOLO改进系列之注意力机制(CoTAttention模型介绍)

简介 CoTAttention网络是一种用于多模态场景下的视觉问答&#xff08;Visual Question Answering&#xff0c;VQA&#xff09;任务的神经网络模型。它是在经典的注意力机制&#xff08;Attention Mechanism&#xff09;上进行了改进&#xff0c;能够自适应地对不同的视觉和语言…

趣学python编程 (一、计算机基础知识科普)

未来是高度科技化和智能化的时代。过去不识字的叫“文盲”&#xff0c;如今不懂点计算机知识&#xff0c;则可能是新时代的“文盲”。不论从事什么行业&#xff0c;了解下计算机和编程都是有益的。Python 连续多年占据最受欢迎的编程语言榜首&#xff0c;未来Python有机会成为像…

wps、office插入的复选框无法设置字体及大小?教你一招

插入的表单无法设置字体及大小 脑瓜子嗡嗡的吧&#xff1f;&#xff01;&#xff01; 如果没有强制要求&#xff0c;建议就换成开发工具下的复选框吧 如果一定要用上面这种&#xff0c;就自己做一个吧&#xff0c;设置方法如下 制作方法&#xff1a;插入选项卡插入窗体的复选框…

kickstarter数据采集

搜索界面字段如下&#xff1a; 详情界面字段如下&#xff1a; 评论页面采集&#xff1a; 需要的可以找我沟通

【云原生-Kurbernets篇】Kurbernets集群的调度策略

调度 一、Kurbernetes的list-watch机制1.1 list-watch机制简介1.2 创建pod的流程&#xff08;结合list-watch机制&#xff09; 二、Scheduler的调度策略2.1 简介2.2 预选策略&#xff08;predicate&#xff09;2.3 优选策略&#xff08;priorities&#xff09; 三、标签管理3.1…

基于Gin+Gorm框架搭建MVC模式的Go语言企业级后端系统

文/朱季谦 环境准备&#xff1a;安装Gin与Gorm 本文搭建准备环境&#xff1a;GinGormMySql。 Gin是Go语言的一套WEB框架&#xff0c;在学习一种陌生语言的陌生框架&#xff0c;最好的方式&#xff0c;就是用我们熟悉的思维去学。作为一名后端Java开发&#xff0c;在最初入门…

【AI视野·今日NLP 自然语言处理论文速览 第六十五期】Mon, 30 Oct 2023

AI视野今日CS.NLP 自然语言处理论文速览 Mon, 30 Oct 2023 Totally 67 papers &#x1f449;上期速览✈更多精彩请移步主页 Daily Computation and Language Papers An Approach to Automatically generating Riddles aiding Concept Attainment Authors Niharika Sri Parasa,…