浅谈Mysql 表设计规范

本文首先探讨下数据库设计的三大范式,因为范式只是给出了数据库设计的原则,并没有告诉我们实际操作中应该怎样操作,应该注意什么,所以我们还会谈下实际工作中需要注意的具体操作问题。

三大范式

 

首先放出三大范式内容,然后再进行解释:

第一范式:确保每列的原子性.,如果每列(或者每个属性)都是不可再分的最小数据单元(也称为最小的原子单元),则满足第一范式.;(只要是关系型数据库都满足1NF)

第二范式:如果一个关系满足第一范式,并且除了主键以外的其它列,都依赖于该主键,则满足第二范式.;

第三范式:如果一个关系满足第二范式,并且除了主键以外的其它列都不依赖于主键列,则满足第三范式。

一范式就是属性不可分割。属性是什么?就是表中的字段。不可分割的意思就按字面理解就是最小单位,不能再分成更小单位了。这个字段只能是一个值,不能被拆分成多个字段。不过能不能分割并没有绝对的答案,看需求,也就是看你的设计目标而定。

举例:学生信息组成学生信息表,有姓名、年龄、性别、学号等信息组成。姓名不可拆分吧?所以可以作为该表的一个字段。但我要说这个表要在国外使用呢?人家姓和名要分开,都有特别的意义,所以姓名字段是可拆分的,分为姓字段和名字段。简单来说,一范式是关系数据库的基础,但字段是否真的不可拆分,根据你的设计目标而定。

二范式就是要有主键,要求其他字段都依赖于主键。为什么要有主键?没有主键就没有唯一性,没有唯一性在集合中就定位不到这行记录,所以要主键。其他字段为什么要依赖于主键?因为不依赖于主键,就找不到他们。如果有同学不理解依赖这个词,可以勉强用“相关”这个词代替,也就是说其他字段必须和它们的主键相关。因为不相关的东西不应该放在一行记录里。

举例:学生信息组成学生表,姓名可以做主键么?不能!因为同名的话,就不唯一了,所以需要学号这样的唯一编码才行。那么其他字段依赖于主键是什么意思?就是“张三”同学的年龄和性别等字段,不能存储别人的年龄性别,必须是他自己的,因为张三的学号信息就决定了,这行记录归张三所有,不能给无关人员使用。

三范式就是要消除传递依赖,方便理解,可以看做是“消除冗余”。消除冗余应该比较好理解一些,就是各种信息只在一个地方存储,不出现在多张表中。比如说大学分了很多系(中文系、英语系、计算机系……),这个系别管理表信息有以下字段组成:系编号,系主任,系简介,系架构。那么再回到学生信息表,张三同学的年龄、性别、学号都有了,我能不能把他的系编号,系主任、系简介也一起存着?如果你问三范式,当然不行,因为三范式不同意。因为系编号,系主任、系简介已经存在系别管理表中,你再存入学生信息表,就是冗余了。三范式中说的传递依赖,就出现了。这个时候学生信息表中,系主任信息是不是依赖于系编号了?而这个表的主键可是学号啊!所以按照三范式,处理这个问题的时候,学生表就只能增加一个系编号字段。这样既能根据系编号找到系别信息,又避免了冗余存储的问题。

还有要强调的就是所谓的范式,是用来学习参考的,设计的时候根据情况,未必一定要遵守。因为在数据库数据量特别大,并且访问并发也大的情况下,可能要采用反范式设计来提高数据库响应速度,不过这里不在过多讨论,有兴趣的同学可以到这个网址查看具体内容,该文档针对mysql的优化做了详细说明:https://wenku.baidu.com/view/aa43ecc3aa00b52acfc7ca94.html

实际操作规范(mysql)

  • 表设计

  1. 库名、表名、字段名必须使用小写字母,“_”分割,且名称长度不超过12个字符并且要做到见名知意。

  2. 建议使用InnoDB存储引擎。

  3. 存储精确浮点数必须使用DECIMAL替代FLOAT和DOUBLE。

  4. 建议使用UNSIGNED存储非负数值。

  5. 建议使用INT UNSIGNED存储IPV4。

  6. 整形定义中不添加长度,比如使用INT,而不是INT(4)。

  7. 使用短数据类型,比如取值范围为0-80时,使用TINYINT UNSIGNED。

  8. 不建议使用ENUM类型,使用TINYINT来代替。

  9. 尽可能不使用TEXT、BLOB类型。

  10. VARCHAR(N),N表示的是字符数不是字节数,比如VARCHAR(255),可以最大可存储255个汉字,需要根据实际的宽度来选择N。

  11. VARCHAR(N),N尽可能小,因为MySQL一个表中所有的VARCHAR字段最大长度是65535个字节,进行排序和创建临时表一类的内存操作时,会使用N的长度申请内存。

  12. 表字符集选择UTF8。

  13. 使用VARBINARY存储变长字符串。

  14. 存储年使用YEAR类型,存储日期使用DATE类型,存储时间(精确到秒)建议使用TIMESTAMP类型,因为TIMESTAMP使用4字节,DATETIME使用8个字节。

  15. 建议字段定义为NOT NULL。

  16. 将过大字段拆分到其他表中。

  17. 禁止在数据库中使用VARBINARY、BLOB存储图片、文件等。

  • 索引

  1. 索引名称必须使用小写,非唯一索引必须按照“idx_字段名称_字段名称[_字段名]”进行命名,唯一索引必须按照“uniq_字段名称_字段名称[_字段名]”进行命名。

  2. 索引中的字段数建议不超过5个。

  3. 单张表的索引数量控制在5个以内。

  4. 唯一键由3个以下字段组成,并且字段都是整形时,使用唯一键作为主键。

  5. 没有唯一键或者唯一键不符合4中的条件时,使用自增(或者通过发号器获取)id作为主键。

  6. 唯一键不和主键重复。

  7. 索引字段的顺序需要考虑字段值去重之后的个数,个数多的放在前面。

  8. ORDER BY,GROUP BY,DISTINCT的字段需要添加在索引的后面。

  9. 使用EXPLAIN判断SQL语句是否合理使用索引,尽量避免extra列出现:Using File Sort,UsingTemporary。

  10. UPDATE、DELETE语句需要根据WHERE条件添加索引。

  11. 不建议使用%前缀模糊查询,例如LIKE “%weibo”。

  12. 对长度过长的VARCHAR字段建立索引时,添加crc32或者MD5 Hash字段,对Hash字段建立索引。

  13. 合理创建联合索引(避免冗余),(a,b,c)相当于 (a) 、(a,b) 、(a,b,c)。

  14. 合理利用覆盖索引。

  15. SQL变更需要确认索引是否需要变更并通知DBA。

  • SQL语句

  1. SQL语句中IN包含的值不应过多。

  2. UPDATE、DELETE语句不使用LIMIT。

  3. WHERE条件中必须使用合适的类型,避免MySQL进行隐式类型转化。

  4. SELECT语句只获取需要的字段。

  5. SELECT、INSERT语句必须显式的指明字段名称,不使用SELECT *,不使用INSERTINTO table。

  6. 使用SELECT column_name1, column_name2 FROM table WHERE[condition]而不是SELECT column_name1 FROM table WHERE[condition]和SELECT column_name2 FROM table WHERE [condition]。

  7. WHERE条件中的非等值条件(IN、BETWEEN、<、<=、>、>=)会导致后面的条件使用不了索引。

  8. 避免在SQL语句进行数学运算或者函数运算,容易将业务逻辑和DB耦合在一起。

  9. INSERT语句使用batch提交(INSERT INTO tableVALUES,,……),values的个数不应过多。

  10. 避免使用存储过程、触发器、函数等,容易将业务逻辑和DB耦合在一起,并且MySQL的存储过程、触发器、函数中存在一定的bug。

  11. 避免使用JOIN。

  12. 使用合理的SQL语句减少与数据库的交互次数。

  13. 不使用ORDER BY RAND,使用其他方法替换。

  14. 建议使用合理的分页方式以提高分页的效率。

  15. 统计表中记录数时使用COUNT(*),而不是COUNT(primary_key)和COUNT(1)。

  16. 禁止在从库上执行后台管理和统计类型功能的QUERY。

  • 散表

  1. 每张表数据量建议控制在5000w以下。

  2. 可以结合使用hash、range、lookup table进行散表。

  3. 散表如果使用md5(或者类似的hash算法)进行散表,表名后缀使用16进制,比如user_ff。

  4. 推荐使用CRC32求余(或者类似的算术算法)进行散表,表名后缀使用数字,数字必须从0开始并等宽,比如散100张表,后缀从00-99。

  5. 使用时间散表,表名后缀必须使用特定格式,比如按日散表user_20110209、按月散表user_201102。

文:https://www.yidianzixun.com/article/0GJKj9Xz?title_sn/0&s=9&appid=xiaomi&ver=3.9.6.0&utk=4lxc4q7c

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/439551.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从零开始学视觉Transformer(1):Hello Vision Transformer

Vision Transformer打卡营分享一门很棒的 ViT 课程&#xff0c;课程详细介绍可以看这篇文章&#xff1a; 《Vision Transformer打卡营来啦&#xff01;朱欤博士带你从零玩转ViT爆款模型&#xff01;》

SQLServer中ISNULL、NULLIF和CONVERT函数

效率&#xff1a; UNION和UNION ALL关键字都是将两个结果集合并为一个&#xff0c;但这两者从使用和效率上来说都有所不同。 1、对重复结果的处理&#xff1a;UNION在进行表链接后会筛选掉重复的记录&#xff0c;Union All不会去除重复记录。 2、对排序的处理&#xff1a;Union…

一步步编写操作系统 66 浅析c库函数与系统调用1

本来说好的接下来的工作是要去“丰满”我们的内核&#xff0c;可咱们这种一步一回头的学习方式还得继续啊。其实我了解大家急切写内核的心情&#xff0c;但本书《操作系统真象还原》&#xff08;请大家支持正版&#xff09;的目的不是写一个操作系统就完事了&#xff0c;而是让…

给不会调用C++STL库中二分函数lower_bound,upper_bound,binary_search同学的一些话!

lower_bound算法返回第一个大于等于给定值所在的位置。设置两个指针start和last&#xff0c;其中start指向数组的起始位置&#xff0c;last指向数组末尾位置之后的位置。当start和last指向相同位置时循环结束。mid指向[start,last)区间的中间位置&#xff0c;当中间位置元素值大…

详解IMU标定经典论文:A Robust and Easy to Implement Method for IMU Calibration without External Equipments

本文介绍一篇 关于IMU 标定的经典论文&#xff0c;论文收录于 ICRA14&#xff0c;在论文中作者介绍了如何不适用外部设备标定 IMU 加速度和角速度偏差、尺度系数、轴偏移参数。 论文链接&#xff1a;https://readpaper.com/paper/2021503353、https://readpaper.com/paper/221…

重读经典:《Momentum Contrast for Unsupervised Visual Representation Learning》

MoCo 论文逐段精读【论文精读】这次论文精读李沐博士继续邀请了亚马逊计算机视觉专家朱毅博士来精读 Momentum Contrast&#xff08;MoCo)&#xff0c;强烈推荐大家去看本次的论文精读视频。朱毅博士和上次一样讲解地非常详细&#xff0c;几乎是逐词逐句地讲解&#xff0c;在讲…

【HRBUST - 1623】Relation(思维模拟,拆解字符串)

题干&#xff1a; 一天&#xff0c;ikki在看书的时候发现书上有个类似于家谱状的插图&#xff0c;突然ikki想到了一个有趣的现象&#xff1a;有时候用某个人一连串 的关系描述另一个人的时候&#xff0c;最后可能还是他本身。例如&#xff1a;小明的爸爸的爸爸和小明的爷爷是同…

一步步编写操作系统 67 系统调用的实现1-2 68

接上文&#xff1a; 系统调用的子功能要用eax寄存器来指定&#xff0c;所以咱们要看看有哪些系统调用啦&#xff0c;在linux系统中&#xff0c;系统调用是定义在/usr/include/asm/unistd.h文件中&#xff0c;该文件只是个统一的入口&#xff0c;指向了32位和64位两种版本。在a…

【HDU - 6662】Acesrc and Travel(树形dp,博弈dp)

题干&#xff1a; Acesrc is a famous tourist at Nanjing University second to none. During this summer holiday, he, along with Zhang and Liu, is going to travel to Hong Kong. There are nnspots in Hong Kong, and n−1n−1 bidirectional sightseeing bus routes …

一步步编写操作系统 69 汇编语言和c语言共同协作 70

由于有了上一节的铺垫&#xff0c;本节的内容相对较少&#xff0c;这里给大家准备了两个小文件来实例演示汇编语言和c语言相互调用。 会两种不同语言的人&#xff0c;只是掌握了同一件事物的两种表达方式。人在学习一种新语言时&#xff0c;潜意识里是建立了语言符号与事物形象…

一步步编写操作系统 71 直接操作显卡,编写自己的打印函数71-74

一直以来&#xff0c;我们在往屏幕上输出文本时&#xff0c;要么利用bios中断&#xff0c;要么利用系统调用&#xff0c;这些都是依赖别人的方法。咱们还用过一个稍微有点独立的方法&#xff0c;就是直接写显存&#xff0c;但这貌似又没什么含量。如今我们要写一个打印函数了&a…

【CodeForces - 208C 】Police Station(单源最短路条数,起点终点建图,枚举顶点)

题干&#xff1a; The Berland road network consists of n cities and of m bidirectional roads. The cities are numbered from 1 to n, where the main capital city has number n, and the culture capital — number 1. The road network is set up so that it is possi…

一步步编写操作系统 75 从显卡读取光标位置1

我们在打印字符时&#xff0c;通常都不用指定字符显示的坐标位置&#xff0c;大家也没觉得有什么奇怪&#xff0c;原因是字符是在当前光标的位置处显示的&#xff0c;而且光标的位置会一直更新顺延&#xff0c;我们的字符一直跟着光标走&#xff0c;似乎光标就是字符的导航一样…