第一百零四期:搞清这些陷阱,NULL和三值逻辑再也不作妖

NULL 用于表示缺失的值或遗漏的未知数据,不是某种具体类型的值。数据表中的 NULL 值表示该值所处的字段为空,值为 NULL 的字段没有值,尤其要明白的是:NULL 值与 0 或者空字符串是不同的。

作者:youzhibing2904

 

NULL

NULL 用于表示缺失的值或遗漏的未知数据,不是某种具体类型的值。数据表中的 NULL 值表示该值所处的字段为空,值为 NULL 的字段没有值,尤其要明白的是:NULL 值与 0 或者空字符串是不同的。

两种NULL

这种说法大家可能会觉得很奇怪,因为 SQL 里只存在一种 NULL 。然而在讨论 NULL 时,我们一般都会将它分成两种类型来思考:“未知”(unknown)和“不适用”(not applicable,inapplicable)。

以“不知道戴墨镜的人眼睛是什么颜色”这种情况为例,这个人的眼睛肯定是有颜色的,但是如果他不摘掉眼镜,别人就不知道他的眼睛是什么颜色。这就叫作未知。

而“不知道冰箱的眼睛是什么颜色”则属于“不适用”。因为冰箱根本就没有眼睛,所以“眼睛的颜色”这一属性并不适用于冰箱。“冰箱的眼睛的颜色”这种说法和“圆的体积”“男性的分娩次数”一样,都是没有意义的。

平时,我们习惯了说“不知道”,但是“不知道”也分很多种。“不适用”这种情况下的 NULL ,在语义上更接近于“无意义”,而不是“不确定”。

这里总结一下:“未知”指的是“虽然现在不知道,但加上某些条件后就可以知道”;而“不适用”指的是“无论怎么努力都无法知道”。

关系模型的发明者 E.F. Codd 最先给出了这种分类。下图是他对“丢失的信息”的分类。

“IS NULL”而非“= NULL”?

为什么必须写成“IS NULL”,而不是“= NULL”?我相信不少人有这样的困惑吧,尤其是相信刚学 SQL 的小伙伴。我们来看个具体的案例,假设我们有如下表以及数据:

DROP TABLE IF EXISTS t_sample_null; 
CREATE TABLE t_sample_null ( id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键', name VARCHAR(50) NOT NULL COMMENT '名称', remark VARCHAR(500) COMMENT '备注', primary key(id) 
) COMMENT 'NULL样例'; INSERT INTO t_sample_null(name, remark) 
VALUES('zhangsan', '张三'),('李四', NULL); 

我们要查询备注为 NULL 的记录(为 NULL 这种叫法本身是不对的,只是我们日常中已经叫习惯了,具体往下看),怎么查,很多新手会写出这样的 SQL:

- SQL 不报错,但查不出结果 
SELECT * FROM t_sample_null WHERE remark = NULL; 

执行时不报错,但是查不出我们想要的结果, 这是为什么 ?这个问题我们先放着,我们往下看。

三值逻辑

这个三值逻辑不是三目运算,指的是三个逻辑值,有人可能有疑问了,逻辑值不是只有真(true)和假(false)吗,哪来的第三个?

说这话时我们需要注意所处的环境,在主流的编程语言中(C、JAVA、Python、JS等)中,逻辑值确实只有 2 个,但在 SQL 中却存在第三个逻辑值:unknown。这有点类似于我们平时所说的:对、错、不知道。

逻辑值 unknown 和作为 NULL 的一种的 UNKNOWN (未知)是不同的东西。前者是明确的布尔型的逻辑值,后者既不是值也不是变量。

为了便于区分,前者采用小写字母 unknown ,后者用大写字母 UNKNOWN 来表示。为了让大家理解两者的不同,我们来看一个 x=x 这样的简单等式。x 是逻辑值 unknown 时,x=x 被判断为 true ,而 x 是 UNKNOWN 时被判断为 unknown 。

- 这个是明确的逻辑值的比较 
unknown = unknown → true -- 这个相当于NULL = NULL 
UNKNOWN = UNKNOWN → unknown 

三值逻辑的逻辑值表

NOT:

AND:

OR:

图中蓝色部分是三值逻辑中独有的运算,这在二值逻辑中是没有的。其余的 SQL 谓词全部都能由这三个逻辑运算组合而来。从这个意义上讲,这个几个逻辑表可以说是 SQL 的母体(matrix)。

NOT 的话,因为逻辑值表比较简单,所以很好记;但是对于 AND 和 OR,因为组合出来的逻辑值较多,所以全部记住非常困难。为了便于记忆,请注意这三个逻辑值之间有下面这样的优先级顺序:

  • AND 的情况:false > unknown > true;
  • OR 的情况:true > unknown > false。

优先级高的逻辑值会决定计算结果。例如 true AND unknown ,因为 unknown 的优先级更高,所以结果是 unknown 。而 true OR unknown 的话,因为 true 优先级更高,所以结果是 true 。

记住这个顺序后就能更方便地进行三值逻辑运算了。特别需要记住的是,当 AND 运算中包含 unknown 时,结果肯定不会是 true (反之,如果AND 运算结果为 true ,则参与运算的双方必须都为 true )。

-- 假设 a = 2, b = 5, c = NULL,下列表达式的逻辑值如下 a < b AND b > c  → unknown 
a > b OR b < c   → unknown 
a < b OR b < c   → true 
NOT (b <> c)     → unknown 

“IS NULL” 而非 “= NULL”

我们再回到问题:为什么必须写成“IS NULL”,而不是“= NULL”?

对 NULL 使用比较谓词后得到的结果总是 unknown 。而查询结果只会包含 WHERE 子句里的判断结果为 true 的行,不会包含判断结果为 false 和 unknown 的行。不只是等号,对 NULL 使用其他比较谓词,结果也都是一样的。

所以无论 remark 是不是 NULL ,比较结果都是 unknown ,那么永远没有结果返回。以下的式子都会被判为 unknown:

-- 以下的式子都会被判为 unknown

-- 以下的式子都会被判为 unknown 
= NULL 
> NULL 
< NULL 
<> NULL 
NULL = NULL 

那么,为什么对 NULL 使用比较谓词后得到的结果永远不可能为真呢?

这是因为,NULL 既不是值也不是变量。NULL 只是一个表示“没有值”的标记,而比较谓词只适用于值。

因此,对并非值的 NULL 使用比较谓词本来就是没有意义的。“列的值为 “NULL ”、“NULL 值” 这样的说法本身就是错误的。因为 NULL不是值,所以不在定义域(domain)中。

相反,如果有人认为 NULL 是值,那么我们可以倒过来想一下:它是什么类型的值?关系数据库中存在的值必然属于某种类型,比如字符型或数值型等。所以,假如 NULL 是值,那么它就必须属于某种类型。

NULL 容易被认为是值的原因有两个。

第一个是高级编程语言里面,NULL 被定义为了一个常量(很多语言将其定义为了整数0),这导致了我们的混淆。但是,SQL 里的 NULL 和其他编程语言里的 NULL 是完全不同的东西。

第二个原因是,IS NULL 这样的谓词是由两个单词构成的,所以我们容易把 IS 当作谓词,而把 NULL 当作值。特别是 SQL 里还有 IS TRUE 、IS FALSE 这样的谓词,我们由此类推,从而这样认为也不是没有道理。但是正如讲解标准 SQL 的书里提醒人们注意的那样,我们应该把 IS NULL 看作是一个谓词。因此,写成 IS_NULL 这样也许更合适。

温柔的陷阱

比较谓词和 NULL

排中律不成立。排中律指同一个思维过程中,两个相互矛盾的思想不能同假,必有一真,即“要么A要么非A”。

假设我们有学生表:t_student:

DROP TABLE IF EXISTS t_student; 
CREATE TABLE t_student ( id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键', name VARCHAR(50) NOT NULL COMMENT '名称', age INT(3) COMMENT '年龄', remark VARCHAR(500) NOT NULL DEFAULT '' COMMENT '备注', primary key(id) 
) COMMENT '学生信息'; INSERT INTO t_student(name, age) 
VALUE('zhangsan', 25),('wangwu', 60),('bruce', 32),('yzb', NULL),('boss', 18); SELECT * FROM t_student; 

表中数据 yzb 的 age 是 NULL,也就是说 yzb 的年龄未知。在现实世界里,yzb 是 20 岁,或者不是 20 岁,二者必居其一,这毫无疑问是一个真命题。那么在 SQL 的世界里了,排中律还适用吗? 我们来看一个 SQL :

SELECT * FROM t_student 
WHERE age = 20 OR age <> 20; 

咋一看,这不就是查询表中全部记录吗?我们来看下实际结果:

yzb 没查出来,这是为什么?我们来分析下,yzb 的 age 是 NULL,那么这条记录的判断步骤如下:

-- 1. 约翰年龄是 NULL (未知的 NULL !) 
SELECT * 
FROM t_student 
WHERE age = NULL 
OR age <> NULL; -- 2. 对 NULL 使用比较谓词后,结果为unknown 
SELECT * 
FROM t_student 
WHERE unknown 
OR unknown; -- 3.unknown OR unknown 的结果是unknown (参考三值逻辑的逻辑值表) 
SELECT * 
FROM t_student 
WHERE unknown; 

SQL 语句的查询结果里只有判断结果为 true 的行。要想让 yzb 出现在结果里,需要添加下面这样的 “第 3 个条件”:

-- 添加 3 个条件:年龄是20 岁,或者不是20 岁,或者年龄未知。

    -- 添加 3 个条件:年龄是20 岁,或者不是20 岁,或者年龄未知 SELECT * FROM t_student WHERE age = 20  OR age <> 20 OR age IS NULL; CASE 表达式和 NULL。简单 CASE 表达式如下:CASE col_1 WHEN = 1 THEN 'o' WHEN NULL THEN 'x' END 

这个 CASE 表达式一定不会返回 ×。这是因为,第二个 WHEN 子句是 col_1 = NULL 的缩写形式。正如我们所知,这个式子的逻辑值永远是 unknown ,而且 CASE 表达式的判断方法与 WHERE 子句一样,只认可逻辑值为 true 的条件。正确的写法是像下面这样使用搜索 CASE 表达式:

CASE WHEN col_1 = 1 THEN 'o' WHEN col_1 IS NULL THEN 'x' 
END 

NOT IN 和 NOT EXISTS 并非等价

我们在对 SQL 语句进行性能优化时,经常用到的一个技巧是将 IN 改写成 EXISTS ,这是等价改写,并没有什么问题。但是,将 NOT IN 改写成 NOT EXISTS 时,结果未必一样。

我们来看个例子,我们有如下两张表:t_student_A 和 t_student_B,分别表示 A 班学生与 B 班学生。

DROP TABLE IF EXISTS t_student_A; 
CREATE TABLE t_student_A ( id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键', name VARCHAR(50) NOT NULL COMMENT '名称', age INT(3) COMMENT '年龄', city VARCHAR(50) NOT NULL COMMENT '城市', remark VARCHAR(500) NOT NULL DEFAULT '' COMMENT '备注', primary key(id) 
) COMMENT '学生信息'; INSERT INTO t_student_A(name, age, city) 
VALUE 
('zhangsan', 25,'深圳市'),('wangwu', 60, '广州市'), 
('bruce', 32, '北京市'),('yzb', NULL, '深圳市'), 
('boss', 43, '深圳市'); DROP TABLE IF EXISTS t_student_B; 
CREATE TABLE t_student_B ( id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键', name VARCHAR(50) NOT NULL COMMENT '名称', age INT(3) COMMENT '年龄', city VARCHAR(50) NOT NULL COMMENT '城市', remark VARCHAR(500) NOT NULL DEFAULT '' COMMENT '备注', primary key(id) 
) COMMENT '学生信息'; INSERT INTO t_student_B(name, age, city) 
VALUE 
('马化腾', 45, '深圳市'),('马三', 25, '深圳市'), 
('马云', 43, '杭州市'),('李彦宏', 41, '深圳市'), 
('年轻人', 25, '深圳市'); SELECT * FROM t_student_A; 
SELECT * FROM t_student_B; 

需求:查询与 A 班住在深圳的学生年龄不同的 B 班学生,也就说查询出 :马化腾 和 李彦宏,这个 SQL 该如何写,像这样?

-- 查询与 A  班住在深圳的学生年龄不同的 B 班学生 ? 
SELECT * FROM t_student_B 
WHERE age NOT IN ( SELECT age FROM t_student_A  WHERE city = '深圳市' 
); 

我们来看下执行结果:

我们发现结果是空,查询不到任何数据,这是为什么 ?这里 NULL 又开始作怪了,我们一步一步来看看究竟发生了什么。

-- 1. 执行子查询,获取年龄列表 
SELECT * FROM t_student 
WHERE age NOT IN(43, NULL, 25); -- 2. 用NOT 和IN 等价改写NOT IN 
SELECT * FROM t_student 
WHERE NOT age IN (43, NULL, 25); -- 3. 用OR 等价改写谓词IN 
SELECT * FROM t_student 
WHERE NOT ( (age = 43) OR (age = NULL) OR (age = 25) ); -- 4. 使用德· 摩根定律等价改写 
SELECT * FROM t_student 
WHERE NOT (age = 43) AND NOT(age = NULL) AND NOT (age = 25); -- 5. 用<> 等价改写 NOT 和 = 
SELECT * FROM t_student 
WHERE (age <> 43) AND (age <> NULL) AND (age <> 25); -- 6. 对NULL 使用<> 后,结果为 unknown 
SELECT * FROM t_student 
WHERE (age <> 43) AND unknown AND (age <> 25); -- 7.如果 AND 运算里包含 unknown,则结果不为true(参考三值逻辑的逻辑值表) 
SELECT * FROM t_student 
WHERE false 或 unknown; 

可以看出,在进行了一系列的转换后,没有一条记录在 WHERE 子句里被判断为 true 。也就是说,如果 NOT IN 子查询中用到的表里被选择的列中存在 NULL ,则 SQL 语句整体的查询结果永远是空。这是很可怕的现象!

为了得到正确的结果,我们需要使用 EXISTS 谓词。

-- 正确的SQL 语句:马化腾和李彦宏将被查询到 
SELECT * FROM t_student_B B 
WHERE NOT EXISTS (  SELECT * FROM t_student_A A WHERE B.age = A.age AND A.city = '深圳市'  
); 

执行结果如下:

同样地,我们再来一步一步地看看这段 SQL 是如何处理年龄为 NULL 的行的:

-- 1. 在子查询里和 NULL 进行比较运算,此时 A.age 是 NULL 
SELECT * FROM t_student_B B 
WHERE NOT EXISTS (  SELECT * FROM t_student_A A WHERE B.age = NULL AND A.city = '深圳市'  
); -- 2. 对NULL 使用“=”后,结果为 unknown 
SELECT * FROM t_student_B B 
WHERE NOT EXISTS (  SELECT * FROM t_student_A A WHERE unknown AND A.city = '深圳市'  
); -- 3. 如果AND 运算里包含 unknown,结果不会是true 
SELECT * FROM t_student_B B 
WHERE NOT EXISTS (  SELECT * FROM t_student_A A WHERE false 或 unknown 
); -- 4. 子查询没有返回结果,因此相反地,NOT EXISTS 为 true 
SELECT * FROM t_student_B B 
WHERE true; 

也就是说,yzb 被作为 “与任何人的年龄都不同的人” 来处理了。EXISTS 只会返回 true 或者false,永远不会返回 unknown。因此就有了 IN 和 EXISTS 可以互相替换使用,而 NOT IN和 NOT EXISTS 却不可以互相替换的混乱现象。

还有一些其他的陷阱,比如:限定谓词和 NULL、限定谓词和极值函数不是等价的、聚合函数和 NULL 等等。

总结

1、NULL 用于表示缺失的值或遗漏的未知数据,不是某种具体类型的值,不能对其使用谓词。

2、对 NULL 使用谓词后的结果是 unknown,unknown 参与到逻辑运算时,SQL 的运行会和预想的不一样。

3、 IS NULL 整个是一个谓词,而不是:IS 是谓词,NULL 是值;类似的还有 IS TRUE、IS FALSE。

4、要想解决 NULL 带来的各种问题,最佳方法应该是往表里添加 NOT NULL 约束来尽力排除 NULL。

我的项目中有个硬性规定:所有字段必须是 NOT NULL,建表的时候就加上此约束。

阅读目录(置顶)(长期更新计算机领域知识)

阅读目录(置顶)(长期更新计算机领域知识)

阅读目录(置顶)(长期科技领域知识)

歌谣带你看java面试题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/424193.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

752. Open the Lock

文章目录1 题目理解2 BFS3 用int构建状态1 题目理解 一个钟表有4个槽&#xff0c;每个槽可以停在0-9&#xff0c;10个状态。钟表每个槽的轮子可以转&#xff0c;例如可以从0转到9&#xff0c;也可以从0转到1。 钟表的起始状态是"0000"。每个数字代表一个槽的状态。 …

移动开发 视频收集

构建基于SQL CE的移动方案http://download.chinaitlab.com/video/files/8282.html转载于:https://www.cnblogs.com/Regal/archive/2006/03/23/356800.html

移动混合开发之android文件管理新建文件和删除文件

今天经过一天超过8小时的实践&#xff0c;有很多CSS上的细节需要注意&#xff1a; 1&#xff0c; /*注意是对before的操作*/ .content ul li .icon-check-empty:before{display: block;/*webFont设置其width和height时无效,只有设置font-size*//*width: 3rem;*//*height: 3rem;…

spring mvc学习(19):cookievalue注解(显示cookie的值,默认必须有值)

目录结构 web.xml <?xml version"1.0" encoding"UTF-8"?> <web-app xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance" xmlns"http://java.sun.com/xml/ns/javaee" xsi:schemaLocation"http://java.sun.com/xml…

续:C#串口操作

今天继续写C#的工业扫描串口。突然遇到一个很奇怪的问题&#xff1a;那就是我要求把某些码得到之后进行业务处理&#xff0c;但是就是这个时候突然发现扫描出来的 码位数不正确了&#xff01;我就很怀疑自己的代码逻辑了。于是&#xff0c;我就逐行进行调试&#xff0c;而接受口…

spring mvc学习(20):RequestHeader(获取请求头中某一部分值)

目录结构 web.xml <?xml version"1.0" encoding"UTF-8"?> <web-app xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance" xmlns"http://java.sun.com/xml/ns/javaee" xsi:schemaLocation"http://java.sun.com/xml…

698. Partition to K Equal Sum Subsets

文章目录1 理解题目2 分析2.1进一步优化2.2 根据花花酱解答1 理解题目 Given an array of integers nums and a positive integer k, find whether it’s possible to divide this array into k non-empty subsets whose sums are all equal. 输入&#xff1a;一个int数组nums…

spring mvc学习(21):testparam请求参数和请求头表达式

目录结构 web.xml <?xml version"1.0" encoding"UTF-8"?> <web-app xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance" xmlns"http://java.sun.com/xml/ns/javaee" xsi:schemaLocation"http://java.sun.com/xml…

OpenGL ES GLKit初探

#GLKit框架 GLKit框架的设计目的是为了简化OpenGL/OpenGL ES的应用开发。它的出现加快了OpenGL或OpenGL ES应用程序的开发。使用数学库、背景纹理加载&#xff0c;预先创建着色器效果&#xff0c;以及标准视图和视图控制器来实现渲染循环。 GLKit框架提供了功能和类&#xff0c…

一个封装了的ADO类,功能非常强大,并做了一个DEMO演示如何操作ACCESS数据库

呵呵&#xff0c;说实在的&#xff0c;这个类俺是从外国论坛上下载的&#xff0c;自己研究了下如何使用并做了一个DEMO&#xff0c;演示如何操作ACCESS数据库。希望给那些没有接触数据库编程的初学者一点启发吧。有任何问题请及时与我联系^_^。程序下载地址&#xff1a;/Files/…

93. Restore IP Addresses

文章目录1 题目理解2 回溯1 题目理解 输入&#xff1a;字符串s 输出&#xff1a;可能的ip地址 规则&#xff1a;一个有效的ip地市是一连串数字&#xff0c;数字范围在0到255&#xff0c;每个数字不能有前导0。例如"0.1.2.201" and "192.168.1.1"是有效ip地…

spring mvc学习(22):/textpath/*/helen

目录结构 web.xml <?xml version"1.0" encoding"UTF-8"?> <web-app xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance" xmlns"http://java.sun.com/xml/ns/javaee" xsi:schemaLocation"http://java.sun.com/xml…

131. Palindrome Partitioning

文章目录1 题目理解2 回溯3 动态规划1 题目理解 输入&#xff1a;字符串s 规则&#xff1a;将字符串s分割&#xff0c;分割后每一个部分都是一个回文串。 输出&#xff1a;所有的分割方式 Example 1: Input: s “aab” Output: [[“a”,“a”,“b”],[“aa”,“b”]] Examp…

4 文件操作 支持图片 视频 mp3 文本等

#文件操作:send_file,支持图片 视频 mp3 文本等app.route("/img")def img(): return send_file("1.jpg")转载于:https://www.cnblogs.com/ajaxa/p/11156483.html

我的博客开张了!!!

留个脚印,嘻嘻! 转载于:https://www.cnblogs.com/stu-acer/archive/2006/04/26/385453.html

第一百零五期:5年前,跳槽涨薪,你笑了,5年后,跳槽降薪,你慌了!

去年&#xff0c;我在年度绩效面谈中与某中年技术男就 “从测试转向产品经理” 的这个话题上进行了一些探讨与分析。 作者&#xff1a;王晔倞 图片来自 Pexels 或许是因为分析的角度比较客观、真实&#xff0c;再加上俩人都比较会演戏&#xff0c;我激情&#xff0c;他投入&a…

241. Different Ways to Add Parentheses

文章目录1 题目理解2 分治法1 题目理解 输入&#xff1a;字符串input&#xff0c;包含数字和操作符 规则&#xff1a;给input的不同位置加括号&#xff0c;使得input可以得到不同的计算结果。 输出&#xff1a;返回可能的计算结果 Example 1: Input: “2-1-1” Output: [0, 2…

第一百零六期:长相不讨AI喜欢面试就会挂?全球百万求职者经历AI“看脸”面试

AI不仅会筛选你的简历&#xff0c;还会通过看脸决定你能否通过面试。这不是将来时。全球已有超过一百万求职者&#xff0c;经历过AI面试官的冷酷“凝视”。 作者&#xff1a;鱼羊 本文经AI新媒体量子位&#xff08;公众号ID:QbitAI&#xff09;授权转载&#xff0c;转载请联系…

最近比较忙

最近项目真是忙的可以不过还好前几天没事搞了个电影小偷,闲下来看看电影真是不错站在这里要的回下就可以了http://www.ve99.com 转载于:https://www.cnblogs.com/flashicp/archive/2006/04/29/388972.html

服务器控件HtmlTable下控件赋值问题

在程序开发过程中&#xff0c;碰到这样的问题&#xff1a; 1<table>2<tr>3<td><asp:DropDownList iddropdownlist1 runatserver></td>4</tr>5</table>在基类页中有如下代码&#xff1a;1foreach(Control pagectl inPage.Controls[1]…