DBMS
- Query Languages
- Interface and maintaining tools(GUI)
- APIs
- Class Library
QL 不是图灵完备的,不是一种编程语言。
QL
SQL是一种非过程化的查询语言。
- DDL数据定义语言:表,视图
- QL 查询语言
- DML 数据操纵语言
- DCL 数据控制语言
Base table:基表,实际存在的表
View: 视图,不是实际存在的表,虚表
SELECT [DISTINCT] target_list
FROM ralation_list
WHERE qualification
Conceptual Evaluation Strategy
- 计算笛卡尔乘积
- 用
WHERE
子句做筛选 - 根据
target_list
做投影 - 根据是否有
DISTINCT
消除重复
在不引起混乱的情况下,多表查询可以不加别名。
使用distinct
的时候需要注意,一般必须含有主键或者有unique
约束的键。
SQL支持like
表达的模糊查询
查询实例:
三张表:
Sailors
:sid sname age rating
Boats
: bid bname color
Reserves
: sid bid day
create table Sailors
(sid int primary key,sname nvarchar(20) not null,rating int not null,age float
)go create table Boats
(bid int primary key,bname nvarchar(20) not null,color nvarchar(20) not null
)go create table Reserves
(sid int foreign key references Sailors(sid),bid int foreign key references Boats(bid),day date not null,primary key(sid, bid)
)goinsert into Sailors values (22,'dustin',7,45.0)
insert into Sailors values (31,'lubber',8,55.0)
insert into Sailors values (58,'rusty',10,35.0)
insert into Sailors values (28,'yuppy',9,35.0)
insert into Sailors values (44,'guppy',5,35.0)
insert into Sailors values(11,'dustin',8,20)insert into Boats values (101,'tiger','red')
insert into Boats values (103,'lion','green')
insert into Boats values (105,'hero','blue')insert into Reserves values (22,101,'1996-10-10')
insert into Reserves values (58,103,'1996-11-12')
insert into Reserves values (58,101,'1996-12-12')
insert into Reserves values(58,105,'1996-11-11')select * from Sailors
go
select * from Boats
go
select * from Reserves
SELECT S.age,age1 = S.age-5, 2*S.age As age2
FROM Sailors S
WHERE S.sname LIKE 'B_%B'--查找名字以B开头结尾且至少有三个字符的人的年龄
使用as
给列起别名在有的系统中不适用。
查询预定过红色或者绿色船的水手信息:
使用or
或者分别查询后使用union
。需要注意的是使用union
的两张表需要满足并兼容的条件。这里的两张表是满足的。
查询预订过红色和绿色船的水手信息:
- 做
Reserves
的自连接
SELECT S.sid
FROM Sailors S, Boats B1, Reserves R1, Boats B2, Reserves R2
WHERE S.sid=R1.sid AND S.sid=R2.sid AND R1.bid=B1.bid AND R2.bid=B2.bid and (B1.color='red' AND B2.color='green')
- 使用
INTERSECT
SELECT S.sid
FROM Sailors S, Boats B, Reserves R
WHERE S.sid=R.sid AND B.bid=R.bid AND B.color='red'
INTERSECT
SELECT S.sid
FROM Sailors S, Boats B, Reserves R
WHERE S.sid=R.sid AND B.bid=R.bid AND B.color='green'
需要注意的是集合的交INTERSECT
的两个表必须并兼容。
嵌套查询
预定过编号103号船的水手的姓名:
非关联子查询:
SELECT S.sname
FROM Sailors S
WHERE S.sid IN ( SELECT R.sid FROM Reserves R WHERE R.bid=103)
关联嵌套子查询:
SELECT S.sname
FROM Sailors S
WHERE EXISTS (SELECT *FROM Reserves RWHERE R.bid=103 AND S.sid=R.sid)
关联嵌套子查询的效率一般比非关联嵌套子查询的效率低。
在子查询中内层查询可以直接使用外层查询的值,相当于嵌套循环
预订过103号船并且只预订过一次船的水手的姓名:
SELECT S1.sname
FROM (SELECT *FROM Sailors SWHERE (SELECT COUNT(*) FROM Reserves R WHERE R.sid=S.sid)=2) S1
WHERE S1.sid IN(SELECT R.sid FROM Reserves R WHERE R.bid=103)
预订过103号船并且只预订过一次103号船的水手的姓名:
SELECT S.sname
FROM Sailors S
WHERE ((SELECT COUNT(*) FROM Reserves R WHERE R.sid=S.sid AND R.bid=103)=1)
查找只有一个人预订的船:
不使用COUNT
的方法:从Resevers
得到所有没有被其他人订过的船
SELECT B.bname
FROM Boats B,Reserves R1
WHERE B.bid=R1.bid AND B.bid NOT IN (SELECT R2.bid FROM Reserves R2 WHERE R2.sid<>R1.sid)
使用COUNT
的方法:
SELECT B.bname
FROM Boats B
WHERE (SELECT COUNT(*) FROM (SELECT DISTINCT R.bid,R.sid FROM Reserves R) R WHERE R.bid=B.bid)=1
还可以使用UNIQUE
和NOT UNIQUE
ANY ALL
找到比任意一个叫dustin
的级别高的人的姓名
SELECT *
FROM Sailors S
WHERE S.rating > ANY (SELECT S2.rating FROM Sailors S2 WHERE S2.sname='dustin')
找到比所有叫dustin
的级别高的人的姓名
SELECT *
FROM Sailors S
WHERE S.rating > ALL (SELECT S2.rating FROM Sailors S2 WHERE S2.sname='dustin')
查找某个表中同时满足另一个表所有条件的信息的时候使用除法
查找预订过所有船的水手的姓名
- Solution 1:否定之否定,使用
EXCEPT
SELECT S.sname
FROM Sailors S
WHERE NOT EXISTS((SELECT B.bid FROM Boats B)EXCEPT --集合差(SELECT R.bid FROM Reserves R WHERE R.sid=S.sid))
- Solution 2:不使用
EXCEPT
--不存在有船他没有租过的人
SELECT S.sname
FROM Sailors S
WHERE NOT EXISTS(SELECT * FROM Boats B WHERE B.bid NOT IN (SELECT R.bid FROM Reserves R WHERE R.sid=s.sid))--等价于
SELECT S.sname
FROM Sailors S
WHERE NOT EXISTS(SELECT * FROM Boats B WHERE NOT EXISTS (SELECT * FROM Reserves R WHERE R.sid=s.sid AND R.bid=B.bid))
聚合函数
COUNT(*)
COUNT([DISTINCT] A)
查询属性A有多少个不同的值SUM([DISTINCT] A )
对(不同的)属性A进行求和AVG([DISTINCT] A)
对(不同的)属性A求平均值MIN(A)
MAX(A)
SELECT COUNT(DISTINCT S.rating)
FROM Sailors S
WHERE S.name='Bob'
分组聚集group by
SELECT [DISTINCT] target-list
FROM relation-list
WHERE qualification
GROUP BY grouping-list
HAVING group-qualification
首先对from子句对表进行笛卡尔乘积,根据where子句对元组进行筛选,对筛选的结果根据group-by的值相同条件进行分组,然后对计算的结果根据having后的条件对分组进行筛选,最后再根据分组计算select子句后面的值,这要求select和having后的值对每个组都是单一的(是分组属性集的子集)。
SQL无法简单的从语法上确定。
有了group by 以后,计算是在分组上进行的,如果没有,是在表上进行的。
分组其实是做排序,然后再将值相同的分组。
SELECT S.rating,MIN(S.age) as minage
FROM Sailors S
WHERE S.age>=18
GROUP BY S.rating
HAVING COUNT(*)>1 AND EVERY(S.age<=60)--EVERY对应的还有ANY
EVERY
要求每个分组的每个元素都必须满足要求,ANY
要求每个分组至少有一个元素满足要求
查询每一条红船的预订人数:
SELECT B.bid,COUNT(*) AS scount
FROM Boats B,Resevers R
WHERE R.bid=B.bid AND B.color='red'
GROUP BY B.bid
下面的语句会报错:
SELECT B.bid,COUNT(*) AS scount
FROM Boats B,Resevers R
WHERE R.bid=B.bid
GROUP BY B.bid
HAVING B.color='red'
报错的原因是数据库的语法检查比较简单,不会按照业务的语义来进行判断,只会简单的判断SELECT
和 HAVING
后面的子句有没有在GROUP BY
后面出现
因为这里的每一种船只有一种颜色,因此我们可以在聚合的时候加上B.color
条件,这样上面的查询就可以了。
SELECT B.bid,COUNT(*) AS scount
FROM Boats B,Reserves R
WHERE R.bid=B.bid
GROUP BY B.bid,B.color
HAVING B.color='red'
对于每个至少有两个人的级别,找出年龄大于18岁的最小年龄。
SELECT S.rating, MIN(S.age)
FROM Sailors S
WHERE S.age > 18
GROUP BY S.rating
HAVING 1<(SELECT COUNT(*) FROM Sailors S1 WHERE S1.rating=S.rating)
对于组中属性的筛选只能通过WHERE
子句,筛选过的元组再进行分组的时候需要对分组进行筛选,但是这里的分组已经不是以前的分组了,因此需要在子句中再使用子查询。
查找平均年龄最小的级别:
SELECT top 1 S.rating,AVG(S.age) as 'avgAge'
FROM Sailors S
GROUP BY S.rating
ORDER BY avgAge
NULL值
不是0,不是"",是不知道。
Case表达式
--Officers(name,status,rank,title)
SELECT name,Case statusWHEN 1 THEN 'Active Duty'WHEN 2 THEN 'Reserve'WHEN 3 THEN 'Special Assignment'WHEN 4 THEN 'Retired'ELSE 'Unknown'END AS status
FROM Officers
--Machines(serialno, type, year, hours_used, accidents)
--Find the rate of the accidents of "chain saw" in the whole accidentsSELECT sum(CASE WHEN type='chain saw' THEN accidentsELSE 0e0END)/sum(accidents)
FROM Machines
注意如果CASE
后面有字段名,则WHEN
后面应该是该字段名的值的情况,如果没有的话WHEN
后面应该是布尔表达式
还需要注意的是可以同时对两个聚合函数的值进行运算。
--查找每种设备的平均故障率SELECT type,CASE WHEN sum(hours_used)>0 THEN sum(accidents)/sum(hours_used)ELSE NULLEND AS accident_rate
FROM Machines
GROUP BY type
上面的查询语句使用CASE
语句的主要原因是可能有的设备没有使用过,因此没有故障率一说。如果非要计算的话有可能导致分母为0的情况。
CASE
语句对于需要分情况处理的语句效果比较好。
对于含有GROUP BY
语句的查询,需要把SELECT
里面的语句都对分组后进行处理。
对于上面的语句我们当然也可以在HAVING
语句中对组进行筛选后再进行计算,可是这样做的话就无法得到那些没有时长的组的信息。
子查询:
标量子查询:查询的结果是一个值,一般使用聚合函数
在SQL语句中,凡是可以出现一个值的地方,都可以出现标量子查询。
SELECT d.deptno,d.deptname,(SELECT MAX(salary)FROM empWHERE deptno=d.deptno) as maxpay
FROM dept as d
WHERE d.location='NEW YORK'
在SELECT
语句中也可以使用子查询。
当然我们也可以使用联表查询。
表表达式:查询的结果又是一张表
SELECT startyear,avg(pay)
FROM (SELECT name,salary+bonus as pay, year(startdate) as startyearFROM emp )as emp2
GROUP BY startyear
FROM
子句中也可以出现子查询,但是需要注意的是不可以在该语句的其他子查询直接使用该子查询得到的临时表。
表表达式一般出现在FROM
子句中
公共表表达式:如果多次使用同一个,只定义一次,多次使用
WITH
子句定义公共子表达式,其实是一个临时视图
--寻找部门总收入最高的部门
WITH payroll(deptno,totalpay) AS(SELECT deptno,sum(salary)+sum(bonus)FROM empGROUP BY deptno)
SELECT deptno
FROM payroll
WHERE totalpay = (SELECT max(totalpay) FROM payroll)
--查找一个部门对,第一个部门的平均工资大于第二个的两倍
WITH deptavg(deptno,avgsal) AS(SELECT deptno,avg(salary)FROM empGROUP BY deptno)
SELECT d1.deptno,d1.avgsal,d2.deptno,d2.avgsal
FROM deptavg AS d1, deptavg AS d2
WHERE d1.avgsal>2*d2.avgsal
需要注意的是WITH
和SELECT
之间没有没有逗号,整个合在一起是一条语句。
外连接
有两种集合差操作:
EXCEPT
:会消除重复元组,需要排序EXCEPT ALL
:如果确信不会出现重复元组或者重复元组对结果没有影响就是用这个,效率更高
上面所有都是一条SQL语句。
递归查询
联邦雇员FedEmp(name,salary,manager)
找到胡佛手下超过10万员的雇员(包括简接雇员)
WITH agents(name,salary) AS((SELECT name,salary)FROM empWHERE manager='Hoover')UNION ALL(SELECT f.name,f.salaryFROM agents as a,FedEmp as fWHERE f.manager=a.name))
SELECT name FROM agents WHERE salary>100000
DML
INSERT INTO table-name VALUES (); --插入一条元组
DELETE FROM table-name WHERE 条件
UPDATE table-list SET 字段名='' WHERE 条件
VIEW
- 普通视图
CREATE VIEW view-name AS (SELECT 语句)
视图的定义会进行保存
- 虚表
- 实现数据的逻辑独立性
- 数据安全性
- 视图更新问题:早期系统不能进行更新。如果视图中的信息可以和基表中的信心一一对应,唯一映射的话,就可以进行修改。不同产品可能不同。
- 临时视图
定义不会进行保存,支持递归查询
WITH table-list() AS ()
程序设计语言访问数据库
嵌入式SQL
- 以
EXEC SQL
开始,以;
结束