目录
Create(insert)
Retrieve(select)
where条件
编辑 NULL的查询
结果排序(order by)
筛选分页结果 (limit)
Update
Delete
删除表
截断表(truncate)
插入查询结果(insert+select)
聚合函数
分组聚合统计(group by)
CRUD : Create(创建), Retrieve(读取),Update(更新),Delete(删除)
Create(insert)
语法:
[ ]内的是可以省略的
INSERT [INTO] table_name[(column [, column] ...)]VALUES (value_list) [, (value_list)] ...value_list: value, [, value] ...
使用:创建一个学生表
单行数据 + 指定列插入
value_list 数量必须和定义表的列的数量及顺序一致。value的左右两边必须值对应,类型也对应
可以不用指定id,因为mysql会用默认的值进行自增
单行数据 + 全列插入
全列插入可以省略values左侧的列属性
多行数据 + 全列插入
多行数据用逗号隔开
多行数据 + 指定列插入
插入是否更新
可能会出现由于主键或者唯一键对应的值已经存在而导致插入失败的情况
这时候我们希望能够进行可以选择性的进行同步更新操作而不是直接报错
INSERT ... ON DUPLICATE KEY UPDATE column = value [, column = value] ...
举个例子
第一个错误是因为主键冲突,第二个错误是因为我们尝试更新的数据和其他行数据也冲突了
相当于是多做一次尝试,如果语句冲突了,就把insert操作改成updata操作
需要注意的是你也要保证更新的数据不要和其他行数据的主键发生冲突!!
- 0 row affected: 表中有冲突数据,但冲突数据的值和 update 的值相等
- 1 row affected: 表中没有冲突数据,数据被插入
- 2 row affected: 表中有冲突数据,并且数据已经被更新
也可通过 MySQL row_count()函数获取受到影响的数据行数 (-1表示没有)
replace
- 主键 或者唯一键 没有冲突,则直接插入;
- 主键 或者 唯一键 如果冲突,则删除后再插入
1 row affected: 表中没有冲突数据,数据被插入
2 row affected: 表中有冲突数据,删除后重新插入
Retrieve(select)
语法
SELECT [DISTINCT]//去重 {* | {column [, column] ...} [FROM table_name] //从某个表里去提取[WHERE ...] //筛选条件[ORDER BY column [ASC | DESC], ...] //排序LIMIT ... //限定筛选出来的结果条数
创建表结构 并插入数据
CREATE TABLE exam_result ( id INT UNSIGNED PRIMARY KEY AUTO_INCREMENT, name VARCHAR(20) NOT NULL COMMENT '同学姓名', chinese float DEFAULT 0.0 COMMENT '语文成绩', math float DEFAULT 0.0 COMMENT '数学成绩', english float DEFAULT 0.0 COMMENT '英语成绩'
);
INSERT INTO exam_result (name, chinese, math, english) VALUES ('唐三藏', 67, 98, 56), ('孙悟空', 87, 78, 77), ('猪悟能', 88, 98, 90), ('曹孟德', 82, 84, 67), ('刘玄德', 55, 85, 45), ('孙权', 70, 73, 78), ('宋公明', 75, 65, 30);
Query OK, 7 rows affected (0.00 sec)
Records: 7 Duplicates: 0 Warnings: 0
全列查询(*)
通常情况下不建议使用*进行全列查询
- 查询的列越多,意味着需要传输的数据量越大(线性遍历);
- 可能会影响到索引的使用 。
指定列查询
是将表中所有的数据拿出来,然后要什么再显示什么,指定列的顺序不需要按定义表的顺序来
查询字段为表达式
表达式不包含字段
表达式包含一个字段
表达式包含多个字段
为查询结果指定别名(as)
SELECT column [AS] alias_name [...] FROM table_name;
起多个别名
结果筛选并去重
我们发现98分重复了
SELECT DISTINCT column [...] FROM table_name;
where条件
比较运算符
逻辑运算符
英语不及格的同学即英语成绩 ( < 60 )
SELECT name, english FROM exam_result WHERE english < 60;
语文成绩在 [80, 90] 分的同学及语文成绩
使用 AND 进行条件连接
SELECT name, chinese FROM exam_result WHERE chinese >= 80 AND chinese <= 90;
使用 BETWEEN ... AND ... 条件
SELECT name, chinese FROM exam_result WHERE chinese BETWEEN 80 AND 90;
数学成绩是 58 或者 59 或者 98 或者 99 分的同学及数学成绩
使用 OR 进行条件连接
SELECT name, math FROM exam_result WHERE math = 58 OR math = 59 OR math = 98 OR math = 99;
使用 IN 条件
SELECT name, math FROM exam_result WHERE math IN (58, 59, 98, 99);
_ 匹配严格的一个任意字符
SELECT name FROM exam_result WHERE name LIKE '孙_';
语文成绩好于英语成绩的同学
WHERE 条件中比较运算符两侧都是字段
SELECT name, chinese, english FROM exam_result WHERE chinese > english;
总分在 200 分以下的同学
SELECT name, chinese + math + english 总分 FROM exam_result WHERE chinese + math + english < 200;
能用别名进行查找吗?
上述代码的执行顺序:先 from exam_result 再 where total < 200 最后 chinese+english+math total;
根据上图我们会发现如果直接在筛选条件那里重命名也是不可以的!!因为对列做重命名已经是属于显示范畴了,相当于是已经把数据拿完了,然后在最后把列名字起别名,这一步是最后一步了!所以语法上不允许的!!
孙某同学,否则要求总成绩 > 200 并且 语文成绩 < 数学成绩 并且 英语成绩 > 80
综合性查询
SELECT name, chinese, math, english, chinese + math + english 总分
FROM exam_result
WHERE name LIKE '孙_' OR ( chinese + math + english > 200 AND chinese < math AND english > 80
);
NULL的查询
‘ ’ 和NULL没有关系!!
-- NULL 和 NULL 的比较,= 和 的区别
结果排序(order by)
语法:
SELECT ... FROM table_name [WHERE ...] ORDER BY column [ASC|DESC], [...]; //依据哪一列做排序
- ASC 为升序(从小到大) //ascending order
- DESC 为降序(从大到小) //descending order
- 默认为 ASC
注意:没有 ORDER BY 子句的查询,返回的顺序是未定义的,永远不要依赖这个顺序
同学及数学成绩,按数学成绩升序显示
同学及qq号,按姓名排序显示
NULL视为比任何值都小,升序出现在最上面。降序在最下面
默认是按照升序来排序
查询同学各门成绩,依次按数学降序,英语升序,语文升序的方式显示
多字段排序,排序优先级随书写顺序
也就是说先比较第一个顺序,然后当两个或者多个数据第一个顺序相同时,再比较第二个数据,第三个数据,以此类推
查询同学及总分,由高到低
- ORDER BY中可以使用表达式
- ORDER BY子句中可以使用列别名
为什么这里用别名进行排序呢?上次我们将where的时候不是不能用别名吗?
因为这个排序是第四步,也就是晚于下面的任何一步
所以也就是起别名之后再进行order by操作,故而是可以用别名来进行排序的。能不能用起的别名,完全取决与使用的顺序,如果你使用的时候别名还没起呢,那肯定用不了,如果已经起过了,那就可以用了
查询姓孙的同学或者姓曹的同学数学成绩,结果按数学成绩由高到低显示
结合 WHERE 子句 和 ORDER BY 子句
筛选分页结果 (limit)
对于limit而言,也可以使用别名的原因
排序是需要现有数据的
只有数据准备好了,你才能显示,而limit的本质功能就是"显示" ,而不是筛选,所以limit的执行顺序会更靠后,比排序还靠后。所以也可以使用别名。
Update
语法
UPDATE table_name SET column = expr [, column = expr ...] [WHERE ...] [ORDER BY ...] [LIMIT ...]
对查询到的结果进行列值更新(一般要加where条件否则会全部被更新)
将孙悟空同学的数学成绩变更为80分
更新值为具体值
将曹孟德同学的数学成绩变更为60分,语文成绩变更为70分
一次更新多个列
将总成绩倒数前三的3位同学的数学成绩加上30分
数据更新,不支持math+=30这种语法 要用math = math+30这种写法
update exam_result set math=math+30 order by chinese+english+math asc limit 3;
将所有同学的语文成绩更新为原来的2倍
注意:更新全表的语句慎用!--没有WHERE子句,则更新全表
update exam_result set chinese=chinese*2;
Delete
删除表
语法
DELETE FROM table_name [WHERE ...] [ORDER BY ...] [LIMIT ...]
删除孙悟空同学的考试成绩
delete from exam_result where name='孙悟空';
去掉班级的倒数第一名
delete from exam_result order by english+math+chinese asc limit 1;
删除整张表数据
delete只是删表数据,不删表结构。表结构是由alter来管理的
先新建表,并插入一点数据
再查表的结构,然后再进行删除操作
我们会发现我们只是把表数据给删除了,但是表的结构还在!!计数器没有变
截断表(truncate)
语法
TRUNCATE [TABLE] table_name
我们还按照刚才的例子重新测试下
然后开始截断,并再次查看表数据和表结构
注意:这个操作慎用
只能对整表操作,不能像DELETE一样针对部分数据操作;
实际上MySQL 不对数据操作,所以比DELETE更快,但是TRUNCATE在删除数据的时候,并不经过真正的事务(不会被记录到日志里),所以无法回滚
会重置AUTO_INCREMENT项
三种日志:
bin log: 历史上操作过的sql语句优化之后保留下来——方便主从同步、备份、恢复
redo log:确保宕机、断电的时候数据不丢失(因为数据可能在内存中存着)——保证崩溃安全
undo log:做事务回滚、事务的隔离性
插入查询结果(insert+select)
INSERT INTO table_name [(column [, column ...])] SELECT ...
删除表中的重复记录,重复的数据只能有一份
建表
插入测试数据
不能用distinct去重,因为它不影响原表的数据,而是修改的显示的数据
但是我们可以将insert和select结合起来用,将distinct筛选出来的数据插入到空表中!!然后再改一下表的名字!!
第一步:create table no_duplicate_table like duplicate_table;建立一张和原表结构相同的空表
第二步:insert into no_duplicate_table select distinct * from duplicate_table; 查询原表去重后的结果然后插入到新表中
第三步:rename table duplicate_table to old_duplicate_table,no_duplicate_table to duplicate_table;将原表重命名备份一下,然后再把新表的名字改成原表的名字
为什么最后是通过rename的方式进行的?
创建一个数据库其实就是创建一个文件夹,创建一张表其实就是创建一个文件,对应的系统调用就是mkdir和touch,而rename背后的也是类似rename这样的系统调用,平时我们用的move指令重命名也是类似的,如果我今天想把一个文件上传到linux下,可能上传得很慢,我想等这个文件上传好之后,把这个文件放到某个目录下,我希望他放入的过程是原子的,所以我们一定不能直接把这个文件直接上传到对应的目录下,因为上传的过程一直在写入,一定不是原子的,所以一般我们喜欢把这个要上传的文件上传到一个临时的目录下,等全都上传完成之后,再把整个文件move到特定的目录下,这个move是原子的。
所以总的来说,用rename单纯就是相等一切都就绪了,然后统一放入、更新、生效等。因为我们的move操作和重命名操作实际上就是在文件系统里就是改这个文件所在的目录里面文件名和inode的映射关系,他相较于冗长地向表中插入和冗长的上传行为比起来非常轻。很有可能我这个目录有很多文件包括正在操作的这个文件正在被外部的网站或者各种语言正在访问,所以我们不能着急动这个表而是应该先把这个表先传到临时目录然后再统一move过去,这是一种比较推荐的做法
聚合函数
统计班级共有多少同学
使用 * 做统计,不受 NULL 影响
统计本次考试的数学成绩分数个数
NULL 不会计入结果
COUNT(math) 统计的是全部成绩
COUNT(DISTINCT math) 统计的是去重成绩数量
统计数学成绩总分
统计数学的平均分
数学不及格的人有多少
统计平均总分
返回英语最高分
返回 > 70 分以上的数学最低分
聚合函数:1、在应用层上更多的是在未来进行某种程度上的数据统计,是有自己的现实需求的2、大部分聚合都是简单的场景,还有一部分场景需要对信息做完分组之后做聚合
分组聚合统计(group by)
分组的目的是为了方便后面的聚合统计 (比如说分成男生女生然后分别做统计)
在select中使用group by 子句可以对指定列进行分组查询
select column1, column2, .. from table group by column;
案例:准备工作,创建一个雇员信息表(来自oracle 9i的经典测试表)
1、EMP员工表
2、DEPT部门表
3、SALGRADE工资等级表
//利用source将该备份文件恢复到数据库中
DROP database IF EXISTS `scott`;//如果曾经有这个名字是数据库就删掉
CREATE database IF NOT EXISTS `scott` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;//创建这个数据库USE `scott`;//使用这个数据库DROP TABLE IF EXISTS `dept`;//如果有这个名字的部门表叫把他删掉
CREATE TABLE `dept` (//创建部门表`deptno` int(2) unsigned zerofill NOT NULL COMMENT '部门编号',`dname` varchar(14) DEFAULT NULL COMMENT '部门名称',`loc` varchar(13) DEFAULT NULL COMMENT '部门所在地点'
);DROP TABLE IF EXISTS `emp`;//如果有这个名字的部门表叫把他删掉
CREATE TABLE `emp` (//创建员工表`empno` int(6) unsigned zerofill NOT NULL COMMENT '雇员编号',`ename` varchar(10) DEFAULT NULL COMMENT '雇员姓名',`job` varchar(9) DEFAULT NULL COMMENT '雇员职位',`mgr` int(4) unsigned zerofill DEFAULT NULL COMMENT '雇员领导编号',`hiredate` datetime DEFAULT NULL COMMENT '雇佣时间',`sal` decimal(7,2) DEFAULT NULL COMMENT '工资月薪',//外键`comm` decimal(7,2) DEFAULT NULL COMMENT '奖金',`deptno` int(2) unsigned zerofill DEFAULT NULL COMMENT '部门编号'//外键
);DROP TABLE IF EXISTS `salgrade`;//如果有这个名字的部门表叫把他删掉
CREATE TABLE `salgrade` (//薪资表 可以客观反应这个员工在公司的重要程度`grade` int(11) DEFAULT NULL COMMENT '等级',`losal` int(11) DEFAULT NULL COMMENT '此等级最低工资',`hisal` int(11) DEFAULT NULL COMMENT '此等级最高工资'
);//插入部门
insert into dept (deptno, dname, loc)
values (10, 'ACCOUNTING', 'NEW YORK');//核算部门
insert into dept (deptno, dname, loc)
values (20, 'RESEARCH', 'DALLAS');//搜索部门
insert into dept (deptno, dname, loc)
values (30, 'SALES', 'CHICAGO');//销售部门
insert into dept (deptno, dname, loc)
values (40, 'OPERATIONS', 'BOSTON');//运营部门//插入员工
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7369, 'SMITH', 'CLERK', 7902, '1980-12-17', 800, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7499, 'ALLEN', 'SALESMAN', 7698, '1981-02-20', 1600, 300, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7521, 'WARD', 'SALESMAN', 7698, '1981-02-22', 1250, 500, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7566, 'JONES', 'MANAGER', 7839, '1981-04-02', 2975, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7654, 'MARTIN', 'SALESMAN', 7698, '1981-09-28', 1250, 1400, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7698, 'BLAKE', 'MANAGER', 7839, '1981-05-01', 2850, null, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7782, 'CLARK', 'MANAGER', 7839, '1981-06-09', 2450, null, 10);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7788, 'SCOTT', 'ANALYST', 7566, '1987-04-19', 3000, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7839, 'KING', 'PRESIDENT', null, '1981-11-17', 5000, null, 10);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7844, 'TURNER', 'SALESMAN', 7698,'1981-09-08', 1500, 0, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7876, 'ADAMS', 'CLERK', 7788, '1987-05-23', 1100, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7900, 'JAMES', 'CLERK', 7698, '1981-12-03', 950, null, 30);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7902, 'FORD', 'ANALYST', 7566, '1981-12-03', 3000, null, 20);insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7934, 'MILLER', 'CLERK', 7782, '1982-01-23', 1300, null, 10);//插入不同等级的薪资
insert into salgrade (grade, losal, hisal) values (1, 700, 1200);
insert into salgrade (grade, losal, hisal) values (2, 1201, 1400);
insert into salgrade (grade, losal, hisal) values (3, 1401, 2000);
insert into salgrade (grade, losal, hisal) values (4, 2001, 3000);
insert into salgrade (grade, losal, hisal) values (5, 3001, 9999);
该数据库的表结构
表emp
表 dept
表salgrade
显示每个部分的平均工资和最高工资
select deptno,max(sal) 最高,avg(sal) 平均 from EMP group by deptno;
from emp
:- 从 emp(员工)表中查询数据
group by deptno
:- 按部门编号(deptno)将员工数据分组
- 意味着所有具有相同部门编号的员工会被归类到同一个组
select
部分:deptno
:显示部门编号max(sal) 最高
:计算每个部门的最高工资avg(sal) 平均
:计算每个部门的平均工资
这个查询的具体含义是:
- 按部门编号(deptno)将员工表(emp)分组
- 对每个部门计算:
- 最高工资(max(sal))
- 平均工资(avg(sal))
groupby的宏观理解
让我们进行分组聚合统计的。分组指定列名,实际分组是用该列的不同的行数据
比如说你按照deptno进行分组,那它就会把deptno列中,相同的数据成为一组,也就是可以被聚合压缩。
分组,就是把一组按照条件拆成了多个组,然后进行各自组内的统计。
分组也就是把一张表按照条件在逻辑上拆成了多个子表,然后分别对各自的子表进行聚合统计
显示每个部门的每种岗位的平均工资和最低工资
也就是说不仅要按照部门分组,也要按照岗位分组
用,来进行区分不同的组
select deptno,job from EMP group by deptno, job;
再聚合,也就是进行计算所需要的数据
select deptno,job,avg(sal) 平均,min(sal) 最低 from EMP group by deptno, job;
为啥进行员工名字ename分组的时候不行呢?
原因是ename没有在分组条件中出现,不属于分组条件,所以无法进行聚合和压缩。也就是说,select后面要想能出现,必须在group by后进行添加。
显示平均工资低于2000的部门和它的平均工资
第一步,先统计出来每一个部门的平均工资,然后在进行对比,也就是说先把结果聚合出来
select deptno,avg(sal) deptavg from EMP group by deptno;
第二步,再进行判断。就是对聚合的结果进行判断
select deptno,avg(sal) deptavg from EMP group by deptno having deptavg<2000;
那怎么对聚合的结果进行判断呢?
having和group by配合使用,对group by结果进行过滤
having经常和group by搭配使用,作用是对聚合后的统计数据进行条件筛选,作用有些像where。
hvaing和where的区别理解是什么呢?
- 执行顺序不同:
- WHERE在分组和聚合函数计算之前执行
- HAVING在分组和聚合函数计算之后执行
- 作用对象不同:
- WHERE作用于表中的列/字段,筛选原始数据
- HAVING作用于分组后的结果集,可以使用聚合函数
不要单纯的认为,只有磁盘上表结构导入到mysql,真实存在的表才叫做表。中间筛选出来的,包括最终结果,全部都是逻辑上的表!“MySQL一切皆表”。也就是说未来只要我们处理好单表的CURD,所有的sql场景我们全部都能用统一的方式进行
面试题:SQL查询中各个关键字的执行先后顺序 from > on> join > where > group by > with > having > select > distinct > order by > limit