show functions; #查看所有内置函数,共271个 show function sum; #查看sum函数的描述信息 show function extended sum; #查看内置函数的描述信息和举例的使用方法
举例数据表:stu
id | name | address | score | credit |
01 | huang | hebi,changzhou,dalian | chinese:80,math:90 | 3.2 |
02 | meng | hebi,taiyuan | chinese:85,math:70 | 4 |
聚合函数(多对一:多个参数计算成一个值)
1.ceil(X):取上限,取不小于X的最小整数;
select ceil(max(credit)) from stu;
学分最大值是4,ceil(4) = 4
2.floor(X):取下限,取不大于X的最大整数;
select floor(min(credit)) from stu;
学分最小值是3.2,floor(3.2) = 3
3.abs(X):取绝对值
4.array(x,y,z):转化为数组
select array(1,2,3) ;
输出:
1
2
3
5.map(a,b,c,d):转化为map,括号中的元素个数必须为偶数个,其中奇数位是key,偶数位是value
select map(1,2,3,4) ;
输出:
1 2
3 4
6.concat(x,y,z) / concat_ws(x,y,z):拼接函数;
select concat('hello','-','world','-','!'); select concat_ws('-', 'hello','world','!'); #均输出:hello-world-!
7.substring(str, pos, len):截取函数
select substring('hello world',1,3) ; #输出:hel select substring('hello world',1) ; #输出:hello world select substring('hello world',-3,2) ; #输出:rl select substring('hello world',-3) ; #输出:rld
8.instr(str1, str2):查找字符str2在字符str1中第一次出现的位置
select instr('hello','l') ; #输出:3 select instr('hello','x') ; #输出:0,因为str1中没有x
9.nvl(value,default_value) / getlong(属性值, 替代值):一般用于处理缺失值
select address[2] from stu; #输出:dalian null select nvl(address[2],'china') from stu; #输出:dalian china
10.if(条件?,条件为真的返回值,条件为假的返回值):条件函数
select if(address[2] is null, 'china', address[2]) from stu; #输出:dalian china
炸裂函数(一对多:一个值炸裂成多个)
1.explode(x):炸裂函数
select explode(address) from stu ; # x是array数组:
输出:
hebi
changzhou
dalian
hebi
taiyuan
select explode(score) from stu ; # x是map:
输出:
chinese 80
math 90
chinese 85
math 70
若是炸裂开之后还需要配上其他列的信息,比如想知道数学考了90的是谁?则需要使用横向视图lateral view
select [表中字段], [炸裂字段] from [表名] lateral view explode(被炸裂字段) [视图的别名] as [炸裂字段的别称];
map结构
select name, ts.sub, ts.res from stu lateral view explode(score) ts as sub,res;#因为score是map结构,因此需要有两个别称sub,res;
输出:
huang chinese 80
huang math 90
meng chinese 85
meng math 70
array类型
select name, ts.city from stu lateral view explode(address) ts as city;#address炸裂后只有一列,因此只需要1个别称city
输出:
huang hebi
huang changzhou
huang dalian
meng hebi
meng taiyuan
分组排名函数
1.row_number()、rank()、dense_rank() :分组排名,若不需要分组,则去掉partition by [字段]
row_number() over(partition by [字段] order by[字段]) #分组后给每一组中加组内排序1...n rank() over(partition by [字段] order by[字段]) #排名,同分的2个人占 2 个名额 dense_rank() over(partition by [字段] order by[字段]) #排名,同分的2个人占 1 个名额
举例:数据表stu
huang 18 math
he 17 math
meng 19 chinese
ji 17 math
li 16 chinese
liu 15 math
row_number():取每个部门中年龄最大的人的信息:
select t.sname,t.age,t.departmant, row_number() over(partition by departmant order by age desc) as rank FROM stu t;
结果:
huang 18 math 1
he 17 math 2
ji 17 math 3
liu 15 math 4
meng 19 chinese 1
li 16 chinese 2
rank():分部门按照年龄排名(分组计数排名):
select t.sname,t.age,t.departmant, rank() over(partition by departmant order by age desc) as rank FROM stu t;
结果:
huang 18 math 1
he 17 math 2
ji 17 math 2
liu 15 math 4 #第2 直接到第4
meng 19 chinese 1
li 16 chinese 2
dense_rank():分部门按照年龄排名(分组顺续排名):
select t.sname,t.age,t.departmant, dense_rank() over(partition by departmant order by age desc) as rank FROM stu t;
结果:
huang 18 math 1
he 17 math 2
ji 17 math 2
liu 15 math 3 #第2 到第3,第2名有两个人但是只占一个名额
meng 19 chinese 1
li 16 chinese