大数据分析入门10分钟快速了解SQL

SQL是什么?

SQL全称Structured Query Language(结构化查询语言”)

为什么要用SQL?

SQL通用

常见的表格分析操作,Excel也能做,为什么不用呢?

因为处理上亿行大数据时,Excel并不够用。

而常见的大数据引擎Hive、Spark、Flink都支持SQL,SQL在大数据中是通用语言。

SQL易用

Python和Java需要自己写算法,而SQL只需要描述结果,相比写算法简单太多了。

怎么用SQL?

只需要记住你有什么数据,想要什么数据。

再找相应的语法例子,自己改一改就会用了。

简单查询(SELECT)

你有一张users表,表中有id,name,age,city_code四个字段。

如果你想要知道name为张三的人的信息,那么SQL是

select id,name,city_code 
from users where name = '张三‘

排序查询(ORDER BY)

如果你想看看最年长的10位,那么SQL是

select id,name,city_code 
from users 
order by age desc -- desc表降序,asc表示升序
limit 10

聚合查询(GROUP BY)

如果你想要知道每个城市有多少人,那么SQL是

select count(id) as cnt  
from users 
group by city_code

连接查询(JOIN)

你有一张cities表,会有city_code,city_name字段。

它如同“邮政编码”和“地区”一样将“100000”映射到“北京”。

如果users直接存city_name,当city_name变化时,需要修改users表的多行;而有了cities,只需要改cities表中的1行

如果你想要知道每个人所在城市名称,那么SQL是

select name, city_name
from users
join cities
on users.city_code=cities.city_code

总结

10分钟带你了解了SQL的大概,但SQL远不止这些。

欢迎提出你遇到的SQL问题,我会针对性的出一些教程解答大家问题的~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/6587.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Django之单文件上传(以图片为例)

一,创建项目 初始化,数据迁移,创建superuser,创建app等 二,配置settings.py 1,配置数据库(本作者使用的mysql),以前文章有提到 2,配置静态文件存放路径 STAT…

2-手工sql注入(进阶篇) sqlilabs靶场5-10题

1. 阅读,学习本章前,可以先去看看基础篇:1-手工sql注入(基础篇)-CSDN博客 2. 本章通过对sqlilabs靶场的实战,关于sqlilabs靶场的搭建:Linux搭建靶场-CSDN博客 3. 本章会使用到sqlmap,关于sqlmap的命令&…

Vitis HLS 学习笔记--HLS流水线基本用法

目录 1. 简介 2. 示例 2.1 对内层循环打拍 2.2 对外层循环打拍 2.3 优化数组访问后打拍 3. 总结 1. 简介 本文介绍pipeline的基本用法。pipeline是一种用于提高硬件设计性能的技术。本文介绍了pipeline在累加计算函数中的应用。通过优化内外层循环和数组访问&#xff0c…

C++初学者,使用汉语编程

现在的IDE是完全支持中文编程的,对于C语系的爱好者来说,又可以发挥自己的想象力了。 今天使用一些宏定义写了一个小程序,用于玩弄C.

合合信息embedding模型登顶MTEB中文榜单:中文文本向量化技术的创新突破

引言MTEB中文榜单:权威性与挑战并存Embedding:特征与优势凸显模型应用:开启文本智能新篇章升级迭代:攻克行业技术难点结尾 引言 在信息化时代,文本数据呈爆炸式增长,如何高效、准确地处理和分析这些文本数…

Apache ShardingSphere知识点表格总结及配置示例

ShardingSphere(之前称为Sharding-JDBC)是一个分布式数据库解决方案,它提供SQL路由、分片、读写分离、弹性伸缩等功能。ShardingSphere官网的文档和示例也非常详细,所以入门以及在项目中实践其实是很简单的。但是很多培训的课程故…

数据库——实验10 数据库的安全性

1. 安全认证模式 SQL Server有两种身份认证模式:Windows 认证模式和混合认证模式(即 Windows 身份验证和 SQL Server 身份验证)。 (1)仅 Windows 认证模式:这是 SQL Server 2005 的默认身份验证模式,适用于所有登录者均为 Windows 200…

Vue3-element-plus表格

一、element-plus 1.用组件属性实现跳转路由 <el-menu active-text-color"#ffd04b" background-color"#232323" :default-active"$route.path" //高亮 text-color"#fff"router><el-menu-item index"/article/channe…

【算法刷题日志】吸氧羊的StarryCoding之旅 - 贡献法计算

题目链接&#xff1a;https://www.starrycoding.com/problem/3 题目描述 吸氧羊终于注册了一个StarryCoding账号&#xff01;&#xff08;她很开心&#xff09; 但是吸氧羊忘记了它的密码&#xff0c;她想起你是计算机大师&#xff0c;于是就来请教你。 她虽然不记得密码了…

hive将时间字符串转换为timestamp的几种写法

写法一 select from_utc_timestamp(from_unixtime(unix_timestamp(2023-8-7 9:38:10 UTC08:00, yyyy-MM-dd HH:mm:ss)), UTC);写法二 select cast(unix_timestamp(2023-8-7 9:38:10 UTC08:00, yyyy-MM-dd HH:mm:ss) as timestamp);写法三 select cast(trim(split(upper(2023…

校园餐厅预约系统(请打开git自行访问)

校园餐厅预约系统详细介绍 项目地址&#xff1a;https://gitee.com/zhang—xuan/online_booking_system 服务端部分 Socket类 作用&#xff1a;创建socket连接&#xff0c;作为服务端与客户端通信的基础。 Sock_Obj类 基类&#xff1a;定义了服务端需要的基本操作和属性。 派生…

C++ | Leetcode C++题解之第70题爬楼梯

题目&#xff1a; 题解&#xff1a; class Solution { public:int climbStairs(int n) {double sqrt5 sqrt(5);double fibn pow((1 sqrt5) / 2, n 1) - pow((1 - sqrt5) / 2, n 1);return (int)round(fibn / sqrt5);} };

SPI(通信协议)

简介 SPI是一个同步的数据总线&#xff0c;也就是说它是用单独的数据线和一个单独的时钟信号来保证发送端和接收端的完美同步。 时钟是一个震荡信号&#xff0c;它告诉接收端在确切的时机对数据线上的信号进行采样。 产生时钟的一侧称为主机&#xff0c;另一侧称为从机。总是…

Oracle基础4

1 视图 1.1 视图的基本创建 查询 t_owners 和 查询 view_test_1 实际是一样的 数据源表发生变化 那么视图也会发生变化 drop view VIEW_TEST_1; select * from T_OWNERS; create view view_test_1 as ( select * from T_OWNERS ); select * from view_test_1; 1.2 对复杂sq…

VMware虚拟机中ubuntu使用记录(6)—— 如何标定单目相机的内参(张正友标定法)

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、张正友相机标定法1. 工具的准备2. 标定的步骤(1) 启动相机(2) 启动标定程序(3) 标定过程的操作(5)可能的报错 3. 标定文件内容解析 前言 张正友相机标定法…

编译 x264 for iOS

文章目录 编译在 FFMpeg 启用 x264其他编译选项报错处理 环境 &#xff1a; macOS 14.3.1 x264 - 20191217-2245 编译 1、下载 x264 源码 http://download.videolan.org/pub/videolan/x264/snapshots/ 这里我下载x264-snapshot-20191217-2245.tar.bz2 &#xff08;截止2024-…

centos学习- ps命令详解-进程监控的利器

ps命令详解&#xff1a;Linux进程监控的利器 在Linux系统管理中&#xff0c;进程监控是一个至关重要的环节。ps命令是Linux系统中一个功能强大的进程查看工具&#xff0c;通过它可以获取当前系统中所有进程的快照信息&#xff0c;并深入了解各个进程的详细信息。结合其各种选项…

OpenAI下周将发布ChatGPT搜索引擎,挑战谷歌搜索!

目前&#xff0c;多方位消息证实&#xff0c;OpenAI将会在5月9日上午10点公布该消息&#xff0c;大约是北京时间周五的凌晨2点。 5月3日&#xff0c;前Mila研究员、麻省理工讲师Lior S爆料&#xff0c;根据OpenAI最新的SSL证书日志显示&#xff0c;已经创建了search.chatgpt.c…

跨域初识--如何解决跨域

04 【跨域初识】 1.同源策略 同源策略(Same-Origin Policy)最早由Netscape 公司提出&#xff0c;是浏览器的一种安全策略同源&#xff1a; 协议、域名、端口号必须完全相同跨域&#xff1a; 违背同源策略就是跨域 2.如何解决跨域 2.1 JSONP jsonp只支持get请求不支持post请…

Flutter笔记:Widgets Easier组件库(12)使用消息吐丝(Notify Toasts)

Flutter笔记 Widgets Easier组件库&#xff08;12&#xff09;使用消息吐丝&#xff08;Notify Toasts&#xff09; - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite&#xff1a;http://thispage.tech/Email: 29114848416…