SQL Server多数据表之间的数据查询和分组查询

文章目录

  • 一、多数据表之间的数据查询
    • 1.1内连接查询(Inner join)
    • 1.2 左外连接 (LEFT JOIN):
    • 1.3右外连接 (RIGHT JOIN):
    • 1.4. 全外连接 (FULL OUTER JOIN):
    • 1.5 交叉连接 (CROSS JOIN):
    • 1.6 自连接 (SELF JOIN):
    • 1.7 子查询:
  • 二、分组查询
    • 2.1 分组查询
    • 2.2 查询重复数据

一、多数据表之间的数据查询

在SQL中,多数据表之间的查询主要用于以下方面:
在SQL Server中,多数据表之间的数据查询主要用于以下几个方面:

  1. 关联数据提取:现代数据库通常将数据分散在多个相关的表中以便于管理。例如,订单信息可能存储在一个表中,而客户信息可能存储在另一个表中。为了获取完整的订单详情,你可能需要从两个表中提取并合并信息。

  2. 数据整合:多表查询可用于整合来自不同数据源的信息,这对于报告和分析非常重要。比如,销售报告可能需要结合产品、销售和客户表中的数据。

  3. 性能优化:合理设计的数据库模型会将数据分散在多个表中,以减少冗余和提高性能。通过多表查询,可以有效地检索分散的数据而无需过多冗余。

  4. 数据完整性:数据库设计时通常会使用外键来维护不同数据表之间的关系,确保数据的一致性和完整性。多表查询可以利用这些关系来确保查询结果的准确性。

  5. 复杂的数据操作:多表查询允许执行复杂的数据操作,如连接(JOIN)、子查询(subquery)、并集(UNION)等,以执行复杂的业务逻辑和数据分析。

  6. 条件筛选:在多表查询中,可以通过在 WHERE 子句中设定条件来筛选跨多个表的数据,以满足特定的查询需求。

多表之间的数据查询主要有下面三种方式:
1.内连接查询
2.左外连接查询
3.右外连接查询

还有一些延伸的的方式,作简单介绍

1.1内连接查询(Inner join)

内连接用来查询两个或多个表中存在匹配关系的记录。仅返回在连接的表之间具有匹配值的行。既然是匹配关系,那也就是说内连接用于查找两个表中都有的记录,比如第一个表中有十行,那么响应的第二个表中也应该有十行与之对应。
语法格式:

select columns
from table1 
inner join table2 
on table1.column_name = table2.column_name;

最后一句解释:
ON table1.column_name = table2.column_name 是 SQL 查询中的一个语句片段,通常用在 JOIN 操作中,用来指定两个数据表之间的连接条件。这个语句的意思是,系统在连接 table1table2 这两张表时,会按照两张表中的指定列 column_name 的值是否相等来确定哪些行之间应该被连接。

我们看一个具体的例子:
我们有两张表,表一Students:
在这里插入图片描述
表二ScoreList:

在这里插入图片描述

用下列程序:

select ScoreList.StudentId,StudentName,Gender ,Csharp
from ScoreList 
inner join Students on Students.StudentId=ScoreList.StudentId
where CSharp>80

得到结果:
在这里插入图片描述
就是说我们可以以两个表上相同的列为桥梁将两个表中我们想要的数据合到一张表上,而且两张表无先后位置。

1.2 左外连接 (LEFT JOIN):

左外连接返回左表(FROM 子句中指定的表)的所有记录以及右表中匹配的记录。外连接(左、右、全)用于包含没有匹配的行的情景如果左表的行在右表中没有匹配,则结果集中这些行的右表部分为 NULL。语法:

select columns
from table1 
left join table2 
on table1.column_name = table2.column_name;

比如:table1(左表)是:
在这里插入图片描述
table2(右表)是:
在这里插入图片描述
我们看到右表比左表少了一行,所以自动补上了NULL
在这里插入图片描述

1.3右外连接 (RIGHT JOIN):

右外连接与左外连接对应,返回右表的所有记录以及左表中匹配的记录。如果右表的行在左表中没有匹配,则结果集中这些行的左表部分为 NULL。

select columns
from table1 
right join table2 
on table1.column_name = table2.column_name;

1.4. 全外连接 (FULL OUTER JOIN):

全外连接返回左表和右表中的所有记录。当左表中的行在右表中没有匹配时,或者右表中的行在左表中没有匹配时,结果集会用 NULL 补充。

select columns
from table1 
full outer join table2 
on table1.column_name = table2.column_name;

1.5 交叉连接 (CROSS JOIN):

交叉连接返回两个表中所有可能的行组合。如果第一个表有10行,第二个表有5行,交叉连接的结果将有50行。不常用

select columns
from table1 
cross join table2;

1.6 自连接 (SELF JOIN):

自连接是一种特殊形式的内连接或外连接,表与自身连接。不常用:

SQL Server 中的自连接(SELF JOIN)是一种特殊类型的连接,其中一个表会根据与自身的某些条件关联来进行连接。自连接通常用于处理那些在同一表内部就需要关联查询的情况,比如层级数据、树状结构或是任何需要比较同一个表内两个不同记录的场景。

在自连接中,实际上是把同一个表当作是两个独立的表进行连接操作。虽然物理上只有一个表,但是通过给表使用不同的别名,可以在查询中将其视为两个不同的表。

举个自连接的例子,假设我们有一个员工表 Employees,其中包含以下列:

  • EmployeeID (员工ID) - EmployeeName (员工姓名) - ManagerID (上级经理的员工ID)

在这种情况下,ManagerID 是这个员工的上级经理的 EmployeeID。我们想要列出所有员工及其对应的上级经理姓名。在这里,我们可以使用自连接来实现这个目标。

示例 SQL 查询如下:

selecte1.EmployeeName as EmployeeName,e2.EmployeeName as ManagerName
fromEmployees e1
left join Employees e2on e1.ManagerID = e2.EmployeeID;

在这个查询中,Employees 表以 e1e2 两个不同的别名存在。我们在查询中使用 left join 自连接这个表,通过 e1.ManagerID = e2.EmployeeID 条件来找到员工的上级经理。e1 代表的是员工,而 e2 代表的是经理。left join 确保了即使某些员工没有上级经理(ManagerIDNULL),他们的信息也会被列出。

结果将是一个两列的列表,第一列是员工的姓名,第二列是他们经理的姓名。如果某个员工没有经理,对应的 ManagerName 列会显示为 NULL

1.7 子查询:

子查询可以在另一个查询中使用,它可以从一个表中筛选数据,然后用来与另一个表比较或操作。

select columns
from table1
where column_name IN (SELECT column_name FROM table2 where condition);

二、分组查询

2.1 分组查询

在SQL Server Management Studio(SSMS)中,分组查询主要通过group by 子句实现。group by子句通常与聚合函数(如COUNT()SUM()AVG()MAX()MIN()等)一起使用,可以对一组行中的某些列进行分组,并对每个组进行聚合计算。

以下是一个简单的分组查询示例,假设有一个名为Sales的表,包含了ItemQuantitySaleDate三个字段:

Sales Table
-------------------------------------
| Item      | Quantity | SaleDate    |
-------------------------------------
| Pen       | 10       | 2023-01-01  |
| Notebook  | 20       | 2023-01-01  |
| Pen       | 5        | 2023-01-02  |
| Eraser    | 15       | 2023-01-02  |
| Notebook  | 30       | 2023-01-03  |
| Pen       | 10       | 2023-01-03  |
| Eraser    | 20       | 2023-01-03  |
-------------------------------------

我们运行以下SQL查询:

select Item, SUM(Quantity) as TotalQuantity
from Sales
group by Item;

这个呢,将返回每个不同物品(Item)的总销售数量(TotalQuantity)。结果如下所示:

Result
------------------------
| Item      | TotalQuantity |
------------------------
| Pen       | 25           |
| Notebook  | 50           |
| Eraser    | 35           |
------------------------

在这个结果中,PenTotalQuantity是25(10+5+10),NotebookTotalQuantity是50(20+30),而EraserTotalQuantity是35(15+20)。

如果我们还想过滤出总销售数量大于30的物品,那就可以使用having子句,如下所示:

select Item, SUM(Quantity) as TotalQuantity
from Sales
group by Item
having SUM(Quantity) > 30;

此查询将返回总销售数量超过30的物品的列表。结果集将会是:

Result
------------------------
| Item      | TotalQuantity |
------------------------
| Notebook  | 50           |
| Eraser    | 35           |
------------------------

在这个结果中,只有NotebookEraser显示在列表中,因为它们的TotalQuantity值分别是50和35,都大于30。

2.2 查询重复数据

在SQL Server中,要筛选出重复的数据,可以使用group byhaving子句结合聚合函数。例如,我么想要找出Sales表中Item字段重复的记录,可以使用以下查询:

select Item, COUNT(*)
FROM Sales
GROUP BY Item
HAVING COUNT(*) > 1;

这个查询是按Item分组的,然后数每个分组的行数。having count(*) > 1这个条件将筛选出那些行数大于1的分组,也就是那些有重复Item值的记录。
在SQL中,COUNT(*)是一个聚合函数,用来计算某个结果集中的行数。它会包含所有的行,包括NULL值在内。这里使用COUNT(*) 来找出Sales表中Item字段重复的记录。这里COUNT(*) 计算的是每个Item分组内的记录数,然后使用having COUNT(*) > 1 来过滤,只显示那些出现了不止一次的Item,这样就能找出重复的记录。

现在假设Sales表的内容如下所示:

Sales Table
-------------------------------------
| ID   | Item      | Quantity | SaleDate    |
-------------------------------------
| 1    | Pen       | 10       | 2023-01-01  |
| 2    | Notebook  | 20       | 2023-01-01  |
| 3    | Pen       | 5        | 2023-01-02  |
| 4    | Eraser    | 15       | 2023-01-02  |
| 5    | Notebook  | 30       | 2023-01-03  |
| 6    | Pen       | 10       | 2023-01-03  |
-------------------------------------

运行上述查询后,会得到如下结果:

Result
------------------------
| Item      | (No column name)  |
------------------------
| Pen       | 3                 |
| Notebook  | 2                 |
------------------------

这个结果中显示了PenNotebook是重复的,因为它们各自出现了3次和2次。

(不常用)如果我们还想要获取到具体的重复记录,可以使用子查询或者with关键字(CTE,也就是公用表达式)来获取这些数据。以下是使用子查询的例子:

select *
from Sales
where Item in (select Itemfrom Salesgroup by Itemhaving COUNT(*) > 1
);

这个查询返回了Item字段重复的所有记录。

而下面是使用CTE的例子:

with DuplicateItems as (select Item, COUNT(*) AS Countfrom Salesgroup by  Itemhaving COUNT(*) > 1
)
select s.*
from Sales s
Inner join DuplicateItems d on s.Item = d.Item;

这个查询使用CTE先找出重复的Item,然后通过内连接返回Sales表中相关的所有记录。

运行上述任一查询后,你将会得到包含重复Item所有数据的结果集,它们都包含ItemPenNotebook的记录。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/643253.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

静态分析C语言生成函数调用关系的利器——cflow(二)

大纲 环境准备选择项目分析代码简单分析高级分析坑:不能显示main函数所有调用函数的调用栈坑2:重定义错误坑3:缺失编译时产生的文件坑4:缺失工程的头文件包含路径指定坑5:操作系统的坑只存在于windows操作系统上的文件…

rabbitmq基础-java-1、快速入门

1、AMQP AMQP,即Advanced Message Queuing Protocol(高级消息队列协议),一个提供统一消息服务的应用层标准高级消息队列协议,是应用层协议的一个开放标准,为面向消息的中间件设计,基于此协议的客…

Parallels Desktop 19 mac 虚拟机软件 兼容M1 M2

Parallels Desktop 19 for Mac 是一款适用于 macOS 的虚拟机软件。无需重启即可在 Mac 上运行 Windows、Linux 等系统,具有速度快、操作简单且功能强大的优点。包括 30 余种实用工具,可简化 Mac 和 Windows 上的日常任务。 软件下载:Parallel…

Linux目录结构:深入理解与命令创建指南

目录 摘要: 一.linux目录介绍 1.目录结果设置标准 2.目录结构介绍 二.linux命令 1.常见命令 # 与 $ 提示的区别 ifconfig查看ip地址 su 命令格式 cd 目录查看 查看文件内容 创建目录及文件 复制和移动 tar find chmod 2. vim一般使用 摘要: 前…

基于中文垃圾短信数据集的经典文本分类算法实现

垃圾短信的泛滥给人们的日常生活带来了严重干扰,其中诈骗短信更是威胁到人们的信息与财产安全。因此,研究如何构建一种自动拦截过滤垃圾短信的机制有较强的实际应用价值。本文基于中文垃圾短信数据集,分别对比了朴素贝叶斯、逻辑回归、随机森…

CentOS使用

1.使用SSH连接操作虚拟机中的CentOS 1.1 配置静态IP 想要使用ssh连接就需要获取虚拟机的IP,但若DHCP,则每次连接都要确定虚拟机的IP是否变化,故直接分配一个静态IP vmware中,编辑–虚拟网络编辑器,记住下方的子网掩…

windows和linux下SHA1,MD5,SHA256校验办法

今天更新android studio到Android Studio Hedgehog | 2023.1.1时,发现提示本机安装的git版本太老,于是从git官网下载最新的git。 git下载地址: https://git-scm.com/ 从官网点击下载最新windows版本会跳转到github仓库来下载发布的git&…

【趣味CSS3.0】粘性定位属性Position:sticky是不是真的没用了?

🚀 个人主页 极客小俊 ✍🏻 作者简介:web开发者、设计师、技术分享博主 🐋 希望大家多多支持一下, 我们一起学习和进步!😄 🏅 如果文章对你有帮助的话,欢迎评论 💬点赞&a…

sublime text 开启vim模式

sublime text 开启vim模式 打开配置文件 mac下点击菜单栏 Sublime Text -> Settings... -> Settings 修改配置文件并保存 添加配置 // 开启vim模式 "ignored_packages": [// "Vintage", ], // 以命令模式打开文件 "vintage_start_in_comman…

视频监控平台EasyCVR增加fMP4流媒体视频格式及其应用场景介绍

近期我们在视频监控管理平台EasyCVR系统中新增了HTTP-FMP4播放协议,今天我们就来聊聊该协议的特点和应用。 fMP4(Fragmented MPEG-4)是基于MPEG-4 Part 12的流媒体格式,是流媒体的一项重要技术,因为它能通过互联网传送…

【GitHub项目推荐--12 年历史的 PDF 工具开源了】【转载】

最近在整理 PDF 的时候,有一些需求普通的 PDF 编辑器没办法满足,比如 PDF 批量合并、编辑等。 于是,我就去 GitHub 上看一看有没有现成的轮子,发现了这个 PDF 神器「PDF 补丁丁」,让人惊讶的是这个 PDF 神器有 12 年的…

RabbitMQ进阶篇【理解➕应用】

🥳🥳Welcome 的Huihuis Code World ! !🥳🥳 接下来看看由辉辉所写的关于RabbitMQ的相关操作吧 目录 🥳🥳Welcome 的Huihuis Code World ! !🥳🥳 一.什么是交换机 1.概念释义 2.例…

【数据分析】matplotlib、numpy、pandas速通

教程链接:【python教程】数据分析——numpy、pandas、matplotlib 资料:https://github.com/TheisTrue/DataAnalysis 1 matplotlib 官网链接:可查询各种图的使用及代码 对比常用统计图 1.1 折线图 (1)引入 from …

51单片机LCD1602调试工具

参考视频:江协科技51单片机 LCD1602头文件代码 #ifndef __LCD1602_H__ #define __LCD1602_H__//用户调用函数: void LCD_Init(); void LCD_ShowChar(unsigned char Line,unsigned char Column,char Char); void LCD_ShowString(unsigned char Line,un…

【深度学习】线性回归模型与梯度下降法

线性回归模型与梯度下降法 线性回归模型与枚举法 线性回归模型定义: w:权重b:偏置#mermaid-svg-ZAxF27Mw5dXNQgw2 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-ZAxF27Mw5dXNQgw2 .error-icon{fill:#552222;}…

机械硬件知识学习

目录 1.电机减速机、扭矩2.伺服电机、步进电机、直线电机3.电机马达的曲线运动是如何转化为轴的直线运动 大佬科普运动控制系统链接:https://www.cnblogs.com/cariohu/p/15508175.html 自己对机械知识的了解是盲区,学习下接触到的一些硬件知识&#xff0…

含源码|基于MATLAB的去雾系统(5种去雾算法+1种本文的改进算法)

去雾系统V2包括作者新加入的多尺度Retinex去雾算法以及改进去雾算法,以及4种评价去雾效果的客观指标。 00 目录 引言 去雾系统新增功能 结果分析 源码获取 展望 参考文献 01 引言 在作者前面写过的文章中,已经介绍过图像去雾算法的应用价值及研究现…

绝地求生:本周三停机维护更新4小时: RASH悲喜套装即将下线!

本周三将迎来停机维护更新四小时~,同时游戏商城内RASH悲喜联名套装即将下线,同时空投签到任务和荣都地图翻牌任务即将下线~ 预计维护时间: 2024年1月24日08:00~12:00 本周地图轮换情况 (1月24日 ~ 1月31日) 可自主选择地图的地区:艾伦格、泰戈、帝斯顿、…

DL/T 645 协议学习笔记

一、多功能电能表通信协议 DL/T645多功能电能表通信协议(Multi-function watt-hour meter communication protocol)标准是为统一和规范电能表的多功能电能表与数据终端设备进行数据交换时的物理连接和协议。 1、RS-485 标准串行电气接口 本标准采用 RS-…

5.Python爬虫前的准备工作

知识准备 1) Python语言 Python 爬虫作为 Python 编程的进阶知识,要求具备较好的 Python 编程基础 了解 Python 语言的多进程与多线程,并熟悉正则表达式语法,也有助于编写爬虫程序 2) Web前端 了解 Web 前端的基本知识,比如 …