Oracle 回归分析函数使用

Oracle 回归分析函数使用


文章目录

  • Oracle 回归分析函数使用
  • 什么是 回归分析函数
  • 回归分析函数示例
    • 1. 分析 SAL 和 COMM 之间的回归关系
    • 2. 按部门分析 SAL 和 COMM 的关系
    • 3. 根据 SAL 预测 COMM
    • 4. 分析员工薪资与工作年限的关
    • 5. 按部门分析工作年限与薪资的关系
    • 6. 计算 REGR_AVGX 和 REGR_AVGY
    • 7. 检测薪资和奖金的相关性
    • 8. 分析奖金与薪资平方和
    • 总结


什么是 回归分析函数

回归分析的定义
回归分析是一种统计方法,用于分析两个或多个变量之间的关系。在回归分析中:

自变量(独立变量 X):用于预测的变量。
因变量(依赖变量 Y):被预测或解释的变量。
回归分析的目的是通过数学模型表示变量之间的关系,常用于预测和因果分析。


提示:以下是本篇文章正文内容,下面案例可供参考

回归分析函数示例

回归分析函数是一组内置在数据库中的统计函数,用于直接在 SQL 查询中完成线性回归的计算。这些函数帮助用户分析数据集中的两列数据(X 和 Y)之间的关系,无需借助外部工具(如 Python、R)。

1. 分析 SAL 和 COMM 之间的回归关系

分析员工的薪资(SAL)和奖金(COMM)之间的关系。

SELECT REGR_SLOPE(comm, sal) AS slope,REGR_INTERCEPT(comm, sal) AS intercept,REGR_R2(comm, sal) AS r_squared,REGR_AVGX(comm, sal) AS avg_sal,REGR_AVGY(comm, sal) AS avg_comm,REGR_COUNT(comm, sal) AS valid_pairs
FROM emp
WHERE comm IS NOT NULL;

结果解释
SLOPE:薪资每增加 1 单位时,奖金的变化量。
INTERCEPT:回归线在 Y 轴上的截距。
R_SQUARED:拟合优度,越接近 1,表示模型越准确。
AVG_SAL:参与计算的薪资的平均值。
AVG_COMM:参与计算的奖金的平均值。
VALID_PAIRS:有效的薪资和奖金数据对数。

2. 按部门分析 SAL 和 COMM 的关系

对于每个部门,分析薪资与奖金之间的关系。

SELECT deptno,REGR_SLOPE(comm, sal) AS slope,REGR_INTERCEPT(comm, sal) AS intercept,REGR_R2(comm, sal) AS r_squared,REGR_AVGX(comm, sal) AS avg_sal,REGR_AVGY(comm, sal) AS avg_comm,REGR_COUNT(comm, sal) AS valid_pairs
FROM emp
WHERE comm IS NOT NULL
GROUP BY deptno;

结果解释
每个部门的回归模型描述了薪资和奖金之间的线性关系。
有效数据点数目可以帮助判断模型的可靠性。

3. 根据 SAL 预测 COMM

假设 COMM 是因变量,使用回归模型根据薪资预测奖金。

SELECT empno, ename, sal,REGR_SLOPE(comm, sal) OVER () * sal + REGR_INTERCEPT(comm, sal) OVER () AS predicted_comm
FROM emp
WHERE comm IS NOT NULL;

结果解释
PREDICTED_COMM 是根据薪资计算出的预测奖金。
可以与实际奖金值(COMM)比较,以评估模型的准确性。

4. 分析员工薪资与工作年限的关

假设 HIREDATE 表示员工入职日期,可以计算员工的工作年限,并分析薪资与工作年限之间的关系。

SELECT REGR_SLOPE(sal, FLOOR(MONTHS_BETWEEN(SYSDATE, hiredate) / 12)) AS slope,REGR_INTERCEPT(sal, FLOOR(MONTHS_BETWEEN(SYSDATE, hiredate) / 12)) AS intercept,REGR_R2(sal, FLOOR(MONTHS_BETWEEN(SYSDATE, hiredate) / 12)) AS r_squared,REGR_AVGX(sal, FLOOR(MONTHS_BETWEEN(SYSDATE, hiredate) / 12)) AS avg_years,REGR_AVGY(sal, FLOOR(MONTHS_BETWEEN(SYSDATE, hiredate) / 12)) AS avg_sal
FROM emp;

结果解释
SLOPE:工作年限每增加 1 年,薪资的平均增量。
INTERCEPT:工作年限为 0 时的起始薪资。
R_SQUARED:薪资与工作年限的拟合优度。
AVG_YEARS:工作年限的平均值。
AVG_SAL:薪资的平均值。

5. 按部门分析工作年限与薪资的关系

对每个部门的员工,分析工作年限与薪资之间的关系

SELECT deptno,REGR_SLOPE(sal, FLOOR(MONTHS_BETWEEN(SYSDATE, hiredate) / 12)) AS slope,REGR_INTERCEPT(sal, FLOOR(MONTHS_BETWEEN(SYSDATE, hiredate) / 12)) AS intercept,REGR_R2(sal, FLOOR(MONTHS_BETWEEN(SYSDATE, hiredate) / 12)) AS r_squared,REGR_COUNT(sal, FLOOR(MONTHS_BETWEEN(SYSDATE, hiredate) / 12)) AS valid_pairs
FROM emp
GROUP BY deptno;

结果解释
每个部门的回归模型显示工作年限对薪资的影响。
VALID_PAIRS 表示有效数据对数,数据对越多,模型越可靠。

6. 计算 REGR_AVGX 和 REGR_AVGY

直接计算 SAL 和 COMM 的平均值,作为回归分析的辅助信息。

SELECT REGR_AVGX(sal, comm) AS avg_salary,REGR_AVGY(sal, comm) AS avg_comm
FROM emp
WHERE comm IS NOT NULL;

结果解释
AVG_SALARY 是薪资的平均值。
AVG_COMM 是奖金的平均值。

7. 检测薪资和奖金的相关性

使用 CORR 函数计算薪资与奖金之间的相关性。

SELECT CORR(sal, comm) AS correlation
FROM emp
WHERE comm IS NOT NULL;

结果解释
CORRELATION 是相关系数:
值为 1:表示完全正相关。
值为 -1:表示完全负相关。
值为 0:表示无相关性。

8. 分析奖金与薪资平方和

计算奖金和薪资的平方和及协方差,用于进一步的回归分析。

SELECT REGR_SXX(comm, sal) AS sxx,  -- X 的平方和REGR_SYY(comm, sal) AS syy,  -- Y 的平方和REGR_SXY(comm, sal) AS sxy   -- X 和 Y 的协方差
FROM emp
WHERE comm IS NOT NULL;

结果解释
SXX 是薪资的平方和。
SYY 是奖金的平方和。
SXY 是薪资和奖金的协方差,用于表示 X 和 Y 的关系。

总结

在这里插入图片描述
在这里插入图片描述
Oracle 的回归分析函数提供了一种快速、高效的方法来分析变量之间的线性关系。通过这些函数,用户可以直接在 SQL 中完成线性回归建模、相关性分析和预测任务,特别适合简单的单变量线性回归场景。对于更复杂的回归分析(如多元回归或非线性回归),可以结合其他工具(如 Python 或 R)进一步分析。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/65714.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

集装箱的纸箱和塑料箱识别数据集,使用YOLO,COCO JSON,PASICAL VOC XML格式标注,识别准确率高达97.5%

集装箱的纸箱和塑料箱识别数据集,使用YOLO,COCO JSON,PASICAL VOC XML格式标注,识别准确率高达97.5% 数据集分割 训练组88% 4605图片 有效集8% 438图片 测试集4% 219图片 预处理 自动定向&#x…

STM32 高级 物联网通讯之LoRa通讯

目录 LoRa通讯基础知识 常见的3种通讯协议 远距离高速率的传输协议 近距离高速率传输技术 近距离低功耗传输技术 低功耗广域网 采用授权频段技术 非授权频段 LoRa简介 LoRa的特点 远距离 低功耗 安全 标准化 地理定位 移动性 高性能 低成本 LoRa应用 LoRa组…

【数据可视化-10】国防科技大学录取分数线可视化分析

🧑 博主简介:曾任某智慧城市类企业算法总监,目前在美国市场的物流公司从事高级算法工程师一职,深耕人工智能领域,精通python数据挖掘、可视化、机器学习等,发表过AI相关的专利并多次在AI类比赛中获奖。CSDN…

基于单片机中药存放环境监测系统的实现

基于单片机中药存放环境监测系统的实现 项目开发背景 随着现代中药的广泛应用,中药材的存储环境对其质量有着至关重要的影响。温湿度、烟雾、火灾等环境因素,若不加以控制,将会导致中药材失效或变质。因此,设计一个基于单片机的…

【贪心算法】贪心算法七

贪心算法七 1.整数替换2.俄罗斯套娃信封问题3.可被三整除的最大和4.距离相等的条形码5.重构字符串 点赞👍👍收藏🌟🌟关注💖💖 你的支持是对我最大的鼓励,我们一起努力吧!😃&#x1f…

如何在 Ubuntu 22.04 上部署 Nginx 并优化以应对高流量网站教程

简介 本教程将教你如何优化 Nginx,使其能够高效地处理高流量网站。 Nginx 是一个强大且高性能的 Web 服务器,以其高效处理大量并发连接的能力而闻名,这使得它成为高流量网站的流行选择。 正确优化 Nginx 可以显著提高服务器的性能&#xff0…

活动预告 |【Part1】Microsoft Azure 在线技术公开课:数据基础知识

课程介绍 参加“Azure 在线技术公开课:数据基础知识”活动,了解有关云环境和数据服务中核心数据库概念的基础知识。通过本次免费的介绍性活动,你将提升在关系数据、非关系数据、大数据和分析方面的技能。 活动时间:01 月 07 日…

4G报警器WT2003H-16S低功耗语音芯片方案开发-实时音频上传

一、引言 在当今社会,安全问题始终是人们关注的重中之重。无论是家庭、企业还是公共场所,都需要一套可靠的安全防护系统来保障人员和财产的安全。随着科技的飞速发展,4G 报警器应运而生,为安全防范领域带来了全新的解决方案。…

短视频矩阵源码开发提供api/saas短视频矩阵快速对接搭建

上周,我有幸接待了一批来自教育行业的伙伴。令人惊讶的是,他们目前主要依赖于传统的线下推荐和地面推广方式进行业务拓展,对线上营销策略了解不多。这种情况引发了我对当前实体行业向线上转型的思考。 在当今社会,随着短视频营销逐…

GPU 进阶笔记(一):高性能 GPU 服务器硬件拓扑与集群组网

记录一些平时接触到的 GPU 知识。由于是笔记而非教程,因此内容不求连贯,有基础的同学可作查漏补缺之用 1 术语与基础 1.1 PCIe 交换芯片1.2 NVLink 定义演进:1/2/3/4 代监控1.3 NVSwitch1.4 NVLink Switch1.5 HBM (High Bandwidth Memory) 由…

24年收尾之作------动态规划<六> 子序列问题(含对应LeetcodeOJ题)

目录 引例 经典LeetCode OJ题 1.第一题 2.第二题 3.第三题 4.第四题 5.第五题 6.第六题 7.第七题 引例 OJ传送门 LeetCode<300>最长递增子序列 画图分析: 使用动态规划解决 1.状态表示 dp[i]表示以i位置元素为结尾的子序列中&#xff0c;最长递增子序列的长度 2.…

使用 ASP.NET Core wwwroot 上传和存储文件

在 ASP.NET Core 应用程序中上传和存储文件是用户个人资料、产品目录等功能的常见要求。本指南将解释使用wwwroot存储图像&#xff08;可用于文件&#xff09;的过程以及如何在应用程序中处理图像上传。 步骤 1&#xff1a;设置项目环境 确保您的 ASP.NET 项目中具有必要的依…

格式化输出年月日

直接上图 结论&#xff1a;老老实实用yyyy&#xff0c;得到的年月日是我们口头上说的时间&#xff0c;而YYYY有点反人类.... 对于一年的最后一周的一些日子&#xff0c;会统计成下一年&#xff1b; 对于下一年的第一周的一些日子&#xff0c;会统计成上一年&#xff1b; 你猜…

【超级详细】七牛云配置阿里云域名详细过程记录

0. 准备一个阿里云域名&#xff0c;记得要备案&#xff01;&#xff01;&#xff01;&#xff01; 1. 创建七牛云存储空间 首先&#xff0c;登录七牛云控制台&#xff0c;创建一个新的存储空间&#xff08;Bucket&#xff09;。这个存储空间将用于存放你的文件&#xff0c;并…

【C++】2029:【例4.15】水仙花数

博客主页&#xff1a; [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: C 文章目录 &#x1f4af;前言&#x1f4af;题目描述&#x1f4af;我的做法思路分析优势不足之处 &#x1f4af;老师的做法思路分析优势不足 &#x1f4af;对比和优化实现方式对比优化思路和操作1. 直接分解数字的各位…

RabbitMQ基础篇之Java客户端 Work Queues

文章目录 模型概述需求实现步骤创建队列定义消费者定义消息发送测试执行观察结论多消费者的作用性能差异生产环境中的应用 处理速度差异的情况 优化示例总结 模型概述 Work Queues 模型也称为任务模型&#xff0c;多个消费者绑定到同一个队列&#xff0c;共同消费队列中的消息…

vscode代码AI插件Continue 安装与使用

“Continue” 是一款强大的插件&#xff0c;它主要用于在开发过程中提供智能的代码延续功能。例如&#xff0c;当你在编写代码并且需要进行下一步操作或者完成一个代码块时&#xff0c;它能够根据代码的上下文、语法规则以及相关的库和框架知识&#xff0c;为你提供可能的代码续…

ubuntu 如何使用vrf

在Ubuntu或其他Linux系统中&#xff0c;您使用ip命令和sysctl命令配置的网络和内核参数通常是临时的&#xff0c;这意味着在系统重启后这些配置会丢失。为了将这些配置持久化&#xff0c;您需要采取一些额外的步骤。 对于ip命令配置的网络接口和路由&#xff0c;您可以将这些配…

二、SQL语言,《数据库系统概念》,原书第7版

文章目录 一、概览SQL语言1.1 SQL 语言概述1.1.1 SQL语言的提出和发展1.1.2 SQL 语言的功能概述 1.2 利用SQL语言建立数据库1.2.1 示例1.2.2 SQL-DDL1.2.2.1 CREATE DATABASE1.2.2.2 CREATE TABLE 1.2.3 SQL-DML1.2.3.1 INSERT INTO 1.3 用SQL 语言进行简单查询1.3.1 单表查询 …

【ArcGIS Pro/GeoScene Pro】可视化时态数据

可视化过去二十年新西兰国际旅游业的发展变化 工程数据下载 ArcGIS Pro 快速入门指南—ArcGIS Pro | 文档 添加数据 数据为中国旅客数据 转置表字段 列数据转行数据