回归分析笔记

回归分析

回归分析: 寻找两个或多个变量之间的函数关系(相关关系)

一元和线性

y = β 0 + β 1 x + ε \begin{aligned} y&=\beta_0+\beta_1x+\varepsilon\\ \end{aligned} y=β0+β1x+ε

  • 误差项 ε \varepsilon ε是一个期望值为0的随机变量,即 E ( ε ) = 0 E(\varepsilon)=0 E(ε)=0, 对于一个给定的 x x x值, y y y的期望值为 E ( y ) = β 0 + β 1 x E(y)=\beta_0+\beta_1x E(y)=β0+β1x
  • 对于所有的 x x x值, ε \varepsilon ε的方差 σ 2 \sigma^2 σ2都相同
  • 误差项 ε \varepsilon ε是一个服从正态分布的随机变量,且相互独立

β 1 = ∑ x i y i − n x ‾ y ‾ ∑ x 2 − n x ‾ β 0 = y ‾ − β 1 x ‾ \begin{aligned} \beta_1&=\frac{\sum x_iy_i-n\overline x\overline y}{\sum x^2-n\overline x}\\ \beta_0&=\overline y-\beta_1\overline x\\ \end{aligned} β1β0=x2nxxiyinxy=yβ1x

回归显著性校验:

  • 总离差平方和(SST): ∑ ( y i − y ‾ ) 2 \sum(y_i-\overline y)^2 (yiy)2
  • 残差平方和(SSE): ∑ ( y i − y ^ i ) 2 \sum(y_i-\hat y_i)^2 (yiy^i)2
  • 回归平方和(SSR): ∑ ( y ^ i − y ‾ ) 2 \sum(\hat y_i-\overline y)^2 (y^iy)2

S S T = ∑ ( y i − y ‾ ) 2 = ∑ [ ( y ^ i − y ‾ ) + ( y i − y ^ i ) ] 2 = ∑ ( y ^ i − y ‾ ) 2 + ∑ ( y i − y ^ i ) 2 + 2 ∑ ( y ^ i − y ‾ ) ( y i − y ^ i ) = ∑ ( y ^ i − y ‾ ) 2 + ∑ ( y i − y ^ i ) 2 + 0 = S S R + S S E \begin{aligned} SST&=\sum(y_i-\overline y)^2\\ &=\sum [(\hat y_i-\overline y)+(y_i-\hat y_i) ]^2\\ &=\sum(\hat y_i-\overline y)^2+\sum(y_i-\hat y_i)^2+2\sum(\hat y_i-\overline y)(y_i-\hat y_i)\\ &=\sum(\hat y_i-\overline y)^2+\sum(y_i-\hat y_i)^2+0\\ &=SSR+SSE \end{aligned} SST=(yiy)2=[(y^iy)+(yiy^i)]2=(y^iy)2+(yiy^i)2+2(y^iy)(yiy^i)=(y^iy)2+(yiy^i)2+0=SSR+SSE

相关系数 r r r

r 2 = S S R S S T = ∑ ( y ^ i − y ‾ ) 2 ∑ ( y i − y ‾ ) 2 = 1 − ∑ ( y i − y ^ ) 2 ∑ ( y i − y ‾ ) 2 r^2=\frac{SSR}{SST}=\frac{\sum(\hat y_i-\overline y)^2}{\sum(y_i-\overline y)^2}=1-\frac{\sum(y_i-\hat y)^2}{\sum(y_i-\overline y)^2} r2=SSTSSR=(yiy)2(y^iy)2=1(yiy)2(yiy^)2

  • r r r越接近于1,相关性越强
  • r ∈ [ 0 , 1 ] r\in[0, 1] r[0,1]
F F F检验
  • 提出假设: 线性关系不显著
  • 计算检验统计量 F F F

F = S S R / 1 S S E / ( n − 2 ) = ∑ ( y ^ i − y ‾ ) 2 ∑ ( y ^ i − y i ) 2 / ( n − 2 ) ∼ F ( 1 , n − 2 ) \begin{aligned} F&=\frac{SSR/1}{SSE/(n-2)}=\frac{\sum(\hat y_i-\overline y)^2}{\sum(\hat y_i-y_i)^2/(n-2)}\sim F(1, n-2)\\ \end{aligned} F=SSE/(n2)SSR/1=(y^iyi)2/(n2)(y^iy)2F(1,n2)

  • 确定显著性水平 α \alpha α,并根据分子自由度1和分母自由度(n-2)找出临界值 F α F_\alpha Fα作出决策: 若 F ≥ F α F\geq F_\alpha FFα, 拒绝假设; 否则接受假设。(概率论与数理统计)
  • F F F越大线性关系越显著
F F F r r r的关系

F = ( n − 2 ) r 2 1 − r 2 F=\frac{(n-2)r^2}{1-r^2}\\ F=1r2(n2)r2

  • 说明 F F F检验和 r r r相关系数的一致性
例题

在这里插入图片描述

重复测量的分析

对于同一个 x x x重复测量得到 y y y的值

  • 离差平方和: S S S

  • 残差平方和: Q Q Q

  • 回归平方和: U U U

  • 误差平方和: Q E Q_E QE

  • 失拟平方和: Q L Q_L QL

在这里插入图片描述

在这里插入图片描述

两个变量都有误差的一元线性回归

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

  • λ \lambda λ衡量了误差偏向的方向
  • 问题: 如何通过先验信息测出 λ = σ x 2 σ y 2 \lambda=\frac{\sigma_x^2}{\sigma_y^2} λ=σy2σx2?

一元非线性

  • 化非线性为线性问题的求解

典型的化解方法

y = α e β x y = α x β y = x α x + β y = α + β log ⁡ x y = 1 α + β e − x \begin{aligned} y&=\alpha e^{\beta x}\\ y&=\alpha x^\beta\\ y&=\frac{x}{\alpha x+\beta}\\ y&=\alpha+\beta\log x\\ y&=\frac{1}{\alpha+\beta e^{-x}}\\ \end{aligned} yyyyy=αeβx=αxβ=αx+βx=α+βlogx=α+βex1

在这里插入图片描述

具体步骤

  • 根据散点图确认非线性回归方程模式
  • 把非线性回归方程转换为线性回归方程
  • 依据线性回归方程进行求解
  • 再转换为非线性回归方程

在这里插入图片描述在这里插入图片描述

在这里插入图片描述

  • 观察数据是否符合某个曲线, 若符合则可以套用公式试试效果
  • 以下是常见的曲线

在这里插入图片描述

在这里插入图片描述

  • 在实际情况下,可能有多条曲线符合。这时需要将所有曲线都尝试一遍,然后做显著性校验,选取显著性校验最好的曲线作为结果。

多元线性

y ^ = b 0 + b 1 x 1 + b 2 x 2 + . . . + b M x M 由 最小二乘法 : Q = ∑ t = 1 M ( y t − y ^ t ) = ∑ t = 1 M ( y t − b 0 − b 1 x t 1 − b 2 x t 2 − . . . − b M x t M ) 2 = 最小 { ∂ Q ∂ b 0 = − 2 ∑ t = 1 M ( y t − b 0 − b 1 x t 1 − b 2 x t 2 − . . . − b M x t M ) = 0 ∂ Q ∂ b i = − 2 ∑ t = 1 M ( y t − b 0 − b 1 x t 1 − b 2 x t 2 − . . . − b M x t M ) = 0 i = 1 , 2...... M \begin{aligned} \hat y &=b_0+b_1x_1+b_2x_2+...+b_Mx_M\\ 由&最小二乘法:\\ Q&=\sum_{t=1}^M(y_t-\hat y_t)=\sum_{t=1}^M(y_t-b_0-b_1x_{t1}-b_2x_{t2}-...-b_Mx_{tM})^2=最小\\ &\begin{cases} \frac{\partial Q}{\partial b_0}=-2\sum_{t=1}^M(y_t-b_0-b_1x_{t1}-b_2x_{t2}-...-b_Mx_{tM})=0\\ \frac{\partial Q}{\partial b_{i}}=-2\sum_{t=1}^M(y_t-b_0-b_1x_{t1}-b_2x_{t2}-...-b_Mx_{tM})=0\\ i=1,2......M \end{cases} \end{aligned} y^Q=b0+b1x1+b2x2+...+bMxM最小二乘法:=t=1M(yty^t)=t=1M(ytb0b1xt1b2xt2...bMxtM)2=最小 b0Q=2t=1M(ytb0b1xt1b2xt2...bMxtM)=0biQ=2t=1M(ytb0b1xt1b2xt2...bMxtM)=0i=1,2......M

矩阵形式:
( X T X ) b = X T Y b = A − 1 B = ( X T X ) − 1 X T Y \begin{aligned} (X^TX)b&=X^TY\\ b=A^{-1}&B=(X^TX)^{-1}X^TY\\ \end{aligned} (XTX)bb=A1=XTYB=(XTX)1XTY
另一种方法
y ^ = μ 0 + b 1 ( x 1 − x ‾ 1 ) + b 2 ( x 2 − x ‾ 2 ) + . . . + b M ( x M − x ‾ M ) A b = B 其 中 : μ = b 1 x ‾ 1 + b 2 x ‾ 2 + . . . + b M x ‾ M = y ‾ \begin{aligned} \hat y&=\mu_0+b_1(x_1-\overline x_1)+b_2(x_2-\overline x_2)+...+b_M(x_M-\overline x_M)\\ \qquad &\qquad \qquad \qquad \qquad Ab=B\\ 其&中:\mu=b_1\overline x_1+b_2\overline x_2+...+b_M\overline x_M=\overline { y}\\ \end{aligned} y^=μ0+b1(x1x1)+b2(x2x2)+...+bM(xMxM)Ab=B:μ=b1x1+b2x2+...+bMxM=y

  • 要求的系数 b b b比上一种方法少一个,矩阵维数由 M + 1 → M M+1\to M M+1M

  • 计算量减少

F F F检验

在这里插入图片描述

实例

在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

参考资料

【名校公开课-误差理论与数据处理-钱政 | 北京航空航天大学】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/238338.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql 23-2day 数据库查询(DQL)

目录 数据库查询(DQL)环境:准备一个表格作为查询环境查看数据根据要求查看数据运算查询as 可以修改字段名字 进行查询查询所有部门拼接两个字段查询 2017年入职的员工一个是空null 一个是空白查询 NULL集合排序查询查看有那些组通配符正则查询函数 数据库查询(DQL) …

如何搭建Web自动化测试框架?

在程序员的世界中,一切重复性的工作,都应该通过程序自动执行。「自动化测试」就是一个最好的例子。 随着互联网应用开发周期越来越短,迭代速度越来越快,只会点点点,不懂开发的手工测试,已经无法满足如今的…

Java---泛型讲解

文章目录 1. 泛型类2. 泛型方法3. 泛型接口4. 类型通配符5. 可变参数6. 可变参数的使用 1. 泛型类 1. 格式&#xff1a;修饰符 class 类名 <类型>{ }。例如&#xff1a;public class Generic <T>{ }。 2. 代码块举例&#xff1a; public class Generic <T>{…

防火墙双机热备(HCIA)

目录 一、冗余分类 1、双机热备的产生 2、热备和冷备 二、VRRP VRRP注意事项 VRRP通告报文 三、VGMP 两种VGMP组 VGMP优先级 四、HRP 五、双机热备基本组网与配置 配置步骤 一、冗余分类 物理冗余&#xff1a;单设备改多设备&#xff0c;多线路连接。 网络冗余&a…

ssm420基于JavaEE的企业人事管理信息系统的设计与实现论文

摘 要 现代经济快节奏发展以及不断完善升级的信息化技术&#xff0c;让传统数据信息的管理升级为软件存储&#xff0c;归纳&#xff0c;集中处理数据信息的管理方式。本企业人事管理信息系统就是在这样的大环境下诞生&#xff0c;其可以帮助管理者在短时间内处理完毕庞大的数据…

【2023年网络安全优秀创新成果大赛专刊】银行数据安全解决方案(天空卫士)

在2023年网络安全优秀创新成果大赛&#xff0c;成都分站中&#xff0c;天空卫士银行数据安全方案获得优秀解决方案奖。与此同时&#xff0c;天空卫士受信息安全杂志邀请&#xff0c;编写《银行数据安全解决方案》。12月6日&#xff0c;天空卫士编写的《银行数据安全解决方案》做…

山西电力市场日前价格预测【2023-12-23】

日前价格预测 预测说明&#xff1a; 如上图所示&#xff0c;预测明日&#xff08;2023-12-23&#xff09;山西电力市场全天平均日前电价为505.77元/MWh。其中&#xff0c;最高日前电价为807.08元/MWh&#xff0c;预计出现在08:15。最低日前电价为332.81元/MWh&#xff0c;预计…

类文件结构

类文件结构 回顾一下字节码 在 Java 中&#xff0c;JVM 可以理解的代码就叫做字节码&#xff08;即扩展名为 .class 的文件&#xff09;&#xff0c;它不面向任何特定的处理器&#xff0c;只面向虚拟机。Java 语言通过字节码的方式&#xff0c;在一定程度上解决了传统解释型语…

数据分析基础之《numpy(4)—ndarry运算》

一、逻辑运算 当我们要操作符合某一条件的数据时&#xff0c;需要用到逻辑运算 1、运算符 满足条件返回true&#xff0c;不满足条件返回false # 重新生成8只股票10个交易日的涨跌幅数据 stock_change np.random.normal(loc0, scale1, size(8, 10))# 获取前5行前5列的数据 s…

《A++ 敏捷开发》-1 如何改善

1 如何改善 敏捷开发过程改进案例 5月 A公司一直专门为某电信公司提供针对客服、线上播放等服务。 张工是公司的中层管理者&#xff0c;管理好几个开发团队&#xff0c;有5位项目经理向他汇报。 他听说老同学的团队都开始用敏捷开发&#xff0c;很感兴趣&#xff0c;便参加了…

Zookeeper集群搭建,四字命令监控,Leader选举原理以及数据如何同步

Java学习面试指南&#xff1a;https://javaxiaobear.cn 1、集群角色 Leader&#xff1a; 领导者。 事务请求&#xff08;写操作&#xff09;的唯一调度者和处理者&#xff0c;保证集群事务处理的顺序性&#xff1b;集群内部各个服务器的调度者。对于create、setData、delete…

抖店怎么运营?走通流程是关键!

我是电商珠珠 很多新手在入驻抖店的时候&#xff0c;都不知道前期怎么去运营。 运营的技巧很多&#xff0c;牵扯到很多细节&#xff0c;跑通流程是关键。 所以&#xff0c;今天就来给大家讲讲抖店的几个基本流程&#xff0c;只有将流程跑通了才能去更快的抠细节上的东西。 …

Jenkins自动化构建打包,部署

1.环境准备 上传jdk&#xff0c;maven和tomcat的包&#xff0c;解压到/usr/local下并配置环境变量。 配置jdk [rootserver04 ~]# vim /etc/profile.d/java.sh JAVA_HOME/usr/local/java export PATH$JAVA_HOME/bin:$PATH##加载环境变量 [rootserver04 ~]# source /etc/profi…

elementui - table中下拉进行验证

<template><!-- 巡查计划 - 新增巡查点位 --><el-dialog :visible.sync"dialogShow1" title"新增巡查点位" width"800" top"15vh" closehandleCancle><el-form :model"ruleForm" ref"ruleForm&qu…

C语言--指针深入理解--题目篇

C语言--指针深入理解--题目篇 1. sizeof 与 strlen 比较1.1 sizeof1.2 strlen1.3 数组名的意义 2. 数组和指针笔试题解析&#xff08;均以x86环境为例&#xff09;2.1 ⼀维数组2.2 字符数组2.3 二维数组 3. 指针运算笔试题解析 1. sizeof 与 strlen 比较 1.1 sizeof sizeof 计…

FPGA未解之谜

一.ila一会能加载出波形&#xff0c;一会加载不出波形——在自己做的v7开发板中遇到&#xff0c;其他开发板从未遇到过 1.小梅哥说&#xff1a;可能与硬件jtag连接不稳定导致。

DRF从入门到精通二(Request源码分析、DRF之序列化、反序列化、反序列化校验、序列化器常用字段及参数、source、定制字段、保存数据)

文章目录 一、Request对象源码分析区分原生request和新生request新的request还能像原来的reqeust一样使用吗源码片段分析总结&#xff1a; 二、DRF之序列化组件序列化介绍序列化步骤序列化组件的基本使用反序列化基本使用反序列化的新增反序列化的新增删除单条 反序列化的校验序…

【Linux笔记】网络操作命令详细介绍

&#x1f34e;个人博客&#xff1a;个人主页 &#x1f3c6;个人专栏&#xff1a;Linux学习 ⛳️ 功不唐捐&#xff0c;玉汝于成 前言&#xff1a; 网络操作是Linux系统中常见的任务之一&#xff0c;它涵盖了测试网络连接、配置网络接口、显示网络统计信息以及远程登录和文件传…

RabbitMQ笔记(高级篇)

RabbitMQ笔记_高级篇 问题代码准备1. 新建生产者2. 新建消费者 RabbitMQ 高级特性1. 消息的可靠投递☆1.1 两种模式1.2 测试confirm 确认模式1.3 测试return 退回模式1.4 小结 2. Consumer ACK☆2.1 三种ACK2.2 测试手动ACK2.3 小结2.4 消息可靠性总结 3. 消费端限流测试消费端…

【即插即用篇】YOLOv8改进实战 | 引入 Involution(内卷),用于视觉识别的新一代神经网络!涨点神器!

YOLOv8专栏导航:点击此处跳转 前言 YOLOv8 是由 YOLOv5 的发布者 Ultralytics 发布的最新版本的 YOLO。它可用于对象检测、分割、分类任务以及大型数据集的学习,并且可以在包括 CPU 和 GPU 在内的各种硬件上执行。 YOLOv8是一种尖端的、最先进的 (SOTA) 模型,它建立在以前成…