excel统计分析——一元直线回归

参考资料:生物统计学

        两个具有因果关系的协变量如果呈直线关系,可以用直线回归模型来分析两个变量的关系。直线回归(linear regression)是回归分析中最简单的类型,建立直线回归方程并经检验证明两个变量存在直线回归关系时,可以用自变量的变化预测因变量的变化。

1、回归方程的建立

(1)数学模型

        设自变量为x,因变量为y,两个变量的n对观测值为(x1,y1),(x2,y2),...,(xn,yn)。可以用直线函数关系来描述变量x、y之间的关系:

Y=\alpha +\beta x+ \varepsilon

其中,α、β为待定系数,随机误差为\varepsilon \sim N(0,\sigma^2)。设(x1,Y1),(x2,Y2),...,(xn,Yn)是取自总体(x,Y)的一组样本,而(x1,y1),(x2,y2),...,(xn,yn)是该样本的一组观测值,x1,x2,...,xn是随机取定的不完全相同的数值,而y1,y2,...,yn为随机变量Y在试验后取得的具体数值,则有:

y_i=\alpha+\beta x_i+\varepsilon_i

其中i=1,2,...,n,ε1,ε2,...,εn相互独立。该模型可理解为对于自变量x的每一个特定的取值xi,都有一个服从正态分布的Yi取值范围与之对应,这个正态分布的期望是α+βx,方差时σ^2。Y\sim N(\alpha+\beta x ,\sigma ^2)E(Y)=\alpha+\beta x,回归分析就是根据样本观察值求解α和β的估计值a和b。对于给定的x,有:

\hat{y}=a+bx

        作为E(Y)=\alpha+\beta x的估计,上式称为y关于x的直线回归方程,其图像称为回归直线,a称为回归截距(regression intercept),b称为回归系数(regression coefficient)。

(2)参数α、β的估计

        在样本观测值(x1,y1),(x2,y2),...,(xn,yn)中,对每个xi都可由直线回归方程式确定一个回归估计值。即

\hat{y_i}=a+bx_i

         这个归回估计值与机制观测值之差为:

y_i-\hat{y_i}=y_i-(a+bx_i)

表示yi与回归直线\hat{y}=a+bx的偏离度。

        为使建立的回归直线\hat{y}=a+bx尽可能地靠近各观测值的点(xi,yi)(i=1,2,...,n),需使离回归平方和(或称剩余平方和)Q=\sum_{i=1}^n(y_i-\hat{y_i})^2=\sum_{i=1}^n(\hat{y}-a-bx_i)^2最小。

        根据最小二乘法,要使Q最小,需求Q关于a、b的偏导数,并最终得到:

a=\bar{y}-b\bar{x}

b=\frac{\sum((x-\bar{x}))(y-\bar{y})}{\sum(x-\bar{x})^2}=\frac{SP_{xy}}{SS_x}

        a和b为α和β的最小二乘估计。上式中,分子\sum(x-\bar{x})(y-\bar{y})为x的离均差与y的离均差的乘积和,简称乘积和(sum of products),记作SP_xy;分母\sum(x-\bar{x})^2为x的离均差平方和,简称平方和(sum of squares),记作SSx。

        a为回归截距,是回归直线与y轴交点的纵坐标,是总体回归截距α的无偏估计值;b称为回归系数,是回归直线的斜率,是总体回归系数β的无偏估计值。回归直线具有以下性质:

        ①离回归的和等于零,即\sum_{i=1}^n(y_i-\hat{y_i})=0

        ②离回归平方和最小,即\sum_{i=1}^n(y_i-\hat{y_i})^2最小;

        ③回归直线通过散点图的几何重心(\bar{x},\bar{y})

示例如下:

        进行回归或相关分析前,为观察变量间关系的大致情况,一般先作散点图。

        a,b的计算步骤如下:

2、回归的假设检验

        即使x和y变量间不存在直线关系,有n对观测值(xi,yi)也可以根据上面介绍的方法求一个回归方程,所以回归方程建立后,需要进行假设检验来判断变量y与x之间是否确实存在直线关系。检验回归方程是否成立即检验假设H_0: \beta=0是否成立,可采用F检验和t检验两种方法。

(1)回归方程的F检验

①平方和与自由度的分解

        回归数据的总变异(y_i-\bar{y})由随机误差(y_i-\hat{y_i})和回归效应(\hat{y_i}-\bar{y})两部分组成。如下图所示:

        总平方和SSy可以分解为回归平方和SS_R及离回归平方和(误差平法和)SSe。各项的计算公式为:

SS_y=\sum(y_i-\bar{y})^2

SS_R=\sum(\hat{y_i}-\bar{y})^2

SS_e=\sum(y_i-\hat{y_i})^2

其中:

SS_y=SS_R+SS_e

SS_R=\sum(\hat{y_i}-\bar{y})^2=\sum[(a+bx_i)-(a+b\bar{x})]^2

=b^2\sum(x_i-\bar{x})^2=b^2SS_x=b\frac{SP_{xy}}{SS_x}SS_x

=bSP_{xy}=\frac{SP_{xy}^2}{SS_x}

        b^2SS_x直接反映出y受x的线性影响二产生的变异,而bSP_{xy}的算法则可以推广到多元线性回归分析。

        SSy是因变量y的离均差平方和,所以自由度df_y=n-1

        SS_R反映有x引起的y的变异,所以自由度df_R=1

        SS_e反映除x对y的线性影响外的其他因素引起的y的变异,自由度df_e=n-2

        平方和与相应自由度的比为相应的均方,即:

MS_R=\frac{SS_R}{df_R}=SS_R

MS_e=\frac{SS_e}{df_e}=\frac{SS_e}{n-2}

②F检验

        零假设H_0:\beta=0

        备择假设H_A:\beta\neq 0

        统计量F:F=\frac{MS_R}{MS_e}

        和方差分析的F检验一样,回归方程的显著性F检验也总是使用回归均方做分子,离回归均方做分母。

本例的方差分析表如下:

结论:p<0.01,说明本例存在线性回归关系,即求得的回归方程y=0.0137+0.8507x具有统计学上极显著的意义,是有效的。

(2)回归系数的t检验

        对直线关系的检验也可以通过对回归系数b进行t检验完成。样本回归系数的变异度不仅取决于误差方差的大小,也取决于自变量x的变异程度。自变量x的变异越大(取值越分散),回归系数的变异就越小,有回归方程所估计出的值就越精确。

        t检验的回归系数标准误为:

s_b=\sqrt{s_b^2}=\sqrt{\frac{MS_e}{SS_x}}

        对回归系数t检验的假设为:

        原假设:H_0:\beta=0

        备择假设:H_A:\beta\neq 0

        检验统计量t:t=\frac{b-\beta}{s_b}=\frac{b}{s_b}

        统计量t服从df=n-2的t分布。

本例t检验如下:

对于一元直线归回而言,t检验与F检验是等价的,事实上F=t^2

        有时也对回归截距α的显著性进行检验。回归截距的大小对回归的显著性没有影响,检验的目的是看回归直线是否通过原点,仍使用t检验。检验时,零假设为α=0(回归直线通过原点),回归截距标准误:

s_a=\sqrt{MS_e(\frac{1}{n}+\frac{\bar{x}^2}{SS_x})}

统计量t:

t=\frac{a-\alpha}{s_a}=\frac{a}{s_a}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/740257.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何使用 templ 在 Go 中编写 HTML 用户界面?

简介 templ 是一个在 Go 中编写 HTML 用户界面的语言。使用 templ&#xff0c;我们可以创建可呈现 HTML 片段的组件&#xff0c;并将它们组合起来创建屏幕、页面、文档或应用程序。 安装 我们可以通过以下两种方式来安装 templ&#xff1a; go 安装 首先&#xff0c;我们需…

软件需求分析报告-word

第3章 技术要求 3.1 软件开发要求 第4章 项目建设内容 第5章 系统安全需求 5.1 物理设计安全 5.2 系统安全设计 5.3 网络安全设计 5.4 应用安全设计 5.5 对用户安全管理 5.6 其他信息安全措施 第6章 其他非功能需求 6.1 性能设计 6.2 稳定性设计 6.3 安全性设计 6.4 兼容性设计…

C++标准输入输出和名字空间

C标准输入输出和名字空间 标准输入输出 在C中&#xff0c;标准输入输出&#xff08;I/O&#xff09;是通过标准库中的iostream库来实现的&#xff0c;它提供了一套流&#xff08;stream&#xff09;抽象来进行数据的输入和输出操作。这套流抽象包括输入流用于读取数据&#x…

leetcode 热题 100_合并两个有序链表

题解一&#xff1a; 迭代&#xff1a;分别用两个指针遍历两段链表&#xff0c;逐步比较两链表的节点&#xff0c;将值较大的节点存入新链表&#xff0c;同时指针移动&#xff0c;直到某段链表遍历结束&#xff0c;将另一段链表剩余的节点存入新链表。需要注意存入新链表时要用新…

cad怎么转换成黑白的pdf图纸?分享3个常用的软件!

在工程设计、建筑、机械制造等领域&#xff0c;CAD图纸的应用非常广泛。然而&#xff0c;有时出于某些需要&#xff0c;我们可能需要将CAD图纸转换为黑白的PDF格式。那么&#xff0c;如何实现这一转换呢&#xff1f;本文将为您详细介绍几种常用的转换软件及其操作步骤。 迅捷CA…

Java代码审计安全篇-SSRF(服务端请求伪造)漏洞

前言&#xff1a; 堕落了三个月&#xff0c;现在因为被找实习而困扰&#xff0c;着实自己能力不足&#xff0c;从今天开始 每天沉淀一点点 &#xff0c;准备秋招 加油 注意&#xff1a; 本文章参考qax的网络安全java代码审计&#xff0c;记录自己的学习过程&#xff0c;还希望各…

简单的torch网络模型记录

线性dense网络结构&#xff0c;输入(B,W) class Model(nn.Module):def __init__(self):super().__init__()self.media_type_embed nn.Embedding(num_media_type, embed_dim)self.mid_scroe_embed nn.Embedding(num_mid_score, embed_dim)#self.cat torch.cat()self.model …

FPGA高端项目:FPGA基于GS2971+GS2972架构的SDI视频收发+图像缩放,提供3套工程源码和技术支持

目录 1、前言免责声明 2、相关方案推荐本博已有的 SDI 编解码方案本方案的SDI接收发送本方案的SDI接收纯verilog图像缩放纯verilog多路视频拼接应用本方案的SDI接收HLS图像缩放HLS多路视频拼接应用本方案的SDI接收OSD动态字符叠加输出应用本方案的SDI接收HLS多路视频融合叠加应…

相机模型Omnidirectional Camera(全方位摄像机)

1. 背景 大多数商用相机都可以描述为针孔相机&#xff0c;通过透视投影进行建模。然而&#xff0c;有些投影系统的几何结构无法使用传统针孔模型来描述&#xff0c;因为成像设备引入了非常高的失真。其中一些系统就是全方位摄像机。 有几种方法可以制作全向相机。屈光照相机(D…

Python in Visual Studio Code 2024年3月发布

排版&#xff1a;Alan Wang 我们很高兴地宣布 2024 年 3 月发布适用于 Visual Studio Code 的 Python 和 Jupyter 扩展&#xff01; 此版本包括以下公告&#xff1a; 新的“Add Imports”代码操作设置调试 Django 或 Flask 应用时自动启动浏览器Python REPL 的 Shell 集成对本…

28 批量归一化【李沐动手学深度学习v2课程笔记】(备注:这一节讲的很迷惑,很乱)

目录 1.批量归一化 1.1训练神经网络时出现的挑战 1.2核心思想 1.3原理 2.批量规范化层 2.1 全连接层 2.2 卷积层 2.3 总结 3. 代码实现 4. 使用批量规范化层的LeNet 5. 简明实现 1.批量归一化 现在主流的卷积神经网络几乎都使用了批量归一化 批量归一化是一种流行且…

树莓派Py程序加入开机自启

创建服务文件 为你的服务创建一个 .service 文件。这个文件通常位于 /etc/systemd/system/ 目录下。例如&#xff0c;如果你的服务名称为 my_python_script.service&#xff1a; sudo nano /etc/systemd/system/my_python_script.service 在打开的编辑器中&#xff0c;输入以下…

利用“定时执行专家”软件的25种任务与12种触发器,提升IT系统管理自动化水平

在IT系统管理中&#xff0c;自动化是提高工作效率、减少人为错误的关键。而《定时执行专家》这款软件&#xff0c;以其强大的功能、易用性和毫秒级的执行精度&#xff0c;成为了IT系统管理员的得力助手。今天&#xff0c;我们就来探讨一下如何利用这款软件的25种任务类型和12种…

Day37:安全开发-JavaEE应用JNDI注入RMI服务LDAP服务JDK绕过调用链类

目录 JNDI注入-RMI&LDAP服务 JNDI远程调用-JNDI-Injection JNDI远程调用-marshalsec JNDI-Injection & marshalsec 实现原理 JNDI注入-FastJson漏洞结合 JNDI注入-JDK高版本注入绕过 思维导图 Java知识点&#xff1a; 功能&#xff1a;数据库操作&#xff0c;文…

python实现冒泡排序

冒泡排序是一种简单的排序算法&#xff0c;它重复地遍历要排序的数列&#xff0c;一次比较两个元素&#xff0c;如果他们的顺序错误就把他们交换过来。遍历数列的工作是重复地进行直到没有再需要交换&#xff0c;也就是说该数列已经排序完成。 以下是用Python实现冒泡排序的代…

Fair Data Exchange:区块链实现的原子式公平数据交换

1. 引言 2024年斯坦福大学和a16z crypto research团队 论文 Atomic and Fair Data Exchange via Blockchain 中&#xff0c;概述了一种构建&#xff08;包含过期EIP-4844 blobs的&#xff09;fair data-markets的协议。该论文源自a16z crypto的暑期实习计划&#xff0c;与四名…

Golang 中 map[string]string 如何在 TOML 文件中配置

Go结构体定义 Go结构体定义attributes字段&#xff0c;并且使用了toml标签。例如&#xff1a; type Config struct {Attributes map[string]string toml:"attributes" }TOML文件格式 以attributes为例&#xff0c;TOML文件应该像这样&#xff1a; [attributes] k…

无名管道在进程中使用的方法实战

管道一般是单向的。一个进程往里面写&#xff0c;另一个进程从里面读。 #include <stdio.h> #include <unistd.h> #include <stdlib.h> #include <sys/types.h> #include <sys/wait.h>int main() {pid_t pid;int fd[2];int n;char buf[20]; //c…

VUE+VScode+elementUI开发环境

0.vue官方文档 你正在阅读的是 Vue 3 的文档&#xff01; 1.前端准备阶段 VUEVScodeelementUI开发环境 2.Vue外部组件 element-ui 3.angular外部组件 angular-ui 4.教学视频 尚学堂b站视频 5.教学视频配套文档 D:\BaiduNetdiskDownload\025【尚学堂】全新2022版WEB前端为初学者…

下载BenchmarkSQL并使用BenchmarkSQL查看OceanBase 的执行计划

下载BenchmarkSQL并使用BenchmarkSQL查看OceanBase 的执行计划 一、什么是BenchmarkSQL二、下载BenchmarkSQL三、使用BenchmarkSQL查看OceanBase 的执行计划 一、什么是BenchmarkSQL BenchmarkSQL是一个开源的数据库基准测试工具&#xff0c;可以用来评估数据库系统的性能&…