excel统计分析——一元直线回归

参考资料:生物统计学

        两个具有因果关系的协变量如果呈直线关系,可以用直线回归模型来分析两个变量的关系。直线回归(linear regression)是回归分析中最简单的类型,建立直线回归方程并经检验证明两个变量存在直线回归关系时,可以用自变量的变化预测因变量的变化。

1、回归方程的建立

(1)数学模型

        设自变量为x,因变量为y,两个变量的n对观测值为(x1,y1),(x2,y2),...,(xn,yn)。可以用直线函数关系来描述变量x、y之间的关系:

Y=\alpha +\beta x+ \varepsilon

其中,α、β为待定系数,随机误差为\varepsilon \sim N(0,\sigma^2)。设(x1,Y1),(x2,Y2),...,(xn,Yn)是取自总体(x,Y)的一组样本,而(x1,y1),(x2,y2),...,(xn,yn)是该样本的一组观测值,x1,x2,...,xn是随机取定的不完全相同的数值,而y1,y2,...,yn为随机变量Y在试验后取得的具体数值,则有:

y_i=\alpha+\beta x_i+\varepsilon_i

其中i=1,2,...,n,ε1,ε2,...,εn相互独立。该模型可理解为对于自变量x的每一个特定的取值xi,都有一个服从正态分布的Yi取值范围与之对应,这个正态分布的期望是α+βx,方差时σ^2。Y\sim N(\alpha+\beta x ,\sigma ^2)E(Y)=\alpha+\beta x,回归分析就是根据样本观察值求解α和β的估计值a和b。对于给定的x,有:

\hat{y}=a+bx

        作为E(Y)=\alpha+\beta x的估计,上式称为y关于x的直线回归方程,其图像称为回归直线,a称为回归截距(regression intercept),b称为回归系数(regression coefficient)。

(2)参数α、β的估计

        在样本观测值(x1,y1),(x2,y2),...,(xn,yn)中,对每个xi都可由直线回归方程式确定一个回归估计值。即

\hat{y_i}=a+bx_i

         这个归回估计值与机制观测值之差为:

y_i-\hat{y_i}=y_i-(a+bx_i)

表示yi与回归直线\hat{y}=a+bx的偏离度。

        为使建立的回归直线\hat{y}=a+bx尽可能地靠近各观测值的点(xi,yi)(i=1,2,...,n),需使离回归平方和(或称剩余平方和)Q=\sum_{i=1}^n(y_i-\hat{y_i})^2=\sum_{i=1}^n(\hat{y}-a-bx_i)^2最小。

        根据最小二乘法,要使Q最小,需求Q关于a、b的偏导数,并最终得到:

a=\bar{y}-b\bar{x}

b=\frac{\sum((x-\bar{x}))(y-\bar{y})}{\sum(x-\bar{x})^2}=\frac{SP_{xy}}{SS_x}

        a和b为α和β的最小二乘估计。上式中,分子\sum(x-\bar{x})(y-\bar{y})为x的离均差与y的离均差的乘积和,简称乘积和(sum of products),记作SP_xy;分母\sum(x-\bar{x})^2为x的离均差平方和,简称平方和(sum of squares),记作SSx。

        a为回归截距,是回归直线与y轴交点的纵坐标,是总体回归截距α的无偏估计值;b称为回归系数,是回归直线的斜率,是总体回归系数β的无偏估计值。回归直线具有以下性质:

        ①离回归的和等于零,即\sum_{i=1}^n(y_i-\hat{y_i})=0

        ②离回归平方和最小,即\sum_{i=1}^n(y_i-\hat{y_i})^2最小;

        ③回归直线通过散点图的几何重心(\bar{x},\bar{y})

示例如下:

        进行回归或相关分析前,为观察变量间关系的大致情况,一般先作散点图。

        a,b的计算步骤如下:

2、回归的假设检验

        即使x和y变量间不存在直线关系,有n对观测值(xi,yi)也可以根据上面介绍的方法求一个回归方程,所以回归方程建立后,需要进行假设检验来判断变量y与x之间是否确实存在直线关系。检验回归方程是否成立即检验假设H_0: \beta=0是否成立,可采用F检验和t检验两种方法。

(1)回归方程的F检验

①平方和与自由度的分解

        回归数据的总变异(y_i-\bar{y})由随机误差(y_i-\hat{y_i})和回归效应(\hat{y_i}-\bar{y})两部分组成。如下图所示:

        总平方和SSy可以分解为回归平方和SS_R及离回归平方和(误差平法和)SSe。各项的计算公式为:

SS_y=\sum(y_i-\bar{y})^2

SS_R=\sum(\hat{y_i}-\bar{y})^2

SS_e=\sum(y_i-\hat{y_i})^2

其中:

SS_y=SS_R+SS_e

SS_R=\sum(\hat{y_i}-\bar{y})^2=\sum[(a+bx_i)-(a+b\bar{x})]^2

=b^2\sum(x_i-\bar{x})^2=b^2SS_x=b\frac{SP_{xy}}{SS_x}SS_x

=bSP_{xy}=\frac{SP_{xy}^2}{SS_x}

        b^2SS_x直接反映出y受x的线性影响二产生的变异,而bSP_{xy}的算法则可以推广到多元线性回归分析。

        SSy是因变量y的离均差平方和,所以自由度df_y=n-1

        SS_R反映有x引起的y的变异,所以自由度df_R=1

        SS_e反映除x对y的线性影响外的其他因素引起的y的变异,自由度df_e=n-2

        平方和与相应自由度的比为相应的均方,即:

MS_R=\frac{SS_R}{df_R}=SS_R

MS_e=\frac{SS_e}{df_e}=\frac{SS_e}{n-2}

②F检验

        零假设H_0:\beta=0

        备择假设H_A:\beta\neq 0

        统计量F:F=\frac{MS_R}{MS_e}

        和方差分析的F检验一样,回归方程的显著性F检验也总是使用回归均方做分子,离回归均方做分母。

本例的方差分析表如下:

结论:p<0.01,说明本例存在线性回归关系,即求得的回归方程y=0.0137+0.8507x具有统计学上极显著的意义,是有效的。

(2)回归系数的t检验

        对直线关系的检验也可以通过对回归系数b进行t检验完成。样本回归系数的变异度不仅取决于误差方差的大小,也取决于自变量x的变异程度。自变量x的变异越大(取值越分散),回归系数的变异就越小,有回归方程所估计出的值就越精确。

        t检验的回归系数标准误为:

s_b=\sqrt{s_b^2}=\sqrt{\frac{MS_e}{SS_x}}

        对回归系数t检验的假设为:

        原假设:H_0:\beta=0

        备择假设:H_A:\beta\neq 0

        检验统计量t:t=\frac{b-\beta}{s_b}=\frac{b}{s_b}

        统计量t服从df=n-2的t分布。

本例t检验如下:

对于一元直线归回而言,t检验与F检验是等价的,事实上F=t^2

        有时也对回归截距α的显著性进行检验。回归截距的大小对回归的显著性没有影响,检验的目的是看回归直线是否通过原点,仍使用t检验。检验时,零假设为α=0(回归直线通过原点),回归截距标准误:

s_a=\sqrt{MS_e(\frac{1}{n}+\frac{\bar{x}^2}{SS_x})}

统计量t:

t=\frac{a-\alpha}{s_a}=\frac{a}{s_a}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/740257.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何使用 templ 在 Go 中编写 HTML 用户界面?

简介 templ 是一个在 Go 中编写 HTML 用户界面的语言。使用 templ&#xff0c;我们可以创建可呈现 HTML 片段的组件&#xff0c;并将它们组合起来创建屏幕、页面、文档或应用程序。 安装 我们可以通过以下两种方式来安装 templ&#xff1a; go 安装 首先&#xff0c;我们需…

软件需求分析报告-word

第3章 技术要求 3.1 软件开发要求 第4章 项目建设内容 第5章 系统安全需求 5.1 物理设计安全 5.2 系统安全设计 5.3 网络安全设计 5.4 应用安全设计 5.5 对用户安全管理 5.6 其他信息安全措施 第6章 其他非功能需求 6.1 性能设计 6.2 稳定性设计 6.3 安全性设计 6.4 兼容性设计…

leetcode 热题 100_合并两个有序链表

题解一&#xff1a; 迭代&#xff1a;分别用两个指针遍历两段链表&#xff0c;逐步比较两链表的节点&#xff0c;将值较大的节点存入新链表&#xff0c;同时指针移动&#xff0c;直到某段链表遍历结束&#xff0c;将另一段链表剩余的节点存入新链表。需要注意存入新链表时要用新…

cad怎么转换成黑白的pdf图纸?分享3个常用的软件!

在工程设计、建筑、机械制造等领域&#xff0c;CAD图纸的应用非常广泛。然而&#xff0c;有时出于某些需要&#xff0c;我们可能需要将CAD图纸转换为黑白的PDF格式。那么&#xff0c;如何实现这一转换呢&#xff1f;本文将为您详细介绍几种常用的转换软件及其操作步骤。 迅捷CA…

Java代码审计安全篇-SSRF(服务端请求伪造)漏洞

前言&#xff1a; 堕落了三个月&#xff0c;现在因为被找实习而困扰&#xff0c;着实自己能力不足&#xff0c;从今天开始 每天沉淀一点点 &#xff0c;准备秋招 加油 注意&#xff1a; 本文章参考qax的网络安全java代码审计&#xff0c;记录自己的学习过程&#xff0c;还希望各…

FPGA高端项目:FPGA基于GS2971+GS2972架构的SDI视频收发+图像缩放,提供3套工程源码和技术支持

目录 1、前言免责声明 2、相关方案推荐本博已有的 SDI 编解码方案本方案的SDI接收发送本方案的SDI接收纯verilog图像缩放纯verilog多路视频拼接应用本方案的SDI接收HLS图像缩放HLS多路视频拼接应用本方案的SDI接收OSD动态字符叠加输出应用本方案的SDI接收HLS多路视频融合叠加应…

相机模型Omnidirectional Camera(全方位摄像机)

1. 背景 大多数商用相机都可以描述为针孔相机&#xff0c;通过透视投影进行建模。然而&#xff0c;有些投影系统的几何结构无法使用传统针孔模型来描述&#xff0c;因为成像设备引入了非常高的失真。其中一些系统就是全方位摄像机。 有几种方法可以制作全向相机。屈光照相机(D…

Python in Visual Studio Code 2024年3月发布

排版&#xff1a;Alan Wang 我们很高兴地宣布 2024 年 3 月发布适用于 Visual Studio Code 的 Python 和 Jupyter 扩展&#xff01; 此版本包括以下公告&#xff1a; 新的“Add Imports”代码操作设置调试 Django 或 Flask 应用时自动启动浏览器Python REPL 的 Shell 集成对本…

28 批量归一化【李沐动手学深度学习v2课程笔记】(备注:这一节讲的很迷惑,很乱)

目录 1.批量归一化 1.1训练神经网络时出现的挑战 1.2核心思想 1.3原理 2.批量规范化层 2.1 全连接层 2.2 卷积层 2.3 总结 3. 代码实现 4. 使用批量规范化层的LeNet 5. 简明实现 1.批量归一化 现在主流的卷积神经网络几乎都使用了批量归一化 批量归一化是一种流行且…

利用“定时执行专家”软件的25种任务与12种触发器,提升IT系统管理自动化水平

在IT系统管理中&#xff0c;自动化是提高工作效率、减少人为错误的关键。而《定时执行专家》这款软件&#xff0c;以其强大的功能、易用性和毫秒级的执行精度&#xff0c;成为了IT系统管理员的得力助手。今天&#xff0c;我们就来探讨一下如何利用这款软件的25种任务类型和12种…

Day37:安全开发-JavaEE应用JNDI注入RMI服务LDAP服务JDK绕过调用链类

目录 JNDI注入-RMI&LDAP服务 JNDI远程调用-JNDI-Injection JNDI远程调用-marshalsec JNDI-Injection & marshalsec 实现原理 JNDI注入-FastJson漏洞结合 JNDI注入-JDK高版本注入绕过 思维导图 Java知识点&#xff1a; 功能&#xff1a;数据库操作&#xff0c;文…

Fair Data Exchange:区块链实现的原子式公平数据交换

1. 引言 2024年斯坦福大学和a16z crypto research团队 论文 Atomic and Fair Data Exchange via Blockchain 中&#xff0c;概述了一种构建&#xff08;包含过期EIP-4844 blobs的&#xff09;fair data-markets的协议。该论文源自a16z crypto的暑期实习计划&#xff0c;与四名…

下载BenchmarkSQL并使用BenchmarkSQL查看OceanBase 的执行计划

下载BenchmarkSQL并使用BenchmarkSQL查看OceanBase 的执行计划 一、什么是BenchmarkSQL二、下载BenchmarkSQL三、使用BenchmarkSQL查看OceanBase 的执行计划 一、什么是BenchmarkSQL BenchmarkSQL是一个开源的数据库基准测试工具&#xff0c;可以用来评估数据库系统的性能&…

在没有推出硬盘的情况下,重启mac电脑,外接移动硬盘无法加载显示?

一、mac磁盘工具显示未装载 1.打开终端&#xff0c;输入 diskutil list查看当前硬盘列表&#xff0c;大多数时候&#xff0c;可以解决。 二、使用命令行装载硬盘 执行上面命令后&#xff0c;仍不起作用&#xff0c;则手动挂载&#xff0c;在命令行输入如下内容&#xff1a; …

pytorch激活函数

目录 1.激活函数由来2. 常见激活函数2.1 Sigmoid2.2 Tanh2.3 relu 1.激活函数由来 科学家对青蛙的神经元进行研究的时候发现&#xff0c;只有超过一定的阈值青蛙才会有反应&#xff0c;因此不能将多个输入做简单的加权平均&#xff0c;而需要一个阶梯函数也就是激活函数&#…

便携式能见度仪-关键能见度数据检测工具

TH-BN6随着科技的不断进步和应用领域的日益拓宽&#xff0c;便携式能见度仪已经成为众多行业&#xff0c;尤其是交通运输、环保监测和公共安全等领域的必备工具。这款设备以其便携性、准确性和高效性&#xff0c;在移动或狭窄的空间中实现了对能见度数据的精确测量。 一、便携式…

springboot2.x 分页查询实现(mybatis-plus+pagehelper)

基于mybatisplus使用pagehelper实现简单分页查询的功能。pagehelper仅需要把已有查询结果重新封装一下即可&#xff0c;不需要改变sql、mapper之类的。例如有xxxmaper.findall(xx)函数可以列出全部符合条件的数据。仅需要 PageHelper.startPage(pageNum, pageSize); List<E…

[vscode]将命令行参数传递给调试目标

一、简介 本文介绍了在vscode中使用cmake工具时&#xff0c;如何传递参数给编译目标的方法。 前提&#xff1a;使用vscodecmake编译C/C程序。 二、方法 在.vscode/目录下新建settings.json文件&#xff0c;并将待传底的参数写在 cmake.debugConfig里。 下面介绍了一个示例&a…

浏览器与服务器通信过程(HTTP协议)

目录 1 概念 2 常见的 web 服务器有 3 浏览器与服务器通信过程 3.1 DNS 3.2 URL 4 HTTP请求方法和应答状态码 4.1 HTTP请求报文段实例 4.2 HTTP请求方法 5 HTTP应答报头和应答状态 5.1 HTTP的应答报头结构 5.2 HTTP的应答状态 1 概念 浏览器与 web 服务器在应用层通…

LeetCode 每日一题 Day 95-101

2917. 找出数组中的 K-or 值 给你一个整数数组 nums 和一个整数 k 。让我们通过扩展标准的按位或来介绍 K-or 操作。在 K-or 操作中&#xff0c;如果在 nums 中&#xff0c;至少存在 k 个元素的第 i 位值为 1 &#xff0c;那么 K-or 中的第 i 位的值是 1 。 返回 nums 的 K-o…