excel计算二元线性回归_怎么看懂Excel线性回归参数

虽然之前用python做线性回归的时候看上去好像很简单,但是直到我在excel上实践了线性回归,发现有很多指标值得去参考,对于在python上实现有指导作用。

打开excel2016,先找个数据

v2-5db04b9e141f5e6c4fda281556fd589a_b.jpg

我们这里直接选择做线性回归,在菜单栏选择数据----找到数据分析

v2-d983fe3965a24f89206503bf727a8934_b.jpg

点进去后

v2-37e6ca98a48d10469de347f6da3c55c6_b.jpg

选择回归,点确定

v2-a1d356962ee7a75d96053a3b291bb646_b.jpg

x值就是指自变量,y值就是因变量

根据线性回归公式


这里是多元线性回归公式,有截距项,有每个自变量的权重,还有随机扰动项

在本案例里,就是两个自变量和一个因变量,因变量选择行驶时间,自变量就是行驶路程和分送次数。

先来看结果

v2-412e0e572aded2e2546f1fc358a8c5df_b.jpg

第一个是对模型的解释程度,需要注意是R-Square,这是一个衡量线性回归模型能否很好解释变量的变异程度的指标,R-Square越高模型越好

R-Square的公式=

什么是SSR:回归平方和,对应下图被直线截取的下部分

什么是SST:总离差平方和,对应下图整段

什么是SSE:残差平方和,对应被截取得上部分

v2-751439c0fe154521dec58e770b91d5be_b.jpg

也就是说,R-Square其实是回归平方和在总离差平方和的比例,因此引申出来:当线性回归模型增加自变量的时候,SSR是会增大的,SSE会减少,因而R-Square会增大

第二个是方差分析,这里注意F统计量Significance-F

v2-5279966a03e8b2bd59fdadadfc3f605d_b.jpg

df是指自由度,SS离差平方和,MS均方离差。

方差分析这里的F统计量,是反映总体回归关系是否存在,因为我们是用样本来估计总体参数,所以当我们评估了样本的模型的R-Square之后,就要进行总体回归关系评估,这里采用的是假设检验的思想:


原假设是认为自变量的系数为0,也就是说自变量和因变量并无线性相关关系

备择假设便是不为0,具有线性相关关系

这里是置信水平95%下,双侧检验的用F统计量来衡量的假设检验

用显著性水平α=0.05,这里的Significance-F < α,代表着:落入拒绝域,也就是拒绝原假设。这里的Significance-F可以理解为p-value

F统计量:

其中q是自变量的个数,n是样本个数

MSR:均方回归离差平方和

MSE:均方残差平方和

关于F统计量,分子是解释所有自变量能够解释因变量的变异,而分母是所有自变量不能解释因变量的变异,因此对于F统计量来说,F值越大,越能说明总体回归关系越强。

所以根据上表,15个观测值的F统计量值大于30.8517的概率是1.8627E-05。这个概率和显著性水平0.05相比较,明显比它要小,因此落入拒绝域,也就是说当所有自变量的系数都为0时,总计15个观测值的F统计量大于30.8517的概率是1.8627E-05。

第三个

v2-c6a940aa4ffc69977d996945300db12c_b.jpg

当我们知道总体回归关系很强,我们还需要分别看每一个自变量和因变量之间的关系是否显著。这里涉及到t统计量,如上图第二列,截距的值以及自变量的值都估计好了。再看t统计量和对应的p-value 只有截距是大于显著性水平,也就是说我们可以认为它是为0的,不拒绝原假设即截距为0。我们做检验,做置信区间的参数估计,发现在置信水平95%,上限和下限只有截距是包含了0。

这个时候就要考虑,0是否重要。在这里由于样本并没有0,而且截距是根据最小二乘法外推出来的,因此可以选择忽略。但如果样本有0则需要多加留意。

根据统计学的知识,样本参数是总体参数的点估计,所以在估计总体参数的时候引入了置信区间,而95%的置信水平是指从总体随机抽样,100个样本参数的区间有95个样本参数区间包括了总体的参数。

再看剩下那两个参数,它们的p值都小于显著性水平0.05,而且区间不包括0,那么我们就有95%的信心相信,这两个自变量的系数不是0,也就是原假设不成立。

t统计量=

是参数
的点估计,
是估计量的标准差。只要
在任一方向上偏离0,那么它不等于0的证据就到加强,证据越强,我们就越有可能拒绝回归参数
为0的这个假设,也就是能推断因变量y和自变量x之间存在关系。

实际上t统计量检验和F统计量检验是一样的。

第四个补充残差

v2-f57995bf1d97065cd9774586ee98bc05_b.jpg

在前面我们知道线性回归的公式里面存在随机扰动项,一般而言,对于我们想要知道是否是有效估计,这个时候我们要用到方程里面的随机扰动项。线性回归方程里任意一组的自变量的取值的残差符合随机扰动项符合均值为0,同方差性的正态分布,也是相互独立的。为了检验是否存在有效性,我们要借助两个工具:一个是回归残差和自变量之间的散点图,以及回归残差和因变量预测值的散点图。

工具一:

v2-c4ae33c54f57338242a6905770ff9bd4_b.jpg

可以看到两个变量与残差的散点分布图,残差围绕在0的两侧随机分布,证明了随机扰动项是服从均值为0,同方差的正态分布,也是互相独立的。

a.

v2-e85619b37a5d1067a14d3fb86eff2854_b.jpg

但如果看到是服从扇形分布的残差分布,虽然是围绕0的两侧随机分布,但是离散性不一样,代表着并不是同方差的。

b.

v2-ca1a917e362f3e5e4c6cd9855cded1f4_b.jpg

如果服从下凸形的分布,说明x的极小值和极大值下,残差是极大的,在x的极大极小之间残差是比较小的,说明了该模型在x的极大极小值的时候高估了它们的预测值,而相对应的则是低估了预测值。

c.

v2-7e0706ecc05820a7cd634980d810a1a1_b.jpg

若分布是偏态的,就是不满足正态分布的条件

d.

v2-58756a3754e3ece47876f6099f922a00_b.jpg

若符合这种分布,证明随机扰动项并不是独立的,把4个点当一组来看,第二个点总比第一个大而比第三个小,这种只有在时间序列数据里面才会出现的情况。

如果出现上面四种情况,我们就知道了,随机扰动项这项不满足回归分析必要条件,因而我们能质疑该模型能否很好的预测结果,也就是推断结果的可信度大打折扣。

工具二:

v2-6e8bfdb5bae8a108af24bf198d636d70_b.jpg

利用预测值和回归残差的散点图,如果散点都能围绕在0的附近并保持着较为一致的分布,那么我们就有理由认为,该多元线性回归模型的必要条件没有被违反,是具有可信度的。

总结:

进行线性回归的时候,首先根据得出的直线方程,去判断样本线性回归模型是否具有解释度(SSR,SST,R-Square),是否可信(依据随机扰动项的条件、残差、自变量、因变量散点图),假如样本ok,那么就去推断总体回归关系(假设检验,F统计,p-value,MSR,MSE),然后进行回归参数检验(t检验,p-value,置信区间,置信水平),验证截距项为0是否有意义(下次会讲)

PS:个别图手画太丑请见谅(逃)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/470677.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

冲刺阶段 day 6

项目进展&#xff1a;学生管理这部分已经进展的差不多了&#xff0c;调试了几遍,改了几个小Bug之后就没有什么问题了,基本完成&#xff0c;如若后续还有一些新的功能到时候再自行加入。明天开始教师部分。 存在问题&#xff1a;我觉得我们的项目还是比较课堂&#xff0c;比较中…

Chapter2-1_Voice Conversion(Feature Disentangle)

文章目录1 什么是Voice Conversion2 实际实现中的细节3 根据数据集分类4 Feature disentangle5 训练技巧本文为李弘毅老师【Voice Conversion - Feature Disentangle】的课程笔记&#xff0c;课程视频youtube地址&#xff0c;点这里&#x1f448;(需翻墙)。 下文中用到的图片均…

1 0.99999的悖论_无限小数与芝诺悖论

问题昨天晚上&#xff0c;小学6年级的外甥女从数学课外辅导班补习回来&#xff0c;兴冲冲的对家里人说&#xff0c;哎&#xff0c;我发现了一个数学的大bug啊。你说1/3不是一个无限循环小数0.33333...&#xff0c;那么三个1/3加起来&#xff0c;不就是0.99999...吗&#xff1f;…

Mongoose 中使用 populate 实现关联查询

一、Mongoose populate 官方文档 https://mongoosejs.com/docs/populate.html 二、Mongoose populate 关联查询 1、定义 ref var ArticleSchema new Schema({ title:{type: String, unique: true},cid : {type: Schema.Types.ObjectId, ref:ArticleCate //model 的名称 }, …

FPGA开发全攻略——概念篇

原文链接&#xff1a; FPGA开发全攻略连载之一&#xff1a;FPGA为什么这么热&#xff1f; FPGA开发全攻略连载之二&#xff1a;为什么工程师要掌握FPGA开发知识&#xff1f; FPGA开发全攻略连载之三&#xff1a;FPGA基本知识与发展趋势&#xff08;part1&#xff09; FPGA开发全…

vue @input带参数_Vue 全家桶开发的一些小技巧和注意事项

前言用 vue 全家桶开发一年多了&#xff0c;踩过不少坑&#xff0c;也解决了很多的问题&#xff0c;把其中的一些点记录下来&#xff0c;希望能帮到大家。以下内容基于最新版的 vue vuex vue-router axios less elementUI&#xff0c;vue 脚手架是 vue-cli3。css 的 scope…

Chapter2-2_Voice Conversion(CycleGAN and StarGAN)

文章目录1 内容简述2 CycleGAN3 StarGAN本文为李弘毅老师【Voice Conversion - CycleGAN and StarGAN】的课程笔记&#xff0c;课程视频youtube地址&#xff0c;点这里&#x1f448;(需翻墙)。 下文中用到的图片均来自于李宏毅老师的PPT&#xff0c;若有侵权&#xff0c;必定删…

cookie与session原理详解

一、 Cookie cookie&#xff1a;浏览器在电脑硬盘中开辟的一块空间&#xff0c;主要供服务器端存储数据。 cookie中的数据是以域名的形式进行区分的。cookie中的数据是有过期时间的&#xff0c;超过时间数据会被浏览器自动删除。cookie中的数据会随着请求被自动发送到服务器端。…

eclipse的servlet默认不执行index_MySQL之索引及执行计划分析

mysql官方对索引的定义为&#xff1a;索引(index)是帮助MySQL高效获取数据的数据结构。索引的本质&#xff1a;索引是数据结构。索引就是排好序的快速查找数据结构一般来说索引本身也很大不可能全部存储在内存中&#xff0c;因此索引往往以索引文件的形式存储在磁盘上平时所说的…

Chapter3-1_Speech Separation(Deep Clustering, PIT)

文章目录1 内容简述2 评价指标2.1 Signal-to-noise ratio (SNR)2.2 Scale invariant signal-to-distortion ratio (SI-SDR)2.3 其他的评价指标3 Permutation Issue4 Deep Clustering5 PIT本文为李弘毅老师【Speech Separation - Deep Clustering, PIT】的课程笔记&#xff0c;课…

Joi验证模块的使用

1. 安装 官网中文文档&#xff1a;https://joi.dev/api/?v12.1.0#validatevalue-schema-options-callback //下载14.3.1 npm install 14.3.1注意&#xff1a;下载14.3.1&#xff0c;在npm install joi的时候默认下载的是最新版本 joi17.1.1,对于一些API高版本会舍弃从而出现…

Chapter3-2_Speech Separation(TasNet)

文章目录1 TasNet总体架构2 Encoder和Decoder3 Separator4 TasNet回顾5 More5.1 Unknown number of speakers5.2 Multiple microphones5.3 Visual information本文为李弘毅老师【Speech Separation - TasNet】的课程笔记&#xff0c;课程视频youtube地址&#xff0c;点这里&…

Node 中的开发环境与生产环境 和 使用Morgan打印请求信息

一、什么是开发环境与生产环境 环境&#xff0c;就是指项目运行的地方&#xff0c;当项目处于开发阶段&#xff0c;项目运行在开发人员的电脑上&#xff0c;项目所处的环境就是开发环境。当项目开发完成以后&#xff0c;要将项目放到真实的网站服务器电脑中运行&#xff0c;项…

Chapter4-1_Speech_Synthesis(Tacotron)

文章目录1 TTS before End-to-end2 Tacotron2.1 Encoder2.2 Attention2.3 Decoder2.4 Post processing3 How good is Tacotron?本文为李弘毅老师【Speech Synthesis - Tacotron】的课程笔记&#xff0c;课程视频youtube地址&#xff0c;点这里&#x1f448;(需翻墙)。 下文中…

第三方模块config的使用

作用&#xff1a;允许开发人员将不同运行环境下的应用配置信息抽离到单独的文件中&#xff0c;模块内部自动判断当前应用的运行环境&#xff0c; 并读取对应的配置信息&#xff0c;极大提供应用配置信息的维护成本&#xff0c;避免了当运行环境重复的多次切换时&#xff0c;手动…

Chapter4-2_Speech_Synthesis(More than Tacotron)

文章目录1 Mispronunciation2 More information for Encoder3 Attention4 Fast Speech and DurIAN5 Dual Learning5 Controllable TTSSpeaker EmbeddingGST-TacotronTwo-stage Training本文为李弘毅老师【Speech Synthesis - More than Tacotron】的课程笔记&#xff0c;课程视…

【代码笔记】iOS-清除图片缓存UIActionSheet

一&#xff0c;效果图。 二&#xff0c;代码。 RootViewController.m //点击任何处出现sheet -(void)touchesBegan:(NSSet *)touches withEvent:(UIEvent *)event {UIActionSheet * sheet [[UIActionSheet alloc] initWithTitle:"确定要清空图片缓存&#xff1f;" d…

Chapter5_Speaker_Verification

文章目录1 Task Introduction2 模型架构3 模型介绍3.1 i-vector3.2 d-vector3.3 x-vector3.4 more4 End to End本文为李弘毅老师【Speaker Verification】的课程笔记&#xff0c;课程视频youtube地址&#xff0c;点这里&#x1f448;(需翻墙)。 下文中用到的图片均来自于李宏毅…

python如何读取字典的关键字_python提取字典key列表的方法

python提取字典key列表的方法 更新时间&#xff1a;2015年07月11日 12:04:48 作者&#xff1a;企鹅不笨 这篇文章主要介绍了python提取字典key列表的方法,涉及Python中keys方法的使用技巧,具有一定参考借鉴价值,需要的朋友可以参考下 本文实例讲述了python提取字典key列表的方法…

使用express搭建服务器获取MySQL数据库数据

一、原始的mysql查询方法 先安装mysql cnpm install mysql --save 引入这个db.js之后&#xff0c;才能对数据库进行查询 进行查询 查询结果如下&#xff1a; 二、ORM 介绍 ORM 全拼Object-Relation Mapping. 中文意为 对象-关系映射. 主要实现模型对象到关系数据库…