线性回归 - 多元线性回归案例 - 分析步骤、输出结果详解、与Python的结果对比 -(SPSS建模)

现在用 Python 写线性回归的博客都快烂大街了,为什么还要用 SPSS 做线性回归呢?这就来说说 SPSS 存在的原因吧。

SPSS 是一个很强大的软件,不用编程,不用调参,点巴两下就出结果了,而且出来的大多是你想要的。这样的特点特别适合建模初期进行算法的选择。比如

  1. SPSS 做因子分析,输出结果中有一项 Kaiser-Meyer-Olkin Measure of Sampling Adequacy. 它的值是在 [ 0, 1] 范围内,这个值大于 0.5 就证明原数据中的指标适合使用因子分析算法进行建模,小于 0.5 要不重新计算指标,要不换算法。
  2. SPSS 做多元线性回归,输出结果中的拟合度过低,说明指标与结果之间的相关性并不明显,要不重新计算指标,要不换算法。
  3. ..................

下面详细讲讲 SPSS做多元线性回归的步骤吧

准备工作:SPSS - 中文版 SPSS 22.0 软件下载与安装教程 - 【附产品授权许可码,永久免费】

第一步:导入数据

路径:【文件】--【打开】--【数据】--【更改文件类型,找到你的数据】--【打开】--【然后会蹦出下图左中的筛选框,基本使用默认值就行,点确定】

  1. 第一行代表的是用第一行的数据做列名;
  2. 第二行代表文件中数据所在的范围,默认是所有数据都选上,但是如果你只需要选择前 n 行,那就把里面的110改了就行;
  3. 第三行代表字符串宽度,这个默认值就可以,不用改;

导入数据之后就是下图右中的样子,老习惯,我们来说说原数据,第一列是拨打电话指数,第二列是接通电话指数,这两个是自变量,第三类是因变量回款指数。为了脱敏,所以用自己的办法换算成现在这样的数值。

                 

第二步:数据分析

【分析】--【回归】--【线性】--【通过截图中的方式,将因变量与自变量添加到对应的地方】--【其他都使用默认值】--【确定】

        

第三步:输出结果分析 

第一项输出结果:输入/移去的变量

输入变量是两个自变量Connect, Call,没有移去任何变量。

第二项输出结果:模型汇总

  1. R表示拟合优度(goodness of fit),用来衡量模型的拟合程度,越接近 1 越好;
  2. R方表示决定系数,用于反映模型能够解释的方差占因变量方差的百分比,越接近 1 越好;
  3. 调整R方是考虑自变量之间的相互影响之后,对决定系数R方的校正,比R方更加严谨,越接近 1 越好;
  4. 标准估计的误差是误差项 ε 的方差 σ2的一个估计值,越小越好;

一般认为,

  • 小效应:R (0.1~0.3),对应 R方(0.01~0.09);
  • 中等效应:R (0.3~0.5),对应 R方(0.09~0.25);
  • 大效应:R (0.5~1),对应 R方(0.25~1);

第三项输出结果:Anova

Anova表示方差分析结果,主要看 F 和 Sig 值,为方差分析的结果,F检验的重点在 Sig 值,具体大小不重要,其 F 值对应的 Sig 值小于 0.05 就可以认为回归方程是有用的。

第四项输出结果:系数

系数表列出了自变量的显著性检验结果,

  1. 非标准化系数中的 B 表示自变量的系数与常数项(下图代表的回归方式为:Return = 0.097 * Call + 1.243 * Connect - 0.160);
  2. 标准系数给出的自变量系数与非标准化系数中的明显不同,这是因为考虑到不同自变量之间的量纲和取值范围不同(比如在其他例子里面,第一个自变量是年龄(0~120),第二个自变量是收入(0~10万),显然年龄18岁与收入18块钱代表的意义是不一样的,因此需要进行标准化),因此这里的系数更能代表每个自变量对因变量的影响程度,(下图代表的回归方式为:Return = 0.126 * Call_标准化的值 + 0.739 * Connect_标准化的值);
  3. t 值 与 Sig 值 是自变量的显著性检验结果,其 t 值对应的 Sig 值小于 0.05 代表自变量对因变量具有显著影响,下图中,自变量 Connect 对 因变量具有显著影响,而自变量 Call 的影响程度就弱了很多;

综上所有的输出结果,说明 Call、 Connect 与 Return 的拟合效果还挺理想的。 

与Python的结果对比

同样的数据,我们看看Python中的多元线性回归结果:

Python给出的回归方程: Y = -0.01 + 0.09 * Call + 1.19 * Connect;

 SPSS 给出的回归方程: Y = -0.16+ 0.09 * Call + 1.24 * Connect;

如果想要学习一下这个过程,你可能需要:

1.SPSS - 中文版 SPSS 22.0 软件下载与安装教程 - 【附产品授权许可码,永久免费】

2.机器学习 - 多元线性回归 - 一步一步详解 - Python代码实现

本例中用的数据与机器学习 - 多元线性回归 - 一步一步详解 - Python代码实现中的数据是同一份,便于对比。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/475476.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 1488. 避免洪水泛滥(贪心+set二分查找)

1. 题目 你的国家有无数个湖泊,所有湖泊一开始都是空的。 当第 n 个湖泊下雨的时候,如果第 n 个湖泊是空的,那么它就会装满水,否则这个湖泊会发生洪水。 你的目标是避免任意一个湖泊发生洪水。 给你一个整数数组 rains &#xf…

R12 应付款模块(AP):预付款(prepayment)的标准处理流程

预付款的概念 财务会计的解释: 企业对于某些物资有时需要采取预先订购的方式,即按照购货合同规定预付一部分货款。这部分预先付给供货单位的订货款就构成了企业的预付账款。(来自会计学概论,要区分定金和预付款的区别!…

Python连接MySQL数据库(pymysql),DataFrame写入 MySQL(create_engine)- Python代码

模块安装 使用以下命令安装 PyMySQL: $ pip install PyMySQL 若系统不支持 pip,还可以这样安装: $ git clone https://github.com/PyMySQL/PyMySQL $ cd PyMySQL/ $ python3 setup.py install Python连接MySQL数据库 # -*- coding:utf-8…

LeetCode 391. 完美矩形(set检查顶点+面积检查)

1. 题目 我们有 N 个与坐标轴对齐的矩形, 其中 N > 0, 判断它们是否能精确地覆盖一个矩形区域。 每个矩形用左下角的点和右上角的点的坐标来表示。例如, 一个单位正方形可以表示为 [1,1,2,2]。 ( 左下角的点的坐标为 (1, 1) 以及右上角的点的坐标为 (2, 2) )。…

时间序列 - 案例按步骤详解 -(SPSS建模)

时间序列简单的说就是各时间点上形成的数值序列,通过观察历史数据的变化规律预测未来的值。在这里需要强调一点的是,时间序列分析并不是关于时间的回归,它主要是研究自身的变化规律的。 准备工作:SPSS - 中文版 SPSS 22.0 软件下…

正则表达式pcre在Android下的移植

因为项目需要在android的NDK开发中使用pcre正则表达式库,而android系统中并没有自带该库,所以就得另外移植了, 下面是移植的详细步骤: 1. 下载pcre源码,可以到http://sourceforge.net/projects/pcre/下载源码。 我这里…

LeetCode 593. 有效的正方形(数学)

1. 题目 给定二维空间中四点的坐标,返回四点是否可以构造一个正方形。 一个点的坐标(x,y)由一个有两个整数的整数数组表示。 示例: 输入: p1 [0,0], p2 [1,1], p3 [1,0], p4 [0,1] 输出: True注意: 所有输入整数都在 [-100…

特征计算 - 遍历求值提速 6 万倍 lambda...if...else(if...else...) +map() 对比 iterrows() - Python代码

Python 进行 DataFrame 数据处理的过程中,需要判断某一列中的值(条件),然后对其他两列或三列进行求和(均值/最值)等运算,并把运算结果存储在新的一列中。干说可能觉得比较晕,我们来看…

写写最近吧,关于读研、找工作

刚刚又被朋友问到为什么要选择读研的问题了。已经好多好多人问过我这样的问题,我何尝不想问问自己到底为什么要读研呢。前段时间,每天在睡觉之前都我要想出无数个理由劝服自己要坚持读研,而每天早上第一件事又是再问自己为什么要读研。 我觉得…

非线性回归 - 案例按步骤详解 -(SPSS建模)

在上一篇时间序列的文章中,偶然发现另一份数据的整体趋势很符合非线性回归关系,那么就顺势写一篇非线性回归案例的文章吧。 准备工作:SPSS - 中文版 SPSS 22.0 软件下载与安装教程 - 【附产品授权许可码,永久免费】 数据解释&am…

LeetCode 609. 在系统中查找重复文件(哈希)

1. 题目 给定一个目录信息列表,包括目录路径,以及该目录中的所有包含内容的文件,您需要找到文件系统中的所有重复文件组的路径。 一组重复的文件至少包括二个具有完全相同内容的文件。 输入列表中的单个目录信息字符串的格式如下&#xff1…

邮件服务器之POP3协议分析

第1章. POP3概述 POP3全称为Post Office Protocol version3,即邮局协议第3版。它被用户代理用来邮件服务器取得邮件。POP3采用的也是C/S通信 模型,对应的RFC文 档为RFC1939。 该协议非常简单,所以我们只重点介绍其通信过程,而相关…

Python 画图常用颜色 - 单色、渐变色、混色 - 够用

单色 装了seaborn扩展的话,在字典seaborn.xkcd_rgb中包含所有的xkcd crowdsourced color names。如下: plt.plot([1,2], lw4, cseaborn.xkcd_rgb[baby poop green]) 虽然觉得上面的已经够用了,但是还是备份一下这个最全的吧。 渐变色&…

[scikit-learn 机器学习] 2. 简单线性回归

文章目录1. 简单线性回归2. 评价模型本文为 scikit-learn机器学习(第2版)学习笔记1. 简单线性回归 import numpy as np import matplotlib.pyplot as pltX np.array([[6],[8],[10],[14],[18]]) y np.array([7,9,13,17.5,18]) plt.title("pizza …

Python 画图常用点的形状,Matplotlib 设置参数marker的值 - o + - ★☆►◁ - 够用

markertype含义“.”point点“,”pixel像素“o”circle圆“v”triangle_down下三角“^”triangle_up上三角“<”triangle_left左三角“>”triangle_right右三角“1”tri_down类似奔驰的标志“2”tri_up类似奔驰的标志“3”tri_left类似奔驰的标志“4”tri_right类似奔驰的…

iphone静态库的加载和调试

一. iphone静态库的加载&#xff1a;使用静态库需要提供*.a库文件和*.h头文件。 1. 在xcode中Frameworks项上点击右键add->existing files选择*.a库文件 2. 在classse项上点击右键add->existing files选择*.h头文件 3. 在需要使用库文件的*.m文件中添加import “*.h” 二…

Matplotlib - 散点图 scatter() 所有用法详解

目录 基本用法 散点的大小不同&#xff08;根据点对应的数值&#xff09; 散点的颜色不同&#xff08;指定颜色或者渐变色&#xff09; 散点图和折线图是数据分析中最常用的两种图形&#xff0c;他们能够分析不同数值型特征间的关系。其中&#xff0c;散点图主要用于分析特征…

VC 6中使用不同调用规范的函数在符号文件里的表示方式

在以前老版本的C编译器里&#xff0c;编译器会为使用不同调用约定&#xff08;Calling Convention&#xff09;的函数生成不同的名称&#xff0c;不仅是连接程序会遵从这个命名规则&#xff0c;调试器也会遵守这个命名规则。因此在Visual Studio里调试使用老版本编译器编译出来…

Matplotlib - 折线图 plot() 所有用法详解

散点图和折线图是数据分析中最常用的两种图形。其中&#xff0c;折线图用于分析自变量和因变量之间的趋势关系&#xff0c;最适合用于显示随着时间而变化的连续数据&#xff0c;同时还可以看出数量的差异&#xff0c;增长情况。 Matplotlib 中绘制散点图的函数为 plot() &…

html 拍照旋转了90度_华为Mate X2概念图:可旋转正反三屏幕,单颗镜头在转轴上...

如果你是新朋友&#xff0c;请点击上方的蓝色字 关注 “高科技爱好者”&#xff0c;保证不会让你失望的.华为折叠手机的上市发售&#xff0c;引起了消费者的广泛关注&#xff0c;尤其是华为MateX系列手机的售价非常昂贵&#xff0c;同时出货量也比较少&#xff0c;所以外界都十…