excel线性拟合的斜率_协方差分析:方差分析与线性回归的统一

a40829801900fdc1ca794e889b615e45.png

转自个人微信公众号【Memo_Cleon】的统计学习笔记:协方差分析:方差分析与线性回归的统一。

在进行数据分析时,有时候我们会遇到数据基线不平的情况,比如两样本的t检验的示例,比较Labe和Meto用药13周的降压效果,但一开始用药的时候两组舒张压的差别便有统计学意义。除了文中使用的差值比较,协方差分析是一个非常不错的选择。

28ccab4a4a234b0d6650cb989ee1a442.png

协变量是对观察结果有影响但无法或难以控制的因素。协方差分析是通过直线回归的方式把协变量值化为相等(协变量取值其总均数)后求得因变量的修正均数,以此控制混杂因素的影响后,用方差分析比较修正均值间的差别。

适用条件:

(1)协变量为连续变量,且各组因变量与协变量呈线性关系;

(2)各组因变量残差呈正态分布;

(3)各组因变量残差等方差;

(4)各组因变量和协变量的回归线平行,即斜率相等。也就是要求对于不同的自变量,协变量对因变量的影响相同。如不满足平行线假定,说明自变量和协变量存在交互作用,他们会同时对因变量产生影响,这样混杂起来我们就无法控制协变量。

(5)在考察因变量与协变量的线性关系时,严格来讲也需要考察建立每条回归直线的前提:线性趋势、独立、正态、方差齐、不存在多重共线、无明显异常点等,具体可参考“多因素线性回归”。

示例“两独立样本的t检验”数据来自excel的自动生成,没有任何实际意义。严格来说,本例因变量与协变量的线性关系也不明显,并不适合使用协方差分析。本例为演示操作步骤和结果解读使用。

示例1 SPSS操作步骤与结果解读

【1】条件考察

(1)因变量与协变量的线性关系考察

Graphs>>ChartBuilder…

51b4babf3465fe31ab414592c4151535.png

结果显示,不论Labe组还是Meto组,舒张压的基线值与治疗后结果线性关系并不明显,不适合使用线性模型来统计推断。注:本示例数据是通过Excel自动生成,没有任何实际意义。

af29e143235c6f90fe5fee05ed4dde24.png

实际上使用线性模型进行拟合的结果也显示,两组的基线值与治疗后的舒张压并不成线性关系,线性拟合步骤如下:

Analyze>>Regression>>Linear…

  • Dependent(因变量):Dw13;
  • Independent(自变量):Dbl;变量筛选方法(Method):Enter
  • SelectionVariables(筛选变量):通过Rule筛选Group=1和Grou=2,分别进行两次线性拟合

主要结果:

Group=1:模型F=0.250,P=0.620;Dbl系数估计值-0.109,t=-0.500,P=0.620。

Group=2:模型F=0.190,P=0.666;Dbl系数估计值0.081,t=0.435,P=0.666。两个模型均只有一个自变量,系数检验和模型检验是一致的。

线性关系不成立是不能直接进行协方差分析的。为更好的演示操作,本例继续协方差进行分析的后续步骤。

(2)平行线假定检验:要检验治疗前和治疗后的舒张压的回归线是否平行,即治疗前舒张压对治疗后舒张压的影响在labe和meto两个组中是否相同,可用治疗前舒张压(Dbl)与治疗方法(Group)是否存在交互作用来表示。

Analyze>>GeneralLinear Model>>Univariate…

因变量:Dw13;固定因素:Group;协变量:Dbl

Model…对话框>>选择“Build Term”构建含有“Group、Dbl、Group*Dbl”的模型

其他默认选项

55c69f71df53c9b7be96e3700094f695.png

注:Model…对话框:全因素模型可以考察所有因素及其之间的交互作用,但各因素与协变量的交互作用不会输出,需要强行纳入处理因素和协变量的交互作用以进行分析,即group处于不同水平时,Dw13随Dbl变化的斜率是否相等。

结果显示:Group与Dbl的交互项无统计学意义(F=0.442,P=0.508),可以认为两组的斜率相同。

84f64d9b5e9d7ea908ebfc1210aa83de.png

(3)残差正态性与方差齐性考察

生成残差:Analyze>>General Linear Model>>Univariate…

因变量:Dw13;固定因素:Group;协变量:Dbl。

Save…对话框>>PredictedValues:Unstandardized;Residuals:Unstandardized、Srandardized。

正态性与方差齐性考察:Analyze>>Descriptive Statistics >>Explore…

因变量列表选入新生成的变量“Residual for Dw13[RES_1]”,因素列表选入“Group”;

Plots…对话框>>选中Normality plots with tests、Spread vs Levelwith Levene Test中的Untransform。方差齐性检验也可以直接在“选项”对话框中选择“Homogeneity tests”。

结果显示:Labe组数据呈正态,Meto组数据正态性一般,结合QQ图可以认为近似正态。可以认为两组方差相等。

de57e72f862dfc3a7325ce11114aedbf.png

bed57d9925826a308662a77ffd786848.png

正态性和方差齐性的检验方法很多,具体可参考正态分布与方差齐性的检验方法与SPSS操作,若要求不严格,可以直接用原始数据代替残差进行检验。

(4)因变量与协变量的线性回归条件检验本例略,可参考“多因素线性回归”。

【2】协方差分析

Analyze>>GeneralLinear Model>>Univariate…

b94c5a7c1abb565c2821e643a7e9a86d.png

因变量:Dw13;固定因素:Group;协变量:Dbl。

Model(模型)…>>选择“Build Term”构建含有“Group、Dbl”的模型。或者直接选择默认的全因素(Full factorial)模型。在适用条件的分析中,已经得出两组斜率相同,Group和Dbl的交互项无统计学意义,因此Group*Dbl应从模型中剔除。

EMMeans(边际均数)…>>显示边际均值框选入Group。选中“比较主效应”用于所选因素不同水平的主效应的边际均值两两比较,默认LSD法,本例只有两组,跟组间整体比较是一致的。“边际均数”的各个选项在旧版本中存在于“选项”对话框中。边际均数是剔除了其他变量的影响用于各水平比较的估计值,当分析模型含有协变量,边际均值和原始均值并不对应。

Save(保存)…>>去掉在平行性检验中选中的变量。

Options(选项)…>>Display(输出内容):Descriptive statistics(描述性统计量)、Parameterestimates(参数估计)、Homogeneity tests(方差齐性检验)。

其他默认选项。

【3】结果与解读

(1)受试者间因素信息

53a55d5216b494a33d6503538c2282a0.png

(2)描述性统计量。两组舒张压在用药13周后绝对数值上有差异。

9839aa28a27d9a464ea77bdfb179f853.png

(3)方差齐性检验:可以认为两组残差方差齐同(F=0.013,P=0.909>0.05)。

150314279e750802321f99e2f483ea3a.png

(4)受试者间效应检验。考虑了协变量之后的方差分析结果。舒张压的基线水平对治疗结束的舒张压没有影响(F=0.000,P=0.985>0.05),不同的用药方案治疗结束后舒张压不同(F=6.599,P=0.012<0.05)。

122f160bdb4e146a5887086c0f52b718.png

(5)参数估计。给出模型方程的一些系数,Dw13=88.613-0.003Dbl+0.977Group。注意SPSS默认以取值较高的水平(Group=2)为对照。舒张压的基线水平对治疗结束的舒张压水平没有影响(t=-0.109,P=0.985>0.05),与Meto组相比,Labe组治疗后血压值偏高0.977(t=2.569,P=0.012<0.05)。

84473edc320e65cc77c0de320d84618f.png

(6.1)修正均值估计。一般来说经过修正后组间差异会变小,原数据均值可参见描述性统计量表的结果。另外表格还显示,Dw13的修正均值是按基线Dbl=100.2进行评估,这个值实际上就是协变量的总均数。

69c3be7fba6c49209046cf17c881fa3d.png

(6.2)修正均值成对比较。本例只有两组,与6.3的整体比较结果一致。

aca0afb92e3d5e46f9e06d799a8804a4.png

(6.3)修正均值的单因素方差分析。组间效应的方差分析结果,同受试者间效应检验结果一致。不同的用药方案治疗结束后舒张压不同(F=6.599,P=0.012<0.05)。

b4abe0d05ac5f58e9dcc1eeca84f350e.png

【4】多重线性回归也可以用于这种协变量的分析。

Analyze>>Regression>>Linear…

  • Dependent(因变量):Dw13;
  • Independent(自变量):Dbl、Group;变量筛选方法(Method):Enter。

主要结果与协方差分析的参数估计一致,系数检验也与协方差分析的组间t检验结果完全一致,不再累述。系数表中Group的系数为-0.977,而协方差分析中为0.977,是参照水平不同造成的。

fe7ff1f761ebd834a0a789307402e63b.png

0a1d225b27cae2b03bfc71d3c3b43036.png

示例2 :60名糖尿病患者随机分为3组,分别给与常规药、新药A和新药B的降血糖治疗,比较3组治疗的血糖值。

这个案例,第一考虑就是采用完全随机设计的方差分析,可以直接使用One-Way ANOVA过程或者Univariate过程进行,具体过程可参考方差分析。结果显示,3组治疗后效果没有统计学差异(F=2.171,P=0.123)。但同时我们也发现治疗前的血糖的基线值有统计学意义(F=4.457,P=0.016<0.05),其中常规药和新药B存在统计学差异(P=0.004)。我们很难说治疗后的效果没有统计学差异,是因为不同的给药方法治疗效果一样,还是因为基线值的差异造成的。可以考虑使用协方差分析剔除基线值对结果的影响。

b0da8126286c5bfde33086516d4115d7.png

2a1a8cd93626c2f54ae58106aedea6c8.png

【1】条件考察。

(1)线性趋势考察:Graphs>>Chart Builder…

efb5f2a4f145feaecff3763b237ac034.png

结果显示3组线性趋势较为明显。但从拟合线上看,3条回归直线存在交叉,可能不满足回归线平行的条件,需要在统计学上进行检验。

3232bdcbd048380b1ce262d8fbbaa3a2.png

(2)平行线检验:Analyze>>General Linear Model>>Univariate…

1204ff9514dcb4cb2606b751f08cbbb9.png

结果显示协变量与分组变量交互作用没有统计学意义(F=1.901,P=0.159>0.05),满足回归线平行的条件。

30ee7c31f234db5cbc0943b15cfb50fb.png

(3)正态性、方差齐性考察。步骤略,可参见示例1。各组数据残差呈正态分布,方差齐同。

0b50da088507e2ed26d49948669ef700.png

b00d374985f9d9f3d189f6897b9bc49d.png

【2】协方差分析:Analyze>>General Linear Model>>Univariate…

b615ec4b8cfb4b9615f3607fe7d755a2.png

主要结果:

(1)受试者间因素信息。

aaf9c149f580cc1be0354ac45a68d55e.png

(2)描述性统计量。三组血糖值在用药后平均值、标准差及案例数。

c2334e7311d56e4894c1a9e2f675c3f9.png

(3)方差齐性检验:三组残差方差齐同(F=1.682,P=0.195>0.05)。

c78f3ff685345c5deacfa486ebd4e293.png

(4)受试者间效应检验。建立的分析模型有统计学意义(F=88.784,P<0.001),说明至少有一个因素(分组变量或协变量)对因变量有影响。基线值(协变量值)的确能对最终的结果产生影响(F=243.549,P<0.001),不同的用药方案治疗效果也不同(F=6.299,P=0.003<0.001)。

aad258a3fe2a8f305ee55bcdb62d47c5.png

(5)模型参数估计。基线值(协变量值)对最终结果的影响有统计学意义(t=15.606, P<0.001),t值15.606=协方差分析中F值243.549的平方,治疗前血糖每升高1mmol/L,治疗后血糖升高0.604mmol/L。与药物B(Group=3)相比,常规药物(Group=1)有治疗效果更差(t=2.216,P=0.031<0.05),将药物B改用常规药物进行治疗,血糖升高0.665mmpl/L;与药物B(Group=3)相比,药物A(Group=2)有治疗效果更差(t=3.523,P=0.001<0.05),将药物B改用药物A进行治疗,血糖升高1.001mmpl/L。

6ca4017ada94360b528afd62c6412072.png

(6)边际均数的估计值。因变量边际均数、标准误及95%置信区间,治疗后血糖值End的修正均值是按基线Baseline=13.298进行评估,该值是协变量基线值的的总均数。

a8fbf9960b44737b4490233cbba64ced.png

(7)边际均数的成对比较。结果显示药物B治疗效果好于常规药物(P=0.031)和药物A(P=0.001),药物A和常规药物治疗效果没有统计学差异(P=0.244)。边际均数是剔除了其他变量的影响用于各个水平比较的估计值,当分析模型含有协变量,边际均值和原始均值并不对应,原始均值的Post Hoc比较可参见示例2开始处表格。

d875e421045d8589e918adcb34fd32c5.png

(8)受试者间边际均数的总体比较。同受试者间效应检验结果一致,F=6.299,P=0.003,不同的用药方案治疗效果也不同。

f313c5acdedfb8aec3a7fcaa93e3dd71.png

【3】同样的,该示例也可改用多因素线性回归,可以得到与协方差分析相一致的结果,但需要对无序多分类的分组变量(Group)进行哑变量设置,以常规药物(Group=1)为参考水平为例,步骤如下:

(1)DrugA哑变量编码:Transform>>Recodeinto Different Variables…

67b9e66724e5baaa6114f421cf520f27.png

重复以上操作(或在DrugA哑变量设置基础上对Old and New Variable对话框中的赋值修改),进行DrugB的哑变量编码。如果变量较多,可以直接在完成第一个哑变量的编码后,点击Paste按键进入程序编辑器,复制黏贴修改赋值的方法进行全部哑变量的设置,如本例可以复制第一行,然后对赋值进行修改,如下(黑体为粘贴修改后的内容):

RECODE Group (2=1) (ELSE=0) INTO DrugA.

RECODE Group(3=1) (ELSE=0) INTO DrugB.

EXECUTE.

然后点击运行即可。

(2)多因素线性回归:Analyze>>Regression>>Linear…

  • Dependent(因变量):End;
  • Independent(自变量):Baseline、DrugA、DrugB;变量筛选方法(Method):Enter。要特别注意,哑变量要遵循同进同出的原则,如进行变量筛选,可以将哑变量放在一个Block中进行。

(3)主要结果:回归模型有统计学意义(F=88.784,P<0.001),基线值(协变量值)的确能对最终的结果产生影响(t=15.606, P<0.001), t值15.606=协方差分析中F值243.549的平方,治疗前血糖每升高1mmol/L,治疗后血糖升高0.604mmol/L。与常规药物相比,药物B具有更好的治疗效果(t=-2.216,P=0.031<0.05),将常规药物改用药物B进行治疗,血糖可以降低0.665mmpl/L,而药物A的治疗和常规药物的治疗效果类似(t=1.178,P=0.244>0.05)。

794356023a5235255d16e084c8287e55.png

99a38edfb9cf4b37115d195d49e7489f.png

注意示例编码是DrugA和DrugB是与常规药物相比,如要比较药物A和药物B则需要对哑变量的赋值进行修改。此处有人可能会发现,系数与协方差分析的参数估计系数估计值不一致,这是因为SPSS默认以取值较高的水平(Group=3,DrugB)为对照,如将常规药、药物A和药物B分别赋值为3、2、1,并在数据表中对应的记录做修改后做协方差分析,结果和采用哑变量的分析完全一致,结果如下:

a85766d0a94ee53867f341568c7e5ae9.png

还有一个问题要考虑,当协变量与因变量的回归线不平行,及分析因素与协变量存在交互作用时,该如何处理?除了数据变换处理,可以进行分段进行协方差分析,或者在分析因素不同水平上分别进行分析。在多因素线性回归中,我们可以考虑引入交互项,但引入交互项和可能带来的问题是分析因素与交互项存在多重共线,在多因素线性回归一文的最后,我们采用的方法是将变量中心化。当然也可以不引入交互项,而在分析因素不同水平上分别进行线性回归。最后,本例拟合多因素线性回归将无序多分类的分组因素重新编码为哑变量,对分类变量除了使用这种办法,还可以使用分类变量的最优尺度回归来进行。

END

转自个人微信公众号【Memo_Cleon】的统计学习笔记:协方差分析:方差分析与线性回归的统一。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/430027.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

状态模式和策略模式的区别

区别主要体现在行为上&#xff0c;而不是结构上&#xff0c;所以&#xff0c;看时序图就能很好的看出两者的区别。 状态模式 看1.4&#xff0c;状态B是状态A创建的&#xff0c;也就是由系统本身控制的。调用者不能直接指定或改变系统的状态转移 所以&#xff0c;状态是系统自…

如何截获打印机文件_打印、复印还不会,如何在办公室里混?全程详细教学

我们在职场中&#xff0c;经常需要用到打印机&#xff0c;相信很多人都还不会打印、复印文件&#xff0c;求人不如求己&#xff0c;今天就来详细教学&#xff0c;一起来学习吧。如何使用打印机&#xff1f;首先用一根电源线和一根USB线&#xff0c;将电脑主机与打印机连接&…

外观模式案例分析

策划案 要实现选中和未选中功能&#xff1a; 未选中状态&#xff1a;点击图形进入选中状态 选中状态&#xff1a;点击<按钮进入未选中状态 实现代码 请问这是什么模式&#xff1f; import TransformController from ./TransformController //操作框控制器类 import To…

input ios问题 小程序_小程序可以解决哪些问题??

小程序是近几年移动互联网领域的热点&#xff0c;随着移动互联网在消费端逐渐进入到了存量时代&#xff0c;小程序成为了互联网平台向各个领域垂直发展的重要策略&#xff0c;而广大的中小创业者要想充分利用大型互联网平台的流量资源&#xff0c;小程序也是一个非常重要的渠道…

sprintf函数_三分钟学 Go 语言——函数深度解析(下) 可变参数

接连两篇函数专题深度解析&#xff0c;相信大家已经对函数的语法有了深入的了解。函数简单使用和基本知识解析匿名函数和闭包五一放假期间&#xff0c;我懂得&#xff0c;估计你们都不想学习。小熊这两天因为个人种种令人难受的原因&#xff0c;没有能更新&#xff0c;也没有提…

手工画设计模式的类图

画图成果 面试常考设计模式&#xff0c;往往需要动手画类图。之前面试的时候碰到画类图&#xff0c;往往直奔主题&#xff0c;立即开始画&#xff0c;往往画得很乱。其实面试是一个过程&#xff0c;看中的是思考分析解决问题的过程&#xff0c;结果反而不那么重要。画设计模式…

Reason: image not found

刚生的Xcode8&#xff0c;出现好多Error&#xff0c;有些Error真的太麻烦不想记录&#xff0c;现在这个挺简单的&#xff0c;就记下来&#xff0c;控制台输出的Error信息如下&#xff1a; fix&#xff1a; Target -> Build Phases ->Link Binary With Libraries&#xff…

怎么查看usb读取信息_电脑弹出USB设备时提示该设备正在使用中的解决方法

转载的文章&#xff0c;原文&#xff1a;电脑弹出USB设备时提示该设备正在使用中的解决方法&#xff0d;系统城​www.xitongcheng.com电脑弹出USB设备时提示该设备正在使用&#xff0c;虽然在正常显示时并没有程序在使用&#xff0c;但是确实会出现这种情况&#xff0c;实际上确…

js菜单自适应的实现

功能示意图 菜单自适应示意图如下&#xff1a; 对象A可以拖动&#xff0c;缩放。菜单跟随对象A拖动&#xff0c;位置优先级为下面、上面、右边、左边、中间。 实现思路 其实菜单放在上下左右中&#xff0c;都是它的left和top在变&#xff0c;我们只要依次计算菜单在下/上/右…

promise简析

promise可以解决多个回调函数嵌套问题&#xff0c;将嵌套所表示的流程通过同步的代码更加清晰的表达出来。 promise的用法与使用配置文件很类似&#xff1a;启动异步函数&#xff0c;在then里面配置好异步函数成功或执行失败的回调函数&#xff0c;然后就可以去干别的事了。 …

webpaper网页出题语言

目的 方便编写web试题&#xff0c;直接使用几个简单的标签&#xff0c;就可以生成一份可以在web上使用&#xff0c;并且可以打印出来的题。 效果预览 考卷打印效果 生成考卷发送给学生&#xff0c;或打印出来线下考 答案卷打印效果&#xff1a; 通过点击”显示答案”生成答…

table 表格点击当前行按钮隐藏当前的另一个按钮_Excel表格为什么那么慢已经应该如何解决(四)一类特殊的函数易变函数(volatile function)...

我们&#xff0c;让Excel变简单今天我们把主题聚焦在一类特殊函数造成的问题上——volatile function。这一类函数有人把他们翻译成“易变函数”&#xff0c;其实挺贴切的。本系列其他文章&#xff1a;Excel表格为什么那么慢已经应该如何解决(一)概述Excel表格为什么那么慢已经…

h5离线应用

h5离线应用 所谓离线应用&#xff0c;就是断网之后还可以运行的应用。h5提供了application cache&#xff0c;可以保存网页的离线数据。CSDN的Markdown编辑器就运用了application cache&#xff0c;在没有网络的情况下&#xff0c;一样可以正常使用&#xff0c;这就是一个很好…

[deviceone开发]-do_RichLabel的简单示例

一、简介 do_RichLabel支持html格式的文本内容&#xff0c;但是只支持部分标签&#xff0c;这个示例列出了一些支持的常用标签&#xff0c;android能支持的标签相对ios更少 二、效果图 三、相关下载 https://github.com/do-project/code4do/tree/master/richlabel_demo 四、相关…

使用rpm包升级ntpd服务_服务器准备升级,小程序将暂停使用

今天说3件事情&#xff1a;一、由于用户增速超出了我们的预期&#xff0c;为确保法助攻小程序的使用体验&#xff0c;我们购买了更高配置的服务器&#xff0c;目前&#xff0c;内部测试已完成&#xff0c;现决定对服务器进行正式升级。服务器升级时间&#xff1a;8月7日(本周五…

重装Nodejs后,webstorm代码报错问题

项描述现象之前没有问题的代码&#xff0c;突然出现很多奇怪的错误原因没有更新webstorm的Nodejs路径设置造成的解决办法重新设置webstorm的Nodejs路径&#xff0c;见下图 重新选择Nodejs安装目录&#xff0c;点击应用

java peek函数_基础篇:JAVA.Stream函数,优雅的数据流操作

写在开头&#xff1a;本文是转载于掘金上的一篇文章&#xff0c;已获得原作者授权&#xff0c;我会在文章最后放上原作者和原文链接。前言平时操作集合数据&#xff0c;我们一般都是for或者iterator去遍历&#xff0c;不是很好看。java提供了Stream的概念&#xff0c;它可以让我…

mongodb 数组添加_NoSQL之MongoDB——简介

MongoDB是一种开源文档型数据库&#xff0c;它具有高性能&#xff0c;高可用性&#xff0c;自动扩展性1.文档数据库MongoDB用一个文档来表示一条记录&#xff0c;文档的数据结构由键值对组成。MongoDB文档类似于JSON对象&#xff0c;字段值可能是文档&#xff0c;数组&#xff…

Buying Feed, 2010 Nov (单调队列优化DP)

约翰开车回家&#xff0c;又准备顺路买点饲料了&#xff08;咦&#xff1f;为啥要说“又”字&#xff1f;&#xff09;回家的路程一共有 E 公里&#xff0c;这一路上会经过 K 家商店&#xff0c;第 i 家店里有 Fi 吨饲料&#xff0c;售价为每吨 Ci 元。约翰打算买 N 吨饲料&…

一次真实的XXS攻击

这是一个真实的事&#xff0c;一家比较大的公司举办的一个全国性的投票&#xff0c;然而&#xff0c;页面确实写得很烂&#xff0c;做假太容易。 首先&#xff0c;找到投票按钮的源代码&#xff1a; 这个”tp”类就是投票事件的定位关键字。 然后&#xff0c;打开source下的源…