excel统计分析——协方差分析基本原理

参考资料:生物统计学

        方差分析中,要求除试验因素外的其他条件保持在相同水平上才能对实验结果的差异显著性进行比较,然而有些非试验因素很难或不可能人为控制,此时如果使用方差分析法推断处理其差异显著性,往往会导致错误的结果。为解决试验条件不同对试验结果的影响,统计学上将回归分析和方差分析结合起来,通过回归关系排除试验条件对试验结果的影响,称为协方差分析(analysis of covariance,ANCOVA)。由于校正后的结果是应用统计方法将试验条件控制一致而达到的,故协方差分析的实质是一种统计控制(statistical control)。

协方差分析的基本原理如下

(1)基本思想

        协方差分析是把方差分析与回归分析结合起来的一种统计分析方法,用于比较一个变量y在一个因素或几个因素不同水平上的差异,但这个变量在受试验因素影响的同时,还受到另外一个变量x的影响,而且变量x的取值难以人为控制,不能作为方差分析中的一个因素来处理。此时如果x和y之间可以建立回归关系,则可用协方差分析的方法排除x对y的影响,然后进行方差分析对各因素水平的影响作出统计推断。在协方差分析中,y对因变量(dependent variable),x为协变量(covariate)。

        协方差分析的核心思想是通过对因变量y的值进行调整,消除协变量x的影响,从而能对试验因素不同水平的影响进行统计检验。为此,首先需要判断协变量x对因变量y是否存在影响,如果影响显著,则需要去除其影响后对试验结果进行检验;如果影响不显著,则直接对试验结果进行检验

        统计学上研究两个变量是否存在影响的方法为回归分析,所以进行协方差分析时首先对数据进行回归分析,如果回归关系显著,说明变量x对变量y的影响显著,需对试验结果进行校正后进行方差分析;如果回归关系不显著,说明变量x对变量y的影响不显著,可直接对试验结果进行方差分析。

(2)协方差分析的数学模型

        假设试验有k个处理,观测指标y为因变量,x为协变量,每个处理设置n次重复,每组内均有n对观测值x,y,则该资料为具有kn对观测值的双变量资料。

        在协方差分析中,因变量的每个观察值可用以下线性数学模型表示:

y_{ij}=\mu+\alpha_i+\beta(x_{ij}-\bar{x})+\varepsilon _{ij}

其中:i=1,2,...,k;j=1,2,...,n;y_ij为试验因素第i水平的第j次观测值;x_ij为试验因素第i水平的第j次观测的协变量取值;\bar{x}为x_ij的总平均数;μ为y_ij的总平均数;\alpha_i为第i水平的效应;β是y对x的线性回归系数;\varepsilon _{ij}为随机误差。且满足以下基本假定:①\varepsilon _{ij}独立,且服从正态分布N(0,\sigma^2);②β≠0,即y与x之间存在线性关系,且水平回归系数相等,即协变量的影响不随水平的变化而变化;③处理效应之和为0,即\sum \alpha_i=0。试验因素为固定因素;如果为随机因素,则处理效应的方差为0。

(3)协方差分析的基本假定

        ①x是固定的变量,因而处理效应\alpha_i属于固定模型。

        ②\varepsilon _{ij}独立(与αi无关),且服从正态分布N(n,\sigma^2)。即各处理的离回归方差无显著差异(同质)。

        ③各处理的(x,y)总体是线性的,且具有相同的回归系数β≠0,因而各处理总体的回归是一组平行的直线。对样本而言,各误差项的回归系数本身显著,但各回归系数bi之间无显著差异。

(4)协方差分析的步骤

①平方和、乘积和与自由度的分解

        因变量y的总变异包括处理效应、协变量x的影响和随机误差三部分,根据直线回归和方差的计算方法,需要对不同变异源的平方和、乘积和与自由度进行分解,计算均方并进行统计检验。

        平方和与自由度的分解与方差分析部分相同。参照平方和分解的方法,可将乘积和也分解为总变异乘积和SP_T、处理间乘积和SP_t及误差乘积和SP_e三部分,即

SP_T=\sum \sum(x-\bar{x})(y-\bar{y})=\sum \sum xy-T_xT_y/(kn)

SP_t=n\sum(\bar{x_{i.}}-\bar{x})(\bar{y_{i.}}-\bar{y})=\sum(T_{x_{i.}}T_{y_{i.}})/n-T_xT_y/(kn)

SP_e=\sum\sum(x-\bar{x_{i.}})(y-\bar{y_{i.}})=\sum\sum xy-\sum(T_{x_{i.}}T_{y_{i.}})/n

②回归系数的计算和回归显著性检验

        处理间的差异是由于处理效应αi不同引起的,而误差则包括协变量x的影响和随机误差两部分,所以回归系数的计算在组内进行,于是有:

b^*=SP_e/SS_{e_{x}}

        回归关系的显著性可以用F检验或t检验进行。这是误差项回归自由度df_{e_U}=1,其回归平方和为:

U_e=SS_{e_y}-b^*SP_e=SP_e^2/SS_{e_x}

误差项离回归平方和为:

Q_e=SS_{e_{y}}-U_{e_y}=SS_{e_y}-SP_e^2/SS_{e_x}

离回归自由度为:

df_{e_Q}=df_e-df_{e_U}=k(n-1)-1

用F检验进行检验时,df_1=df_{e_U}=1df_2=df_{e_U}=k(n-1)-1

统计量:

F=[k(n-1)-1]U_e/Q_e

③矫正平均数的差异显著性检验

        如果回归关系不显著,直接对试验结果进行方差分析;如果回归关系显著,则用回归系数对y进行矫正,消除x的影响后,对校正后的数据进行方差分析。

        要检验校正后的y值差异的显著性,在进行平方和的计算时,并不需要将各矫正的y值求出后重新计算,统计学上已证明,矫正后的平方和、误差平方和及自由度等于相应变异项的离回归平方和及自由度。于是平方和及自由度计算如下:

SS_T'=SS_{T_y}-SP_T^2/SS_{T_x}             df_T'=(nk-1)-1=nk-2

SS_e'=SS_{e_y}-SP_e^2/SS_{e_x}                                  df_t'=k-1               

SS_t'=SS_T'-SS_e'                                              df_e'=k(n-1)-1

根据平方和、自由度分别计算处理均方和误差均方,并进行F检验。

④矫正平均数的多重比较

        如果F检验处理间差异显著,需进行多重比较。进行多重比较时,需使用矫正后的平均数。矫正公式为:

 \bar{y_i}'=\bar{y_i}-b^*(\bar{x_i}-x)

        矫正平均数的比骄傲可以使用t检验、LSD法和Duncan法等。用t检验进行比较时,统计量

t=(\bar{y_i}'-\bar{y_j}')/s_{\bar{d}}'

其中,s_{\bar{d}}'为两矫正平均数差数间的标准误,计算公式为:

s_{\bar{d}}'=\sqrt{MS_e'[\frac{2}{n}+\frac{(\bar{x_i}-\bar{x_j})^2}{SS_{e_x}}]}

        当误差自由度较大(df_e≥20)且x的变异较小时,可采用LSD法、Duncan法等。这时两矫正平均数差数间的标准误不再根据两组样本x均值差计算。

对于LSD法,有

s_{\bar{d}}'=\sqrt{\frac{2MS_e'}{n}[1+\frac{SS_{t_x}}{(k-1)SS_{e_x}}]}

对于Duncan法,有

s_{\bar{d}}'=\sqrt{\frac{MS_e'}{n}[1+\frac{SS_{t_x}}{(k-1)SS_{e_x}}]}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/773053.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux进程的管理和进程的状态

进程的基本概念: 程序的一个执行实例 ,正在执行的程序等等 ——— 课本概念 担当分配系统资源的实体,例如cpu时间,内存 -----内核的观点 一、进程的管理 processbar 存储在磁盘中的可执行文件 可执行文件在启动/运行的同时&…

阿里云安全产品简介,Web应用防火墙与云防火墙产品各自作用介绍

在阿里云的安全类云产品中,Web应用防火墙与云防火墙是用户比较关注的安全类云产品,二则在作用上并不是完全一样的,Web应用防火墙是一款网站Web应用安全的防护产品,云防火墙是一款公共云环境下的SaaS化防火墙,本文为大家…

政安晨:【Keras机器学习实践要点】(四)—— 顺序模型

政安晨的个人主页:政安晨 欢迎 👍点赞✍评论⭐收藏 收录专栏: TensorFlow与Keras实战演绎机器学习 希望政安晨的博客能够对您有所裨益,如有不足之处,欢迎在评论区提出指正! 介绍 Keras是一个用于构建和训练深度学习模…

MySQL数据库高级语句(一)

文章目录 MySQL高级语句older by 排序区间判断查询或与且(or 与and)嵌套查询(多条件)查询不重复记录distinctcount 计数限制结果条目limit别名as常用通配符 结语 MySQL高级语句 1构建测试用表 create table test1 (id int prima…

湖北汽车工业学院 实验一 关系数据库标准语言SQL

头歌 实验一 关系数据库标准语言SQL 制作不易!点个关注呗!为大家创造更多的价值! 目录 头歌 实验一 关系数据库标准语言SQL**制作不易!点个关注呗!为大家创造更多的价值!** 第一关:创建数据库第…

Apple Vision Pro应用合集

这里给大家分享一个网站,手机了最新的apple vision pro 上面运行的应用。 1、查找应用:用户可以浏览特色推荐的应用,或者通过随机挑选功能发现新的应用。 2、社区交流:提供社区功能,用户可以在这里交流使用体验、分享…

小程序接入第三方信息流流程 下载SDK

由第三方信息流提供相应的SDK下载链接以及接入说明和开发文档或其他方式接入,如果第三方能支持小程序SDK,则不需要后面步骤,只需要提供相关开发文档和接入方式接口 接入SDK 后台开发人员接入第三方提供的SDK,并进行相关接口开发…

在django中使用kindeditor出现转圈问题

在django中使用kindeditor出现转圈问题 【一】基础检查 【1】前端检查 确保修改了uploadJson的默认地址 该地址需要在路由层有映射关系 确认有加载官方文件 kindeditor-all-min.js确保有传递csrfmiddlewaretoken 或者后端关闭了csrf验证 <textarea name"content&qu…

如何使用 ChatGPT 进行编码和编程

文章目录 一、初学者1.1 生成代码片段1.2 解释功能 二、自信的初学者2.1 修复错误2.2 完成部分代码 三、中级水平3.1 研究库3.2 改进旧代码 四、进阶水平4.1 比较示例代码4.2 编程语言之间的翻译 五、专业人士5.1 模拟 Linux 终端 总结 大多数程序员都知道&#xff0c;ChatGPT …

GitLab更新失败(Ubuntu)

在Ubuntu下使用apt更新gitlab报错如下&#xff1a; An error occurred during the signature verification.The repository is not updated and the previous index files will be used.GPG error: ... Failed to fetch https://packages.gitlab.com/gitlab/gitlab-ee/ubuntu/d…

thinkadmin 新版安装步骤

1.通过 Composer 安装: ( 推荐方式,默认只安装 admin 模块 ) ### 创建项目( 需要在英文目录下面执行 ) composer create-project zoujingli/thinkadmin### 进入项目根目录 cd thinkadmin### 数据库初始化并安装 ### 默认使用 Sqlite 数据库,若使用其他数据库请按第二步修…

AIGC工具系列之——基于OpenAI的GPT大模型搭建自己的AIGC工具

今天我们来讲讲目前非常火的人工智能话题“AIGC”&#xff0c;以及怎么使用目前的AI技术来开发&#xff0c;构建自己的AIGC工具 什么是AIGC&#xff1f; AIGC它的英文全称为(Artificial Intelligence Generated Content)&#xff0c;中文翻译过来就是“人工智能生成内容”&…

HarmonyOS网格布局:List组件和Grid组件的使用

简介 在我们常用的手机应用中&#xff0c;经常会见到一些数据列表&#xff0c;如设置页面、通讯录、商品列表等。下图中两个页面都包含列表&#xff0c;“首页”页面中包含两个网格布局&#xff0c;“商城”页面中包含一个商品列表。 上图中的列表中都包含一系列相同宽度的列表…

java类的定义方式和实例化、this引用、对象的构造及其初始化、封装特性、static修饰成员变量、static修饰成员方法

java类的定义方式和实例化 类的定义和使用 类是用来对一个实体(对象)来进行描述的&#xff0c;主要描述该实体(对象)具有哪些属性(外观尺寸等)&#xff0c;哪些功能(用来干啥)&#xff0c;描述完成后计算机就可以识别了。 在Java中定义类需要用到class关键字具体如下 // 创…

API网关-Apisix路由配置教程(数据编辑器方式)

文章目录 前言一、端口修改1. apisix 端口修改2. dashboard 端口修改3. 登录密码修改 二、常用插件介绍1. 常用转换插件1.1 proxy-rewrite插件1.1.1 属性字段1.1.2 配置示例 2. 常用认证插件2.1 key-auth插件2.1.1 消费者端字段2.1.2 路由端字段2.1.3 配置示例 2.2 basic-auth插…

Oracle 19cADG集群补丁升级

Oracle 19cADG集群补丁升级 文章目录 Oracle 19cADG集群补丁升级1.备库备份2.备库升级Opatch3.备库应用补丁4.主库备份 oracle_home目录5.主库升级Opatch6.注册补丁7.编译无效对象8.检查主库的补丁注册情况9.备库切换主库完成补丁注册 1.备库备份 su - oracle cd $ORACLE_HOME…

[webpack-cli] Invalid options object 报错

[webpack-cli] Invalid options object. Dev Server has been initialized using an options object that does not match the API schema devServer: {contentBase: ./src, // 告诉服务器从哪里提供内容&#xff0c;默认情况下&#xff0c;它会使用当前工作目录作为根目录c…

深度学习pytorch——减少过拟合的几种方法(持续更新)

1、增加数据集 2、正则化(Regularization) 正则化&#xff1a;得到一个更加简单的模型的方法。 以一个多项式为例&#xff1a; 随着最高次的增加&#xff0c;会得到一个更加复杂模型&#xff0c;模型越复杂就会更好的拟合输入数据的模型&#xff08;图-1&#xff09;&#…

Oracle中实现根据条件对数据的增删改操作——Merge Into

一、需求描述 在我们进行项目开发的过程中&#xff0c;会遇到这样的场景&#xff0c;需要根据某个条件对数据进行增、删、改的操作&#xff1b;遇到这种情况我们有2种方法进行解决&#xff1a; 方法一&#xff1a;①查询指定条件&#xff1b;②根据查询出的指定条件结果在执行…

阿里云国际DDoS高防的定制场景策略

DDoS高防的定制场景策略允许您在特定的业务突增时段&#xff08;例如新业务上线、双11大促销等&#xff09;选择应用独立于通用防护策略的定制防护策略模板&#xff0c;保证适应业务需求的防护效果。您可以根据需要设置定制场景策略。 背景信息 定制场景策略提供基于业务场景…