excel统计分析——协方差分析基本原理

参考资料:生物统计学

        方差分析中,要求除试验因素外的其他条件保持在相同水平上才能对实验结果的差异显著性进行比较,然而有些非试验因素很难或不可能人为控制,此时如果使用方差分析法推断处理其差异显著性,往往会导致错误的结果。为解决试验条件不同对试验结果的影响,统计学上将回归分析和方差分析结合起来,通过回归关系排除试验条件对试验结果的影响,称为协方差分析(analysis of covariance,ANCOVA)。由于校正后的结果是应用统计方法将试验条件控制一致而达到的,故协方差分析的实质是一种统计控制(statistical control)。

协方差分析的基本原理如下

(1)基本思想

        协方差分析是把方差分析与回归分析结合起来的一种统计分析方法,用于比较一个变量y在一个因素或几个因素不同水平上的差异,但这个变量在受试验因素影响的同时,还受到另外一个变量x的影响,而且变量x的取值难以人为控制,不能作为方差分析中的一个因素来处理。此时如果x和y之间可以建立回归关系,则可用协方差分析的方法排除x对y的影响,然后进行方差分析对各因素水平的影响作出统计推断。在协方差分析中,y对因变量(dependent variable),x为协变量(covariate)。

        协方差分析的核心思想是通过对因变量y的值进行调整,消除协变量x的影响,从而能对试验因素不同水平的影响进行统计检验。为此,首先需要判断协变量x对因变量y是否存在影响,如果影响显著,则需要去除其影响后对试验结果进行检验;如果影响不显著,则直接对试验结果进行检验

        统计学上研究两个变量是否存在影响的方法为回归分析,所以进行协方差分析时首先对数据进行回归分析,如果回归关系显著,说明变量x对变量y的影响显著,需对试验结果进行校正后进行方差分析;如果回归关系不显著,说明变量x对变量y的影响不显著,可直接对试验结果进行方差分析。

(2)协方差分析的数学模型

        假设试验有k个处理,观测指标y为因变量,x为协变量,每个处理设置n次重复,每组内均有n对观测值x,y,则该资料为具有kn对观测值的双变量资料。

        在协方差分析中,因变量的每个观察值可用以下线性数学模型表示:

y_{ij}=\mu+\alpha_i+\beta(x_{ij}-\bar{x})+\varepsilon _{ij}

其中:i=1,2,...,k;j=1,2,...,n;y_ij为试验因素第i水平的第j次观测值;x_ij为试验因素第i水平的第j次观测的协变量取值;\bar{x}为x_ij的总平均数;μ为y_ij的总平均数;\alpha_i为第i水平的效应;β是y对x的线性回归系数;\varepsilon _{ij}为随机误差。且满足以下基本假定:①\varepsilon _{ij}独立,且服从正态分布N(0,\sigma^2);②β≠0,即y与x之间存在线性关系,且水平回归系数相等,即协变量的影响不随水平的变化而变化;③处理效应之和为0,即\sum \alpha_i=0。试验因素为固定因素;如果为随机因素,则处理效应的方差为0。

(3)协方差分析的基本假定

        ①x是固定的变量,因而处理效应\alpha_i属于固定模型。

        ②\varepsilon _{ij}独立(与αi无关),且服从正态分布N(n,\sigma^2)。即各处理的离回归方差无显著差异(同质)。

        ③各处理的(x,y)总体是线性的,且具有相同的回归系数β≠0,因而各处理总体的回归是一组平行的直线。对样本而言,各误差项的回归系数本身显著,但各回归系数bi之间无显著差异。

(4)协方差分析的步骤

①平方和、乘积和与自由度的分解

        因变量y的总变异包括处理效应、协变量x的影响和随机误差三部分,根据直线回归和方差的计算方法,需要对不同变异源的平方和、乘积和与自由度进行分解,计算均方并进行统计检验。

        平方和与自由度的分解与方差分析部分相同。参照平方和分解的方法,可将乘积和也分解为总变异乘积和SP_T、处理间乘积和SP_t及误差乘积和SP_e三部分,即

SP_T=\sum \sum(x-\bar{x})(y-\bar{y})=\sum \sum xy-T_xT_y/(kn)

SP_t=n\sum(\bar{x_{i.}}-\bar{x})(\bar{y_{i.}}-\bar{y})=\sum(T_{x_{i.}}T_{y_{i.}})/n-T_xT_y/(kn)

SP_e=\sum\sum(x-\bar{x_{i.}})(y-\bar{y_{i.}})=\sum\sum xy-\sum(T_{x_{i.}}T_{y_{i.}})/n

②回归系数的计算和回归显著性检验

        处理间的差异是由于处理效应αi不同引起的,而误差则包括协变量x的影响和随机误差两部分,所以回归系数的计算在组内进行,于是有:

b^*=SP_e/SS_{e_{x}}

        回归关系的显著性可以用F检验或t检验进行。这是误差项回归自由度df_{e_U}=1,其回归平方和为:

U_e=SS_{e_y}-b^*SP_e=SP_e^2/SS_{e_x}

误差项离回归平方和为:

Q_e=SS_{e_{y}}-U_{e_y}=SS_{e_y}-SP_e^2/SS_{e_x}

离回归自由度为:

df_{e_Q}=df_e-df_{e_U}=k(n-1)-1

用F检验进行检验时,df_1=df_{e_U}=1df_2=df_{e_U}=k(n-1)-1

统计量:

F=[k(n-1)-1]U_e/Q_e

③矫正平均数的差异显著性检验

        如果回归关系不显著,直接对试验结果进行方差分析;如果回归关系显著,则用回归系数对y进行矫正,消除x的影响后,对校正后的数据进行方差分析。

        要检验校正后的y值差异的显著性,在进行平方和的计算时,并不需要将各矫正的y值求出后重新计算,统计学上已证明,矫正后的平方和、误差平方和及自由度等于相应变异项的离回归平方和及自由度。于是平方和及自由度计算如下:

SS_T'=SS_{T_y}-SP_T^2/SS_{T_x}             df_T'=(nk-1)-1=nk-2

SS_e'=SS_{e_y}-SP_e^2/SS_{e_x}                                  df_t'=k-1               

SS_t'=SS_T'-SS_e'                                              df_e'=k(n-1)-1

根据平方和、自由度分别计算处理均方和误差均方,并进行F检验。

④矫正平均数的多重比较

        如果F检验处理间差异显著,需进行多重比较。进行多重比较时,需使用矫正后的平均数。矫正公式为:

 \bar{y_i}'=\bar{y_i}-b^*(\bar{x_i}-x)

        矫正平均数的比骄傲可以使用t检验、LSD法和Duncan法等。用t检验进行比较时,统计量

t=(\bar{y_i}'-\bar{y_j}')/s_{\bar{d}}'

其中,s_{\bar{d}}'为两矫正平均数差数间的标准误,计算公式为:

s_{\bar{d}}'=\sqrt{MS_e'[\frac{2}{n}+\frac{(\bar{x_i}-\bar{x_j})^2}{SS_{e_x}}]}

        当误差自由度较大(df_e≥20)且x的变异较小时,可采用LSD法、Duncan法等。这时两矫正平均数差数间的标准误不再根据两组样本x均值差计算。

对于LSD法,有

s_{\bar{d}}'=\sqrt{\frac{2MS_e'}{n}[1+\frac{SS_{t_x}}{(k-1)SS_{e_x}}]}

对于Duncan法,有

s_{\bar{d}}'=\sqrt{\frac{MS_e'}{n}[1+\frac{SS_{t_x}}{(k-1)SS_{e_x}}]}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/773053.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python数据解析xpath

前言一、安装?二、使用步骤1.基本使用**【2】谓语(Predicates)**案例 前言 xpath在Python的爬虫学习中,起着举足轻重的地位,对比正则表达式 re两者可以完成同样的工作,实现的功能也差不多,但xp…

Svn添加用户、添加用户组、配置项目权限等自动化配置脚本

实现在工作中自动化配置svn用户、用户组、和项目权限的脚本,在使用过程中如果有什么问题,可以联系我。 移步到gitee: svn account permission management: Svn账号、组、权限管理脚本 (gitee.com)

Linux进程的管理和进程的状态

进程的基本概念: 程序的一个执行实例 ,正在执行的程序等等 ——— 课本概念 担当分配系统资源的实体,例如cpu时间,内存 -----内核的观点 一、进程的管理 processbar 存储在磁盘中的可执行文件 可执行文件在启动/运行的同时&…

阿里云安全产品简介,Web应用防火墙与云防火墙产品各自作用介绍

在阿里云的安全类云产品中,Web应用防火墙与云防火墙是用户比较关注的安全类云产品,二则在作用上并不是完全一样的,Web应用防火墙是一款网站Web应用安全的防护产品,云防火墙是一款公共云环境下的SaaS化防火墙,本文为大家…

【Flink connector】文件系统 SQL 连接器:实时写文件系统以及(kafka到hive)实战举例

文章目录 一. 滚动策略:sink后文件切分(暂不关注)1. 切分分区目录下的文件2. 小文件合并 二. 分区提交1. 分区提交触发器 (什么时候创建分区)1.1. 逻辑说明1.2. 举例说明 2. 分区时间提取器 (由分区字段来写分区名)2.1. 逻辑说明2.2. 举例说明…

政安晨:【Keras机器学习实践要点】(四)—— 顺序模型

政安晨的个人主页:政安晨 欢迎 👍点赞✍评论⭐收藏 收录专栏: TensorFlow与Keras实战演绎机器学习 希望政安晨的博客能够对您有所裨益,如有不足之处,欢迎在评论区提出指正! 介绍 Keras是一个用于构建和训练深度学习模…

MySQL数据库高级语句(一)

文章目录 MySQL高级语句older by 排序区间判断查询或与且(or 与and)嵌套查询(多条件)查询不重复记录distinctcount 计数限制结果条目limit别名as常用通配符 结语 MySQL高级语句 1构建测试用表 create table test1 (id int prima…

【搜索引擎1】Ubuntu通过deb方式安装ElasticSearch和Kibana、ik中文分词插件

1、官网下载文件 版本为官网最新版本,ElasticSearch与Kibana版本必须保持一致 ElasticSearch下载地址:Download Elasticsearch | Elastic Kibana下载地址:Past Releases of Elastic Stack Software | Elastic 下载选择DEB文件 ik插件下载…

湖北汽车工业学院 实验一 关系数据库标准语言SQL

头歌 实验一 关系数据库标准语言SQL 制作不易!点个关注呗!为大家创造更多的价值! 目录 头歌 实验一 关系数据库标准语言SQL**制作不易!点个关注呗!为大家创造更多的价值!** 第一关:创建数据库第…

Apple Vision Pro应用合集

这里给大家分享一个网站,手机了最新的apple vision pro 上面运行的应用。 1、查找应用:用户可以浏览特色推荐的应用,或者通过随机挑选功能发现新的应用。 2、社区交流:提供社区功能,用户可以在这里交流使用体验、分享…

小程序接入第三方信息流流程 下载SDK

由第三方信息流提供相应的SDK下载链接以及接入说明和开发文档或其他方式接入,如果第三方能支持小程序SDK,则不需要后面步骤,只需要提供相关开发文档和接入方式接口 接入SDK 后台开发人员接入第三方提供的SDK,并进行相关接口开发…

在django中使用kindeditor出现转圈问题

在django中使用kindeditor出现转圈问题 【一】基础检查 【1】前端检查 确保修改了uploadJson的默认地址 该地址需要在路由层有映射关系 确认有加载官方文件 kindeditor-all-min.js确保有传递csrfmiddlewaretoken 或者后端关闭了csrf验证 <textarea name"content&qu…

如何使用 ChatGPT 进行编码和编程

文章目录 一、初学者1.1 生成代码片段1.2 解释功能 二、自信的初学者2.1 修复错误2.2 完成部分代码 三、中级水平3.1 研究库3.2 改进旧代码 四、进阶水平4.1 比较示例代码4.2 编程语言之间的翻译 五、专业人士5.1 模拟 Linux 终端 总结 大多数程序员都知道&#xff0c;ChatGPT …

GitLab更新失败(Ubuntu)

在Ubuntu下使用apt更新gitlab报错如下&#xff1a; An error occurred during the signature verification.The repository is not updated and the previous index files will be used.GPG error: ... Failed to fetch https://packages.gitlab.com/gitlab/gitlab-ee/ubuntu/d…

thinkadmin 新版安装步骤

1.通过 Composer 安装: ( 推荐方式,默认只安装 admin 模块 ) ### 创建项目( 需要在英文目录下面执行 ) composer create-project zoujingli/thinkadmin### 进入项目根目录 cd thinkadmin### 数据库初始化并安装 ### 默认使用 Sqlite 数据库,若使用其他数据库请按第二步修…

FineDance pkl渲染

FineDance pkl渲染代码 如果是75,也可以渲染 给定wav路径,可以渲染mp4 import pickle import numpy as np import torch import cv2 import os # os.environ["PYOPENGL_PLATFORM"] = "osmesa" from tqdm import tqdm from smplx import SMPL, SMPLX, …

AIGC工具系列之——基于OpenAI的GPT大模型搭建自己的AIGC工具

今天我们来讲讲目前非常火的人工智能话题“AIGC”&#xff0c;以及怎么使用目前的AI技术来开发&#xff0c;构建自己的AIGC工具 什么是AIGC&#xff1f; AIGC它的英文全称为(Artificial Intelligence Generated Content)&#xff0c;中文翻译过来就是“人工智能生成内容”&…

【笔记】Nginx配置类似Tomcat请求接口链路access_log日志

项目部署在tomcat容器中&#xff0c;请求的接口会被记录在文件名&#xff1a;localhost_access_log.2024-03-22.log的文件中&#xff0c;如果使用Nginx也需要记录请求接口&#xff0c;该如何做呢&#xff1f;步骤如下 步骤1&#xff1a; 打开nginx.conf&#xff0c;在 http 块中…

HarmonyOS网格布局:List组件和Grid组件的使用

简介 在我们常用的手机应用中&#xff0c;经常会见到一些数据列表&#xff0c;如设置页面、通讯录、商品列表等。下图中两个页面都包含列表&#xff0c;“首页”页面中包含两个网格布局&#xff0c;“商城”页面中包含一个商品列表。 上图中的列表中都包含一系列相同宽度的列表…

easyexcel与vue配合下载excel

后端 设置响应 // 设置响应头 response.setContentType("application/octet-stream;charsetUTF-8"); String returnName null; try {returnName URLEncoder.encode(fileName, "UTF-8"); } catch (UnsupportedEncodingException e) {throw new RuntimeExc…