广义典型相关分析_重复测量数据分析及结果详解(之二)——广义估计方程

上一篇文章主要介绍了重复测量方差分析的基本思想是什么、它能做什么、怎么做、结果怎么解释,这几个问题。最后同时指出重复测量方差分析还是有一定局限,起码不够灵活。所以本文在上一篇文章基础上继续介绍医学重复测量数据中第二种常用方法:广义估计方程(Generalized Estimated Equation, GEE)。同样,本文也在原文基础上,稍作修改,有些地方加点通俗的注释,以便感兴趣的读者更好理解。

二、广义估计方程

fbe2fe381911ee725cb25a9a39ab1e41.png

(一)广义估计方程的思想

广义估计方程的计算过程很复杂,但思想却并不难理解。该方法假定在多次测量之间存在一定的相关结构(广义估计方程中叫做作业相关矩阵)。对于重复测量数据而言,最主要的问题就是存在各次测量之间的相关性,从而不能用常规的线性模型等方法。所以广义估计方程思想很简单,就是把这种相关进行校正一下,然后得到校正后的参数估计值,这样就比较可靠了。 

(二)广义估计方程中的作业相关矩阵

由于不同时间点观测之间的相关大小存在各种可能性,因此作业相关矩阵也有多种,常见的包括: 

(1)独立结构(independence structure),即不同时间点 上的测量值之间彼此独立,无相关关系。这种结构因为数据完全独立,实际上也无需考虑广义估计方程,直接采用常规的广义线性模型即可。

(2)等相关结构(exchangeable correlation structure),即 假定任意两次观测之间的相关性是相等的,不随两个时间 点之间的间隔大小而改变。不管是第1次观测与第2次观测,还是第3次观测与第5次观测,相关系数都相等。

(3)一阶相关结构(one‐dependent structure),表示某时间点的测量值只与其临近时间点的观测存在相关性,而与其他时间点的观测无关。例如,第2次观测只与第1次和第3次有相关,而与第4次无关。 

(4)自相关(autocorrelation),即相关大小与间隔次数有 关,相邻两次观测之间相关较强,间隔越远,相关性越小。例如,第 2次观测与第 1次和第 3次观测相关性较大,与第4次观测的相关性较小。 

(5)无结构相关(unstructured correlation),即假定不同 时间点观测值的相关系数各不相等,不存在前面几种相关 结构的规律。 

作业相关矩阵的选择是广义估计方程中很关键的一部分,需要一定的统计学知识来判断。不少研究认为,作业相关矩阵的选择对参数估计结果的影响不大。然而实际数据分析中,指定不同的作业相关矩阵有时确实会产生不同的 参数估计值和标准误(尽管这种情况很少见)。尽管一般差别不大,但笔者仍建议, 尽量指定最为合适的作业相关矩阵,以获得最可靠的估计结果。

如何选择合适的作业相关矩阵,建议结合以下两种方式综合考虑:

(1)根据不同时间点观测值的相关系数矩阵考虑。简单来说,先计算各次相关系数,大致观察一下相关系数情况,然后进行判断。

如果任意两次的相关系数差不多,可考虑等相关;

如果相关系 数出现随时间间隔而规律性减小的趋势,可考虑自相关;

如果无明显的规律,可考虑无结构相关。

理论上,指定无结构相关最为稳妥,可以满足任意情形的相关系数矩阵,但它需要估计的参数也最多。例如,对于 5次重复测量,如果指定等相关,只需要估计 1个参数即可(只有 1个相关系数);而无结构相关则需要估计任意两个时间点的相关系数,即 10个参数,估计参数过多容易导致统计学效能(power)的降 低。因此,实际分析中需要综合考虑,根据相关系数矩阵的 提示选择较为合理的作业相关矩阵。

(2)结合QIC指标(quasi‐likelihood under the independence model criterion)选择。QIC类似于广义线性模型的拟合优度指标 AIC,只是最大似然值换成了准似然值。

对QIC不理解也无所谓,关键知道,其值越小表示选择的作业相关矩阵越合适。与AIC指标类似,QIC 指标中也有对变量的惩罚项,即 QIC 值不一定随着模型中 变量的增多而变小,只有模型中含有意义的变量,其值才会变小,提示模型更优;如果纳入无意义的变量,其值反而会 升高,提示模型变差。实际分析时,可以分别指定不同的作业相关矩阵,然后比较各自的QIC值,选择其中较小者。 

(三)广义估计方程的用途

广义估计方程主要用于重复测量数据的分析,这里的重复测量不仅包括临床试验中较为固定、时间点较少的情形,也包括像生长发育监测、流行病学人群纵向观察等时间点较为灵活或时间点较多的情形。在临床试验的重复测量数据分析中,广义估计方程也可以用于组间比较、时间点的比较、组间趋势变化的分析。在其他纵向观测数据中,广义估计方程可根据研究目的进行灵活分析。 

(四)广义估计方程的SAS软件实现

我们仍然采用上一篇文章的数据作为例子。为了方便,我们把上一篇文章的基本数据(表1)和图示(图1)放在下面,免得大家来回翻。

e9357eaa0e63617093b97c3d0519a1eb.png803dae16ab1ba6593ab3e385337897a3.png

广义估计方程的操作需要先进行一定的探索,确定作业相关矩阵(其实往往很多统计分析都是这样,真正写在文章中的结果都是精华,但其实可能前期我们已经做了非常多的工作,但不可能把所有工作都写在文章里)。

本例中我们分别指定了各种不同的作业相关矩阵,结果均一致,因此本例可任意指定一种作业相关矩 阵,结果不受影响。简单起见,我们指定作业相关矩阵为等相关。

对例 1数据采用基于等相关作业相关矩阵的广义估计方程,首先不加入时间与组别的交互项,先分析时间与组别各自的主效应(主效应是基于所有人 (即不分组)的结果)。SAS程序如下:

data ex2; input id group time y; cards;…… ; proc gee data=ex2;class id time/param=reference ref=first; model y=time group;repeatedsubject=id/within=time type=exch corrw; /*subject 指定个体变量,重复测量数据中通常为个体的id编号;within指定重复测量的变量,通常是时间点变量;type指定作业相关矩阵;corrw指定输出作业相关矩阵*/run;

表 4 显示了组别与时间的主效应,结果提示,两组之 间 Y 值评分差异有统计学意义(P=0.002),治疗后第 3周与 治疗前差异有统计学意义(P=0.005),治疗后第 4周与治疗 前差异有统计学意义(P<0.001)。

主效应是基于所有人 (即不分组)的结果,因此,表 4 结果对应于上一篇文章重复测量方差分析表3 结果中的总体比较(尽管结果并不完全一致,这很正常)。参数估计值显示了差异情况,例如,group 的参数估计值显 示组间差异为 7.8,即试验组的均值(114.6)与对照组的均 值(106.8)相比高 7.8;time 1 vs 0 的参数估计值显示组间差 异为 1.4,提示第 1 周均值(108.9)比治疗前均值(107.5) 高 1.4。其余time 2 vs 0等的解释以此类推。

03efaaa20a2052b8b6ca5ebc602377e0.png

如果分析中不加入时间与组别的交互项,相当于假定两条线是平行的,然而实际中这一假定并不一定满足。图1可以看出两条线可能不平行(虽然上一篇文章的重复测量方差分析并不认为两条线不平行,但对于数据分析来说,我们一开始并不知道,都是通过简单图示探索先得到一定认识,然后基于这种认识再深入分析),因此考虑在分析中纳入时间与组别的交互项,以便观察两组的变化趋势是否有差异。加入交互项的SAS程序如下:

data ex2;

input id group time y;

cards;

 ……

 ;

proc gee data=ex2;

class id time/param=reference ref=first;

model y=time group time*group;

/*这里加入了交互项,以反映两条线是否平行*/

repeated subject=id/within=time type=exch corrw;

run;

表5显示了加入组别与时间交互效应的结果。一旦加入交互效应,组别与时间点反映的不再是主效应,而是单独效应(这句话非常关键,一定要牢牢记住)。因此,如果想了解组别与时间点的主效应,可以先不加入交互项。单独效应反映的不是所有人的估计结果,而是某一亚组(如对照组的观测、第1周的观测等)的估计结果。

0260a9b46a6fdac5b3dad88d19f62aad.png

下面这段结果的解释非常重要,建议一定仔细看。对于想了解交互效应如何解释的朋友,尤为重要。这一段不仅是对广义估计方程的解释,也是对常见其它模型中存在分类变量交互项的解释。

单独效应的结果与变量赋值有很大关系,本例中试验组赋值为1,对照组赋值为0,时间点分别赋值为0~4。因此,表5中group反映的不是所有人两组的差值,而是治疗前这一时间点的两组差值(4.2);同样,time 1 vs 0反映的也不是所有人在第1周与治疗前的差值,而是对照组第1周与治疗前的差值(1.4)。
    交互项的结果对应于重复测量方差分析表3结果中的分组比较。例如,group*time(1 vs 0)的参数估计值为0,它反映了第1周两组差值(4.2)与治疗前两组差值(4.2)的差值,也可以说,反映了试验组第1周-治疗前的值(1.4)与对照组第1周-治疗前的值(1.4)的差值(仔细体会一下这两种说法),两种说法均可,取决于研究目的侧重说明什么。其他交互项的解释含义以此类推。

(五)广义估计方程分析的注意事项

(1)尽管广义估计方程需要考虑作业相关矩阵的设置,但绝大多数情况下,结果是一致的。建议实际分析中,首先可指定不同的作业相关矩阵,观察分析结果是否一致,如果一致,可以任选其一,否则可根据相关矩阵和QIC综合考虑,选择最合适的作业相关矩阵。

(2)广义估计方程的结果比重复测量方差分析更接近模型的形式,因此不少非统计学专业人员可能对结果的解读存在一定困难,尤其是加入交互项的结果解读,需要仔细体会,否则很容易出现结果的解释错误。        

(3)广义估计方程比重复测量方差分析在分析思路上更为灵活,但这同时需要对统计学知识和软件操作的更高要求,因为广义估计方程的结果与自变量赋值有很大关系。例如对时间点赋值0~4,与赋值为1~5,二者给的结果会有不同。这一点其实在所有的模型类都是如此,分类资料的赋值很重要。

(4)广义估计方程对缺失值比重复测量方差分析更为耐受。它是基于完全随机缺失的假设(关于随机缺失等概念参见以前文章,下一篇文章也会再次介绍),因此完全随机缺失模式对广义估计方程的结果影响不大,此时其参数估计值仍是稳定的,但如果是随机缺失,仍会影响广义估计方程的结果,这种情况下,可 考 虑 加 权 的 广 义 估 计 方 程(Weighted Generalized Estimating Equations),该法是基于随机缺失的假定,但仅限于失访模式(即一个人在某个时间点缺失后,后面的时间点均无数据)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/434976.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器学习复制粘贴笔记要点

逻辑回归对特征的规模很敏感。重新调整数据使每个特征的均值为 0 和方差为 1 通常被认为是好的做法 zip() 函数用于将可迭代的对象作为参数&#xff0c;将对象中对应的元素打包成一个个元组&#xff0c;然后返回由这些元组组成的列表。 如果各个迭代器的元素个数不一致&#x…

YUV422格式信号格式(以备学习之用)

YUV信号有很多种&#xff0c;一般YUV420和YUV422用的比较多&#xff0c; YUV422格式&#xff0c;又分为很多小类&#xff0c;按照U、V的排列可以有YUYV,YVYU,UYVY,VYUY四种&#xff0c;其中&#xff0c;YUYVY一般又称作yuv2格式。 而这四种YUV422格式&#xff0c;每种又可以分为…

excel怎么添加diy工具箱_这些Excel插件让你的Excel更好用!

Excel基本功不扎实临时学习也没时间这时候比起各种操作技巧Excel插件更实际更能切实提高你的效率今天就给大家推荐几款插件&#xff01;方方格子说起Excel插件&#xff0c;就不能不提到它。方方格子支持Excel2007到2016各版本&#xff0c;而且对于WPS版本&#xff0c;也有专门的…

Arcgis自下而上从左到右进行编号

添加字段xmin和ymax !shape.extent.Xmin! !shape.extent.Ymax! 计算结果 对处理好的矢量按这个两个字段进行排序 排序结果后的objectid即可做为斜坡单元编号&#xff08;如果项目中对编号有其他要求&#xff0c;请继续往下查看&#xff0c;如果没有的话&#xff0c;就不用往下…

Linux之V4L2基础编程

1. 定义 V4L2(Video For Linux Two) 是内核提供给应用程序访问音、视频驱动的统一接口。 2. 工作流程&#xff1a; 打开设备&#xff0d;> 检查和设置设备属性&#xff0d;> 设置帧格式&#xff0d;> 设置一种输入输出方法&#xff08;缓冲 区管理&#xff09;&…

ArcGIS如何在一个矢量上用不同颜色进行标注

在图层属性--标注里 选择“定义要素类并且为每个类加不同的标注” 点击添加 在类里面就会选择红色&#xff0c;此处作者添加了红色和黑色两个类 注意选择类是&#xff0c;查看是否标注次类 点击SQL查询&#xff0c;不同类进行不同的SQL查询

基于web的工作流设计器(多比图形控件)

多比图形控件是一款基于Web的矢量图形控件&#xff0c; 类似于网页上的Visio控件&#xff0c;是目前国内外最佳的基于web的工作流设计器、工作流流程监视器解决方案。 可广泛应用于包括&#xff1a;电力、军工、煤炭、化工、科研、能源等各种监控软件、基于web的工作流设计器&a…

earthdata数据的.nc4如何使用

原始数据 打开ArcGIS软件 参数如下,只需改变变量参数,选择自己所需变量,其他默认参数,点击确定 更具个人电脑性能,本人电脑反应比较慢

EXT.NET复杂布局(二)——报表

前面提到过工作台&#xff08;《EXT.NET复杂布局&#xff08;一&#xff09;——工作台》&#xff09;了&#xff0c;不知道各位看过之后有什么感想。这次就介绍介绍使用EXT.NET画几个报表。 看图写作从小学就开始了&#xff0c;如图&#xff1a; 图一 图二 图三&#xff08;1&…

arcgis导出access数据库能打开的文件

arcgis有两种数据库 1.个人地理数据库(.mdb)(Access数据库可以打开查看属性) 2.文件地理数据库(.gdb) 其中个人地理数据库 (.mdb)可以用Access数据库打开 在文件中显示如下 打开文件如下 文件地理数据库如下 个人地理数据库&#xff08;地质灾害建立数据库就要用这个数据库…

如何使用网上下载的arcgis工具箱,报错汇总

执行网格表达式错误 解决方法 更改环境变量里的并行处理设置成0即可

基于 Android NDK 的学习之旅-----环境搭建

工欲善其事 必先利其器 , 下面介绍下 Eclipse SDK NDK Cygwin CDT 集成开发环境的搭建。 1、Android 开发环境搭建 Android开发环境搭建不是重点,相信看此文章的很多人都已经搭建成功,这里随便概述性的说说。 1) 下载 JDK 2) 下载 Eclipse 3) 下载 Android…

arcgis将小于0的数值设置成0.01

原始范围 打开栅格计算器 主要利用的是栅格计算器的con条件函数 con用法 con(条件,满足条件的部分赋值赋值,不满足条件的部分赋值) 运行完的范围 0.0008<0.01所以显示0.0008

vivo怎么调时间_卡西欧手表怎么调时间 怎么评估卡西欧手表的价格档次

在以前的手表是戴在手上方便看时间的&#xff0c;但是随着科技的发展&#xff0c;手表也越来越智能&#xff0c;很多的手表都是多功能的&#xff0c;但是我们的知道&#xff0c;一样东西越好用就会显得它的复杂性越高&#xff0c;慢慢着就会使很多人都不会使用&#xff0c;就拿…

离职证明电子版_离职证明中说劳动者因违纪离职的怎么办?

作者&#xff1a;吕武茂 衣尚民 范涛1.律师有话说&#xff1a;根据法律规定&#xff0c;解除或终止劳动合同后&#xff0c;给员工开离职证明是企业的法定义务&#xff0c;离职证明内容仅包括&#xff1a;劳动合同期限、解除或者终止劳动合同的日期、工作岗位、在本单位的工作年…

python特征递归消除

一、基础知识了解 特征递归消除官方给了两者方法 1.RFE 2.RFECV 一.RFE 官方解释 链接&#xff1a;sklearn.feature_selection.RFE — scikit-learn 1.0.2 documentationhttps://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.RFE.html?highligh…

SIP 中的Dialog,call,session 和 transaction .

如果你对Sip协议中Call, Dialog, Transaction和Message之间的关系感觉到迷惑,那么,那么我可以告诉你,你并不孤单,因为大多数初学者对于这些名词之间的关系都会感到疑惑.Messages(消息) 消息是在服务器和客户端之间交换的独立文本, 有两种类型的消息,分别是请求(Requests)和响应…

JS 获取当前日期时间(兼容IE FF)

以前在页面中获得当前时间的方法如下&#xff1a; function SelectTodayClient() {var d new Date();var taday d.getYear() "-" (d.getMonth() 1) "-" d.getDate(); alert($(taday);} IE运行正常&#xff0c;FF运行如下&#xff1a; 这…

再次携号转网_潍坊一小伙欲携号转网屡被拒 联通客服:试运营状态不支持携转...

携号转网&#xff0c;也就是在手机号码保持不变的情况下&#xff0c;可以更换运营商&#xff0c;潍坊市民夏先生给记者打来电话说&#xff0c;他有一张联通的电话卡&#xff0c;想要办理携号转网业务&#xff0c;十几天过去了&#xff0c;号没转出去&#xff0c;还生了一肚子气…