Cox回归是生存分析中运用最多的一个模型,又称为比例风险回归模型(proportional hazards model)。是由英国统计学家D.R.Cox在1962年提出的,为了表示对他的尊敬,所以大家以他的名字命名这个模型。这是一种半参数回归模型,以结局和生存时间为因变量,还可以同时分析多个因素对生存期的影响,碰到数据缺失的情况也不怕!照样可以分析。另外,该回归方法对于数据分布也没啥要求。这些优点使Cox回归的应用非常广泛,在临床医学、经济学等各个领域都有运用。
接下来我们来看一看SPSS进行Cox回归的详细步骤。
首先收集生存分析的数据,生存分析的示例数据如下图。
需要注意的是,数据里必须包含结局、生存时间这两列数据。在该示例数据里,结局表示的是肺癌患者的随访结果(1:死亡,0:生存)。生存时间的单位为“天”。X1-X5为自变量。SPSS分析步骤如下:第一步,点击“分析”——“生存分析”——“Cox回归”;
第二步,变量设置,方法默认为“输入”,也可以选前向、后向输入,与逐步回归类似;
第三步,定义事件,一般设置结局为1,也可以定义范围;
第四步,点击“分类”,进行分类变量定义,如果自变量有分类变量的话,可以在这一步进行设置。
第五步,绘图设置,可以勾选生存分析函数曲线,也可以绘制风险函数曲线。注意!只有分类变量才能设置“针对各项绘制单独的线条”,连续型数值是无法选这一项的,否则会有报错提醒哦!
第六步,点击“保存”,按分析需求进行保存设置。
点击确定,就能得到SPSS的分析结果了。Cox回归的结果如下:首先,是omnibus综合检验结果,这个检验是看变量的纳入模型与不纳入模型是否有显著的区别。P<0.05 说明有显著区别,也是从侧面反映了各变量的重要程度;卡方结果说明一个变量的加入,影响了多少似然比统计量的变化。
Cox回归结果显示,每个自变量的影响都不显著。当然,这只是一个示例数据,实际分析中,如果每个自变量的都不显著,问题可就大了!得回头重新整理数据、清洗数据。如果分析方法没问题,结果不理想,大概率的原因就在数据本身。
协变量平均值结果如下。默认情况下,一般是用协变量的平均值去估计生存比例。
生存分析函数的可视化结果如下。
随着生存时间的不断延长,累积生存率呈现逐步下降的趋势。横坐标上的每个点,代表经过某个特定时间点的时候的生存概率。