在疾病或健康的流行病学研究中,经常需要分析疾病或健康状态与各种影响因素(保护因素或危险因素)的之间的定量关系,由于疾病或健康状态是分类变量,一般采取logistic回归分析。
在做此类数据分析时,对分析疾病或健康状态与单个影响因素之间的关系分析时,直接用卡方检验还是单因素logistic回归分析,两者结果一样吗?
如果用的是卡方检验,有人提出质疑吗?如果你用的是单因素logistic回归分析,还需要做卡方检验吗?
首先,在进行logistic回归分析时,要考虑几种情况:第一,如果你的研究样本量比较大时(影响因素个数的20倍以上),结合专业意义,可以直接进行包含全部影响因素的多因素logistic回归分析;其二,如果你的研究样本量有限,可以通过单因素分析将一些无意义的影响因素提前剔除,不纳入多因素logistic回归分析,这样可以提高模型的稳定性,这种方法是经常是先对每一种影响因素与疾病或健康状态进行单因素logistic回归分析,对于单因素logistic回归分析有统计学意义(为了避免把可能有意义的变量剔除,一般P值取0.1~0.2,具体取值结合专业背景进行考虑)或者专业上有意义的变量纳入多因素logistic回归模型进行分析。
事实上当研究的变量很多时以及样本很大时,还可以用主成分分析的方法提取主要变量进行分析。当你在数据分析方面越是细致时,你能够得到的图表也就越多,最后在讨论部分的解读也会越丰富,文章因此也就能够越丰满。
然后,我们看,对于某个影响因素与研究结局&#x