在进行研究的过程中,为了达成研究目的,往往会考虑多个变量对结果的影响,而这许多个的变量由于其背后所蕴藏的“共同因素”使其具有较高的相关性。通过因子分析(factor analysis)技术,我们可以将其简化,并在损失最少信息的情况下,用数量较少的因子来解释其与这些变量间的相关性。因子分析技术包括探索性因子分析(exploratory factor analysis,EFA)与验证性因子分析(confirmatory factor analysis,CFA)两种。
前面我们已经发布了探索性因子分析基本原理、操作步骤及结果解读等相关文章,本文对验证性因子分析进行介绍。
01 基本原理
不同于探索性因子分析(EFA)的“试错与探索”特征,验证性因子分析(CFA)是使用样本数据对已经根据某些理论、先验知识作出的因子结构假设进行验证的过程。进行验证性因子分析时,根据已有理论建立的因子结构可形成一个估计的协方差矩阵,而基于理论建立量表进行抽样测量的样本资料可形成一个样本协方差矩阵。
拟合优度是检验一个验证性因子分析模型是否成立的重要指标,拟合优度是根据数据得出的模型参数与理论模型的参数值的吻合程度,是检验样本协方差矩阵与估计的协方差矩阵间的相似程度的统计量,理论期望值为1。实际操作中,因子模型的拟合优度越接近于1,说明样本协方差矩阵与估计的协方差矩阵相似程度越大,因子模型拟合度越好。
02 验证性因子分析的使用条件
任何统计方法只有满足一定限度的条件,其使用才是合理的。验证性因子分析是使用数据资料检验理论假设的一种统计方法,关于它的使用条件有如下四个方面:因子模型应具有现实性。建构模型的基础是理论框架以及已有的研究知识,而不是纯粹的数据分析,若理论假设不正确,再好的方法、模型也难以发挥作用。在统计结果不理想时,也不能违背原有的理论假设任意修改模型结构。此外,在等同模型的选取中,不应以与数据的拟合程度为标准,而是选择对学科理论最有意义的模型。
样本的容量。样本的大小会影响到统计检验的效力和参数估计的准确性,在验证性因子分析中,样本容量越大,协方差的准确性越强,统计分析结果也就更可靠。一般而言,样本量低于200不适宜进行验证性因子分析。而实际上,决定样本容量的规则受到模型估计方法、模型复杂程度、观测变量的测量单位等多个问题的影响。Tanaka(1987)认为样本的最低限应由模型复杂度决定,至少应为自由估计参数个数的四倍,或者样本量与自由参数达到10:1的比例。如果要使统计能力水平达到0.8,且模型的自由参数个数较少,则要求样本量至少为200;若模型的自由参数个数较多,则要求样本数要达到1000左右。
观察变量的数量。验证性因子分析有利于对潜在变量的测量,一般潜在变量会通过多个观察变量进行测量。那么对于一个潜在变量,选择几个观察变量最为合适?大多数研究者认为,选取3-4个外显指标为最佳。当选取4个以上的观察变量时,多指标的统计优势会逐渐减少;而当少于3个观察变量时,不利于模型的识别;若因素间互有关联,最少应有2个测量指标;而如“性别”等特殊情况,则总为单指标潜在量。在选择观察变量时,最重要的是其能为因子结构赋予理论意义。
数据的测量尺度。验证性因子分析最常用的参数估计法是极大似然估计法,极大似然估计法要求测量变量为连续型变量。而在实际测量中,常使用多级量表进行测量,实际经验和模拟研究表明,当观测变量至少被分为5个等级时,采用标准的估计方法能得到较好的参数估计结果。
03 验证性因子分析的基本过程
验证性因子分析可以看作是对假设的检验,因此在进行验证性因子分析时,首先要收集相关理论、已有研究等形成明确、完善的假设,并根据假设设计问卷、进行抽样测量,最后检验、修改原假设。基本程序可分为五步:理论构建,建立模型:研究者根据特定的研究问题和收集到的相关资料提出自己的较为具体的理论模型,包括潜在变量和外显变量的数目,潜在变量间的关系,潜在变量与外显变量间的关系,因子之间的相互关系等,形成明确的假设。在Amos中绘制出基本图形,用多向箭头将变量进行联结,建立起因子模型。并将抽样测量的样本资料导入,设置好各变量的名称。
模型识别:模型能否被识别是对模型进行估计的重要前提,即模型中的所有参数都应是有解且只有一种方法求解。若模型中的某个参数无解或有无穷多个解,则模型不足识别;若模型中每一参数有解且有多种方法求解,则模型超识别;若模型中每一参数都有解,且某些参数可由多种方法求解,则模型半超识别。
在使用Amos操作的过程中,只要研究者所绘制的模型满足三点规则,则基本上都能被识别,这三点规则是:①各潜变量的指标变量中,要有一个指标变量设置为参照指标,参照指标会被限制因子负荷量的估计,其因子负荷量的估计值设定为1;②每个观察变量需有一个测量误差项,该测量误差与观察变量的回归加权系数设定为1;③每个潜在依变量需有一个结构误差项,该结果误差与潜在依变量的回归加权系数设定为1。一般而言,在使用Amos绘制图形时,上述三点规则会自动设定好。
模型设定:模型图绘制完成、样本资料已导入,在执行模型估计之前还需设定如何计算估计值以及输出哪些内容。Amos进行模型估计的方法有5种,分别为极大似然估计法、最小二乘法、未加权最小二乘法、尺度自由最小二乘法以及渐进分配自由法,验证性因素分析一般使用极大似然估计法来估计各类参数。
模型估计:启动验证性因子分析执行程序,若模型没有出现任何错误信息,则表示样本资料能使Amos在估计参数时获得收敛,即执行成功。可以利用矩阵进行表示。
模型检验与修订:在探索性因子分析中,模型估计出来,统计分析随之结束。但在验证性因子分析中,更重要的是对估计结果进行检验并在之后对模型进行修订。对模型的检验包括对每个参数的合理性检验、显著性检验以及整个模型的总的适切性检验等。且在进行研究时,建立和检验理论模型应采用交错效度法,即模型的修订和检验不能使用同一组数据。
04 应用
(1)用于问卷编制。验证性因子分析可以用于确定由多个观察变量构成的量表的维度数;也可以用于测量各测验项目在构想维度的测量程度,从而修订量表中的测验项目;还可以通过数据与理论模型之间的吻合度来表示一个测验构想效度的高低;再次可以估计观察变量的信度,即能由潜在变量解释的方差在观察变量总方差中的比例;最后验证性因子分析可以比传统方法更好地对测验中所编制的A、B卷进行平行检验。
(2)用于心理学和教育学研究。验证性因子分析经常被用于教育与心理研究,是心理学理论模型构建和发展的强有力的工具。在实际应用中,可先用探索性因子分析,得到可能的因子结构,再换用第二组样本数据进行验证;也可依据已有理论和经验建立因子结构维度,再对其进行验证。