论文问卷数据的分析,看起来简单,好像每个人都会做。但是做起来还真的有点难度。很多初次使用问卷调查方法的人大多以为,问卷数据分析嘛,无外乎对单选题做做频率分析,看看选择不同的选项的人占比有多少。对于评分题目,看看均值是多少,不同性别,年龄段的人群均值是多少。对于一般的小调查,这样粗略的分析可能够了,但是对于学术论文中的问卷分析而言,以上所做的工作,只是其最简单的一部分,后面还有大量的工作要做。
更让新手们比较着急的是,统计软件即使实现了数据分析过程的自动化,但是其输出的结果也并不能直接使用,还需要经过自己的整理才能放到论文当中去。
问卷处理
回收问卷后的具体操作步骤
当我们把收集到海量数据之后,最重要的是回过头分析自己的研究目的,只有明晰自己研究的初衷,得出的结论才能为自己的研究所用。问卷中设置的各项问题也是围绕我们的研究目的展开的。
理清自己的研究目的之后,就可以对回收的问卷数据进行分析了。依据调查结果,对问卷中每一个问题的回答情况进行编码统计。调查问卷得到的数据我们可以有两种分析方法,即定性分析和定量分析。
定性分析依靠研究者以自己的专业知识并采取不同的分析视角,对所得的数据进行编码分析。但这种方法存在较大的主观性,会受到研究者专业知识水平和主观意识的影响。所以,在通常的研究中采用定量研究的方法更多,本文给大家介绍的也是定量分析数据的方法。
在使用定量研究时,一般采用专业的数据分析软件将问卷调查中得到的数据进行分析,在教育研究领域用得比较多的数据分析软件工具如Excel和SPSS。在使用统计软件时,我们首先要做的是将得到的数据录入软件,再根据自己的研究目的调用适当的分析方法,最后保存分析结果即可。
本文主要就回收数据之后我们应该从哪几个方面分析数据进行介绍。
识别无效问卷
问卷回收后,首先就需要剔除无效问卷,判断其可信性。在剔除无效问卷的同时,还需要保持一个较高的问卷回收率。一般来说,回收率如果仅有30%左右,资料只能作参考;50%以上,可以采纳建议;当回收率达到70~75%以上时,方可作为研究结论的依据。因此,问卷的回收率一般不应少于70%。
空白较多的问卷、未完成的问卷很容易被识别和剔除,但有些表面上完整的问卷也可能存在种种问题,需要进一步辨别。常见的无效问卷还包括:
(1)选择单一选项。比如全部都选B,或者—半选A一半选B。
(2)随意填答(回答者随机选择答案)。这种情况在没有测谎题的问卷中较难发现,但有时通过对完全相同的题目或相近题目进行对比仍可判断出来。
(3)多人同种答案。这种情况在当场回收的问卷中较少,多出现在在同一单位集体发放问卷、经一段时间后回收的情况下,有些被调查可能相互抄袭应付,或者一个人填答几份问卷。这样的问卷显然不能反映真实情况,都应作为废卷处理。
信度检验
信度检验是对调查问卷的可信度进行检验的方法,常见的信度检验方法有重测信度检验、折半信度检验、复本信度检验等。在李克特态度量表法中常用的信度检验方法为 Cronbachα系数,α信度系数主要反映量表的内部一致性信度,α系数越高,代表量表的内部一致性越高。下表是α信度系数的判断标准。
效度检验
效度检验是指对调查问卷的有效程度进行的检验,常见的检验方法有内容效度检验、准则效度检验、结构效度检验等。效度检验一般可以请领域专家进行分析判断,也可以使用统计软件进行分析。
刘文超在他的博士学位论文中基于结构方程模型的AMOS软件进行验证性因子分析(CFA),如下表:
从上图表中得到的信息较多,现仅就聚合效度分析数据展开分析。平均方差提取量(AVE)是用来进行聚合效度分析的有效工具,可以显示被潜在构念所解释的方差有多少是来自测量误差,平均方差提取量越大,指标变量被潜在变量构念解释的方差百分比越大,相对的测量误差就越小,一般的判断标准为大于 0.5。显然,从上表中我们得知,十个因子中有八个因子的 AVE值大于 0.5,但是也有评估和角色两个因子的 AVE 值小于 0.5,但是非常接近 0.5。这说明该研究的相关数据具有较好的聚合效度,基本符合要求。
相关分析
相关分析是对研究变量间统计关系强弱程度进行测量的一种方法,通常使用Pearson系数来表示,也有通过绘制散点图的方式来反应变量之间的相关性。
回归分析
回归分析的目的是从数量上对具有相互联系和一定因果关系的现象进行描述,通过分析这些变量间的关系,以一个数学模型的形式近似的反应出这些变量间的变化关系。根据研究中自变量和因变量的关系,可以分为线性回归和非线性回归;根据自变量的数量则可以分为一元回归分析和多元回归分析。
回归分析中主要通过t检验来验证变量间的线性关系是否显著,即在特定的显著性水平下,检验回归系数是否为0,若 t 值高于一个特定的对应值,则回归系数不为0,回归有效。对于拟合优度则主要依据判定系数R2以及F检验。R2数值越高越好,因为它反映的是模型中能够被解释的内容所占的比例。F值反映的是对整个回归方程的显著性,同样R2一样,F值也越高越好,理论上要求F检验的值至少要高出一个给定的水平,才能保证回归方程的显著性。
以企业参与动机的提高生产效率、改进服务质量和提高顾客满意度三个因子为自变量,以共同创造服务体验整体为因变量进行回归分析,如下表:
表2 企业参与动机与共同创造服务体验回归分析模型汇总
表3 企业参与动机与共同创造服务体验回归分析中的方差分析
表4 企业参与动机与共同创造服务体验回归分析系数
从表 2 能看出,回归模型中R2值为 0.087,调整后的R2值为0.073,说明自变量共计解释了总体方差的7.3%。从表3能看出,回归分析中的 F值为6.174,在0.01 水平上显著。从表 4能看出,三个自变量中,有两个变量的回归系数不显著,只有第三个自变量的回归系数在0.05水平上显著。数据表明,假设 H1a 和假设 H1b 没有得到支持,假设 H1c 得到支持。从而说明,提高顾客满意度与参与共同创造服务体验存在正向相关关系。
结构方程模型分析
它融合了传统多变量统计分析中的“因素分析”和“线性模型的回归分析”的统计技术,对于各种因果模型可以进行模型辨识、估计与验证。