目录
一、安全评价简介
二、引入
三、调查问卷的设置
四、问卷发放与回收
五、主成分分析法介绍
六、SPSS主成分分析(简易版)
6.1 数据的导入与设定
6.2 信效度分析
6.3 SPSS主成分分析处理
一、安全评价简介
何为安全评价,对于本专业的同学来说,可能并不陌生,就是对某一个生产、工艺流程的危险性进行一个量化的评判。可能对于现在的大部分企业来说,都是以分数的高低来判断是否安全、是否危险,在多年发展下,逐渐形成了安全检查表、专家评议法、预危险性分析、故障假设分析、危险与可操作性分析、故障树分析、事故树分析等多种分析手段,在这些不同的评价手段下,用不同的标准去衡量安全性和危险性。(安全管理网上有对上述几种常见的安全评价方法进行阐述几种常见的安全评价方法-安全管理网 (safehoo.com))
二、引入
而目前,众多公司虽每年都有具体的对应的安全评价结果,但高层领导对安全不重视、中层干部对安全监管不到位、底层员工对安全措施实施不规范,造成了众多安全事故的发生。据不完全统计,我国仅在2021年1月至8月期间,就发生了232起大大小小的安全事故,每一场事故的背后都有不安全行为的发生,其背后的原因错综复杂,包括的行业也是多种多样。本文仅对某一高端装备制造企业中的不同层级的人员进行调查,去深挖对企业安全与否的个人认知,从而分析出影响企业安全的最大因素。
三、调查问卷的设置
如下图所示,我们本次问卷共设置3个一级指标11个二级指标45个三级指标,均以0-5数字来评价高低,用以定量评估对于企业安全的认识情况。该问卷脱胎于本专业某课设,由于对于专业认知有限,可能评估标准并不尽如人意,也欢迎大家多多批评指正。
四、问卷发放与回收
五、主成分分析法介绍
主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法,主要操作步骤如下
(1)指标数据标准化;(SPSS自动执行,本文中无需标准化)
(2)指标之间相关性的判定;
(3)确定主成分个数;
(4)主成分表达;
主成分分析的好处多多,当我们有多个变量时,通过主成分分析可以得到降维处理后的若干个主成分,以这几个主成分作为新变量进行构建回归模型,亦会减少计算量。当然例如皮尔逊相关系数、灰色关联矩阵,也可以从一定程度上挑选出与某个变量相关性较强的变量,以减少计算量。
六、SPSS主成分分析(简易版)
考虑到本专业对于代码能力的局限性,且难以处理大批量数据(本次数据量级为万级),因此我首先介绍SPSS主成分分析法。
6.1 数据的导入与设定
我们在问卷做完以后,收回了800份问卷,以excel形式导出,然后要做的第一件事,就是把数据导进excel里面,可以直接读取excel,但不建议,因为顶上一行的文字可能会影响下面的数据格式,所以全选excel中的数据,复制进SPSS中,稍等一会,数据量有点大,需要缓冲时间。
然后这个时候发现,对于这些个数据顶上的命名都是系统自动命名的,那么我们就需要将其全部转化为我们对应的指标文本,但是需要注意在变量视图中,把所有的都改成数字类型哦,最后就如下啦~
看上去是不是密密麻麻的一大片文字,没关系~SPSS傻瓜式操作,丝毫不用担心处理的问题,按两下它就能给你完美解决!
6.2 信效度分析
在主成分分析之前,还有一个非常非常重要的事情需要做,就是做一下信效度分析,为啥要做这玩意?你最后得出了一个不合理的结果,倒推发现,完犊子了,一开始搞的问卷指标就不对,一点可信度和效度都没有,直接嗝屁,当然啦,也要防止一些乱填的情况,由于本问卷设置为全部必做且仅用0-5来衡量,相对来说减少了工作量。
那到底什么是信效度分析呢?信度反映的是测量结果的一致性或稳定性的指标:测量的信度越高表示测量的结果越可信。当然,信度是任何一种测量的必要条件,但不是唯一条件,因为信度与测量结果的正确与否无关。因此,只有测量值接近或等于真值时,信度高才有意义。信度有两层含义:(1)一致性:如某一组(性质、题型、目的均相同)量表的一致性高,那么用该组量表对某同质人群进行测验后,所得结果具有较强的正相关性。即一致性侧重反映不同量表反映同一现象的相似程度。(2)稳定性,指在不同的时间点用相同的量表对相同的研究对象进行测验,所得结果的相似程度。若所得结果的差异很小,则说明其稳定性高。诚然,由于影响测量结果的因素众多,两次测量的结果很难完全相同。一般而言,如果信度系数能达到0.9以上,就很理想了。按照评价对象的不同,分为内在信度和外在信度,本文主要利用内在信度,常用信度系数为Cranbach α系数和分半信度,信度系数越高反应量表的内在一致性越高。
通过“分析——刻度——可靠性分析”命令,弹出可靠性分析对话框,将45个因素导入至“项”,打开“统计”面板,勾选“项目”、“相关性”等并点击继续,模型先后选择“Alpha”和“折半”进行确定输出。
表1 克隆巴赫Alpha检验
克隆巴赫Alpha | 基于标准化项的克隆巴赫Alpha | 项数 |
0.982 | 0.987 | 45 |
表2 折半信度系数检验
克隆巴赫Alpha | 第一部分 | 值 | 0.959 |
项数 | 23a | ||
第二部分 | 值 | 0.972 | |
项数 | 22b | ||
总项数 | 45 | ||
形态之间的相关性 | 0.931 | ||
斯皮尔曼——布朗系数 | 等长 | 0.964 | |
不等长 | 0.964 | ||
格特曼折半系数 | 0.964 |
通过可靠性分析所的表,其中Alpha的值为0.982, 格特曼折半系数为0.964,均大于0.9,则认为该调查问卷的可信度较高。
6.3 SPSS主成分分析处理
为什么我在上面提到了信效度分析,又只说了信度分析,而没谈效度分析,那是因为效度分析在SPSS中内嵌在因子分析中了,因此通过SPSS 26.0的“分析——降维——因子”命令,弹出因子分析对话框,将45个指标因素导入至“变量”框中,点击“描述”勾选初始解和KMO和巴特利特球形度检验,点击“提取”选择相关性矩阵,勾选未旋转因子解和碎石图,点击“旋转”勾选显示旋转后的解且采用最大方差法,点击“得分”勾选显示因子得分系数矩阵,最终点击确定等待结果生成。
先出来的是KMO和巴特利特球形度检验表:
KMO和巴特利特球形度检验表
KMO取样适切性量数 | 0.978 | |
巴特利特球形度检验 | 近似卡方 | 45596.403 |
自由度 | 0.990 | |
Sig. | 0.000 |
而根据KMO的取值范围如下表6.5可知KMO值为0.978>0.9,这个数值体现了问卷所设计的各项问题是彼此联系的且效度较优,所以说明问卷比较适宜用于主成分分析。
KMO值与适用主成分分析程度表
适合于主成分分析的程度 | KMO取值范围 |
非常适合 | 0.9<KMO |
适合 | 0.8<KMO<0.9 |
一般 | 0.7<KMO<0.8 |
不太适合 | 0.6<KMO<0.7 |
不适合 | KMO<0.6 |
然后就是最最最重要的内容啦~主成分分析的方差解释表,这表里面为什么只有初始特征值大于1的被算作主成分了呢?原因是一开始在设定里面就规定了1,而一般也是如此,所以得到如下表:
初始特征值 | 提取载荷平方和 | 旋转载荷平方和 | |||||||
成分 | 总计 | 方差百分比% | 累计% | 总计 | 方差百分比% | 累计% | 总计 | 方差百分比% | 累计% |
1 | 29.323 | 65.162 | 65.162 | 29.323 | 65.162 | 65.162 | 17.950 | 39.888 | 39.888 |
2 | 1.761 | 3.914 | 69.076 | 1.761 | 3.914 | 69.076 | 11.187 | 24.860 | 64.749 |
3 | 1.381 | 3.068 | 72.144 | 1.381 | 3.068 | 72.144 | 2.408 | 5.350 | 70.099 |
4 | 1.045 | 2.323 | 74.467 | 1.045 | 2.323 | 74.467 | 1.966 | 4.368 | 74.467 |
5 | 0.862 | 1.915 | 76.382 | ||||||
6 | 0.739 | 1.641 | 78.023 |
哦莫,我们得到了四个主成分,那让我们再来看看勾选的碎石图:
图里面可以看出,主成分1占比最高,而后骤降,后面三个主成分特征值变化较小,接下来进一步需要分析的就是这原先的45个指标中有多少个归属于对应的主成分1-4,成分矩阵如下,由于比较多,我就不一一例举了。
1 | 2 | 3 | 4 | |
5、对正确使用并佩戴作业用具的掌握程度如何? | 0.789 | 0.246 | ||
6、对行业法律法规的了解程度如何? | 0.748 | 0.355 | 0.152 | |
7、及时将使用的法规传递给他人的频率如何? | 0.742 | 0.396 | 0.151 | |
8、对安全培训教育知识的掌握程度如何? | 0.828 | 0.309 | ||
9、对警戒线地区的不踏入的保证情况? | 0.785 | 0.225 | 0.196 | |
10、按时参加企业安全培训教育的次数情况? | 0.668 | 0.197 | -0.125 | |
11、对个人安全考核成绩的在意程度如何? | 0.824 | 0.166 | -0.137 | |
12、对安全法律法规的温习次数多吗? | 0.82 | 0.238 | ||
13、习惯性违规操作的次数多吗? | 0.242 | 0.815 | ||
14、对安全生产事故的应急措施熟悉吗? | 0.805 | 0.144 | 0.17 |
由总方差解释表要得到主成分特征根,这个需要简单的计算下:
主成分1=0.789*5、对正确使用并佩戴作业用具的掌握程度如何?+0.748*对行业法律法规的了解程度如何?+...
四个主成分都如此处理,然后得到的是四个数字,29.323,1.761,1.381,1.045,这四个数字就意味着主成分特征根的大小,与前面相互验证了,OK至关重要的一步来了,你咋知道人这指标因素重不重要呢,所以我们要计算每一个指标对各个主成分的贡献率:用成分矩阵中的数/SQRT(对应的四个特征根),霍霍,所以我在这也列一点:
5、对正确使用并佩戴作业用具的掌握程度如何? | 0.1457 | 0.0000 | 0.2093 | 0.0000 |
6、对行业法律法规的了解程度如何? | 0.1381 | 0.0000 | 0.3021 | 0.1455 |
7、及时将使用的法规传递给他人的频率如何? | 0.1370 | 0.0000 | 0.3370 | 0.1445 |
8、对安全培训教育知识的掌握程度如何? | 0.1529 | 0.0000 | 0.2629 | 0.0000 |
9、对警戒线地区的不踏入的保证情况? | 0.1450 | 0.0000 | 0.1915 | 0.1876 |
10、按时参加企业安全培训教育的次数情况? | 0.1234 | 0.0000 | 0.1676 | -0.1196 |
11、对个人安全考核成绩的在意程度如何? | 0.1522 | 0.0000 | 0.1413 | -0.1311 |
12、对安全法律法规的温习次数多吗? | 0.1514 | 0.0000 | 0.2025 | 0.0000 |
13、习惯性违规操作的次数多吗? | 0.0447 | 0.6142 | 0.0000 | 0.0000 |
14、对安全生产事故的应急措施熟悉吗? | 0.1487 | 0.0000 | 0.1225 | 0.1627 |
然后每一列求个和,能得到总贡献率为6.5837,1.8530,0.4621,0.4498,其实这个以后已经可以回归得到一个式子了,但这不是我们的本意呀,我们的本意,要回到上面的上面的上面,去找到影响企业安全的最大影响因子,所以通过指标权重归一化,能得到每一个指标影响因子的大小。
三级指标 | 二级指标 | 一级指标 | |
5、对正确使用并佩戴作业用具的掌握程度如何? | 0.0224 | 0.1176 | 0.3943 |
6、对行业法律法规的了解程度如何? | 0.0236 | ||
7、及时将使用的法规传递给他人的频率如何? | 0.0238 | ||
8、对安全培训教育知识的掌握程度如何? | 0.0239 | ||
9、对警戒线地区的不踏入的保证情况? | 0.0239 | ||
10、按时参加企业安全培训教育的次数情况? | 0.0177 | 0.0925 | |
11、对个人安全考核成绩的在意程度如何? | 0.0214 | ||
12、对安全法律法规的温习次数多吗? | 0.0231 | ||
13、习惯性违规操作的次数多吗? | 0.0303 | ||
14、对安全生产事故的应急措施熟悉吗? | 0.0235 | 0.0706 | |
15、对生产设备的正确使用情况如何? | 0.0226 | ||
16、对专业技能证书的取得数量多少? | 0.0245 | ||
17、工友报告安全隐患的及时程度如何? | 0.0242 | 0.1136 | |
18、工友提出安全建议的及时性如何? | 0.0225 | ||
19、工友间对安全生产问题的讨论频率高吗? | 0.0201 | ||
20、工作前对设备检验的次数多吗? | 0.0222 | ||
21、工友对安全规程的遵守程度? | 0.0246 |
由此全表可见,一级指标中员工层面对企业安全氛围影响最大,二级指标中员工的安全意识和工友的行为对企业安全氛围影响最大,三级指标中习惯性违规操作次数的多少以及车间仪器设备的老化程度对问卷结果影响最大,其余指标如:对安全培训教育知识的掌握程度、对安全生产事故的应急措施熟悉等稍次于前两个三级指标,但也相对重要,也能较大程度上影响企业安全氛围的营造。
自此,分析全部结束,也可以给出对应的一些措施,那么你要问我这样做的意义在哪里,我觉得,从个人角度出发,数据的全面性、可靠性、可分析性远比主观的评价来的客观真实有效。