因子分析(探索性因子分析)是一种信息浓缩的分析方法,因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,探索分析项(定量数据)应该分成几个因子(变量),比如20个量表题项应该分成几个方面较为合适。最核心的就是找出对应关系。
1.将研究题项进行分类并浓缩成少数因子
2.结构效度检验
3.权重指标计算
KMO值:如果此值高于0.8,则说明非常适合进行因子分析;
如果此值介于0.7~0.8之间,则说明比较适合进行因子分析;
如果此值介于0.6~0.7,则说明可以进行因子分析;
如果此值小于0.6,说明不适合进行因子分析。
Bartlett检验:对应P值小于0.05也说明适合进行因子分析
如果仅两个分析项,则KMO无论如何均为0.5。
判断是否进行因子分析,判断标准为KMO值大于0.6
因子与题项对应关系判断。
对不合理题项进行删除,共有三种情况:
第一类:如果分析项的共同度值小于0.4,则对应分析项应该作删除处理;
第二类:某分析项对应的”因子载荷系数”的绝对值,全部均小于0.4,也需要删除此分析项;第三类:如果某分析项与因子对应关系出现严重偏差(通常也称作‘张冠李戴’),也需要对该分析项进行删除处理。
因子命名。
张冠李戴:如果某分析项与因子对应关系出现严重偏差(通常也称作‘张冠李戴’),需要对该分析项进行删除处理。
纠缠不清:比如A1可归属为A维度,同时也可归属到C维度,这种情况较为正常(称作‘纠缠不清’),需要结合实际情况处理即可,可将A1删除,也可不删除,带有一定主观性。
区分‘张冠李戴’和‘纠缠不清’这两种现象。
通常先处理掉‘张冠李戴’现象,然后自然的到后面‘纠缠不清’问题会减少,后续即使有个别‘纠缠不清’现象时,也基本可以接受。
通常需要首先设置好因子个数,而不是让软件自动识别。
因子分析进行因子浓缩时,通常会经历多个重复循环,删除不合理项,最终得到合理结果。需要来回多次进行对比,找出最佳结果。
同样的样本数据,不同的分析思路,有可能出现结果不相同,但只要符合因子的思维概念即可。
因子分析结束后,还需要用得到的几个因子,用于后续分析使用,通常可使用因子得分(问卷常使用平均分)继续后续用于回归分析,聚类分析等。
关于“保存因子得分”:因子分析将信息浓缩成几个因子,并且可让系统保存“因子得分”。因子得分可用于进一步分析,比如聚类分析,回归分析使用等。
关于“保存综合得分”:如果使用因子分析的目的在于进行综合竞争力排名,比如银行的绩效排名,上市公司竞争力排名等,此时可直接保存综合得分,用于竞争力排名。
在SPSSAU中用户可直接勾选“保存因子得分”“保存综合得分”选项即可。
以下案例来源于SPSSAU官方手册:SPSSAU-SPSS因子分析
1、背景
当前有一份数据,共涉及A1~A4,B1~B4,C1~C3,D1~D3共14个量表题,希望将此14个量表题使用因子分析浓缩成几个维度。从背景情况上看,预期此14个题目可分为4个维度,分别称作A,B,C和D维度,截图如下:
2、操作
Step1: 第一次分析
本例子中A1~A4,B1~B4,C1~C3,D1~D3共14个量表题,此14个题目共分为4个维度,因此在分析前可主动告诉SPSSAU,此14项是四个因子,否则SPSSAU会自动判断多少个因子(通常软件自动判断与实际情况有很大出入,所以建议主动设置因子个数)。左图为分析前,右图为输出结果
从上图中可以看出:
A1~A4这4项,它们全部对应着因子3时,因子载荷系数值均高于0.4,说明此4项应该同属于一个维度,即逻辑上A1~A4这4项,并没有出现‘张冠李戴’现象。但是A1和A2这两项出现‘纠缠不清’现象,A1和A2除了可以对应因子3,也可以放在因子1下面。一般出现‘纠缠不清’现象时,暂时保留,先处理清楚‘张冠李戴’问题更好。
B1~B4共4项,B2,B3,B4这3项对应着因子1下面,但是B1却对应着因子2,因此B1这项属于‘张冠李戴’,应该将B1删除。B2同时对应因子1和因子2均可,属于‘纠缠不清’,暂不处理B2。
C1~C3共3项,此3项均对应着因子2,此3项并没有出现‘纠缠不清’或者‘张冠李戴’问题。
D1~D3共3项,D3出现了‘张冠李戴’问题,应该进行删除处理。D2出现了‘纠缠不清问题’(可对应因子1和因子4),应该给予关注。
总结上述分析可知:B1和D3这两项出现‘张冠李戴’,应该首先将此两项删除;而A1,A2,B2,D2共四项有出现‘纠缠不清现象’,暂时不处理(进行关注即可)。将B1和D3这两项删除后,进行第二次分析。
Step2: 第二次分析
将B1和D3这两项删除后,进行第二次分析。结果如下:
从上图可知
·A1出现‘张冠李戴’现象,应该删除,A2出现‘纠缠不清’现象,暂不处理,但应该给予关注
·B2~B4共3项没有问题
·C1~C3共3项没有问题。
·D2出现‘纠缠不清现象’
总结可知:应该将A1先删除后再次进行第3次分析,另对A2和D2这两项给予关注。
Step3: 第三次分析
将A2先删除后再次分析结果如下:
从上图可知
lD2可同时出现在因子2和因子4下面,但考虑到D维度当前仅余下2项,因而表示可以接受,最终是将D2归纳到因子4即D维度下面。最终找出A,B,C和D共4个维度,它们分别与项之间的对应关系良好。因子分析结束。
4、SPSSAU输出结果