用SPSS做探索性因子分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

DRAFT ONLY
附:在SPSS 中做探索性因子分析
1
10.12
操作步骤
2
3 第一步:载入数据并启动因子分析。

4
5
6
7 第二步:选择因子所对应的测度项。

在这个研究中,我们选择对应于七个变量(包括8 自变量、因变量、与控制变量) 的测度项。

9
10
告读者丗本书的正式版丆《社会调查设计与数据分析:从立题到发表》丆 终于作为国内最好的研究方法丛书-重庆大学万卷方法丛书的一员出版了乮六2011年6月乯。

有兴趣购买的读者现在可以从卓越购买。

相比于意见稿丆正式版丗
- 增加了第13章丆构成性测度与PLS•C - 增加了第14章丆潜变量的调节作用 - 大量充实第15章丆论文写作与发表
- 第12章中数据分析的结果做了大量更新丆原内容介绍的方法与数据分析的结论虽然正确丆数据计算结果有错误。

其它各章也做了相当多的修改丆不再赘述。

正式版比意见版的内容增加了大概三分之一。

这些新增的内容对于科研人员和方法论老师来讲是十分重要。

本附录是书稿的一部分。

DRAFT ONLY
1
2
第三步:设定因子求解办法为主成分分析法。

使用相关系数矩阵,并设定主要因子的
3
4
特征根大于1。

5
6
7
8
第四步:设计因子旋转方法为“Varimax”。

然后在“Factor Analysis”窗口中按“ok”
开始计算。

9
10
DRAFT ONLY
1
2
10.13
主成分分析的结果
3
4 对应于27个测度项,主成分分析法一共产生了27个因子。

这是可以产生的因子个数
5 的上限。

“Total ”列报告了每一个因子所对应的特征值。

“% of Variance ”表示这个特征
6 值在所有特征值和中的比例。

“Extraction Sums of Squared Loadings ”这一列反映了特征根
7 大于1的因子。

在这个例子中,我们顺利地得到了7个因子。

相应地,在用碎石坡法对因
8 子进行目测时,我们得到的结果是一致的。

请读者参看本章中的相应图例。

值得一提的
9 是,第八个因子的特征根为0.967,十分接近1。

如果这个研究的理论因子个数是8个,研10 究者也可能考虑手工设定所要抽取的因子个数 (见第三步界面)。

11
SPSS也报告了每一个主成分对于一个测度项的载荷。

从这个表可以看出,第一个因子解1
2
释了topicality scope, 与relevance 中的大部分信息,因为在这些测度项上这个因子的载荷很高。

3
第二个因子则对应于background knowledge。

第三个因子对应于understandability,第四个因子
对应于reliability,第五个因子对应于topicality中的一部分,第六个因子对scope作了一些反向4
5
的调查,第七个因子似乎对noveltyf进行解释,但它的作用不是很明确。

这就是主成分分析产6
生的结果的特点:它告诉我们能够得到的主要因子的个数,每一个因子所对应的信息却无法直7
观解释。

这是因为因子之间有信息重合。

8
9
Component Matrix (a)
10
11
12
a 7 components extracted.
13
14
15
在这种情况下,我们通常对这样得到的因子进行旋转。

下表报告了用Varimax旋转后的因16
子载荷矩阵。

17
18
19
20
21
22
23
DRAFT ONLY
1
Rotated Component Matrix (a)
2
3
4 Rotation Method: Varimax with Kaiser Normalization.
5 a Rotation converged in
6 iterations.
6
7 这个载荷矩阵明确地表示了测度项是如何与一些因子对应起来的。

检查其中的每一项,我8 们会发现scope4, relevance2违反了区别效度。

这就提醒我们重新审视这些测度项的措词。

对于9 Scope4,测度项的措词是:The scope of this document is inappropriate for me (1-strongly disagree, 10 7-strongly agree)。

而其它几个测度项的措词都是指范围过大或者过小。

调查对象可能把11 inappropriate scope 理解成这个文档不对应于他的信息需求,而不是它的内容的量上的不足或过12 多,结果是,这个测度项在相当程度上负载了Topicality 的信息 (0.426)。

relevance2的措词是:13 My opinion/view towards the current topic has been significantly changed or strengthened by this 14 document (1-strongly disagree, 7-strongly agree)。

仔细观察其它的测度项,其它的测度项都表示15 “我”会不会因着这个文档采取行动,只有这个测度项测量认知上的变化。

虽然认知上的变量16 符合这个因子的定义,却是很不容易让人在这种实验环境下有明确的理解。

数据结果告诉我17 们,调查对象可能一开始对这个话题都没有什么看法;读了一个文档以后,他们有了一些认18 识,这对他们来讲也是全新的认识,所以这个测度项反而负载了Novelty 中的信息 (0.521)。

通19 过这样的“后见之明”,我们体会到在问卷设计之时没有预见到的很多陷阱。

NOVEL4 (The 20 content of this document is ____ the content of other document (s) I have read 。

1-very similar to, 7-21 very different from) 离关键值很近,它在对应因子上的载荷刚过0.5。

这是一个边缘案例。

这个
22
DRAFT ONLY
测度项其实没有违反效度 (原文中的论述有误)。

对于处于临界点的测度项,如果测度项个数太1 少,比如去掉之后会少于3,则研究者会考虑保留这个测度项。

之后,这几个测度项被逐个去2 掉,在去掉每一个测度项后,我们需要重新作因子分析,以检测测度项在新的情况下的效度。

3 如果效度满足,这个过程就可以停止。

在本例中,前两个测度项被分两步去掉。

以下的报告中4 没有包括第三个测度项是因为在其它的样本中这个测度项几次都出现效度问题 (虽然它在语义5 上没有明显的问题)。

为了保证与以后要讲到的结构方程的一致性,我们在这里把它去掉。

我们6 提醒读者,如果单单从一个样本来看,这个测度项是应当保留的。

下表报告了剩下的测度项的7 载荷矩阵,其中也报告了特征根与一个因子中的信息量。

其中因子中的信息量并不表示旋转后8 的一个主成分中的信息,而是指旋转前的信息 (基于“净化”后的测度项),所以最后三行与各9 旋转后的因子之间并没有对应关系:
10
11
Rotated Component Matrix (a)
12
13
14 Rotation Method: Varimax with Kaiser Normalization. 15 a Rotation converged in 6 iterations. 16
17 如果读者想验证旋转后的载荷矩阵与旋转前的关系,SPSS 也报告了旋转所用的转换矩18 阵。

对于以上结果,这个矩阵是:
19 20 21
22
DRAFT ONLY
1
2
3
Component Transformation Matrix
4
5
6 Rotation Method: Varimax with Kaiser Normalization. 7
8 可以验证:
9 Rotated Component Matrix = Component Matrix Component Transformation Matrix 。

10
11 最后,我们如果想知道一个测度项中的信息有多少被这些主成分解释了,我们可以求这个12 载荷矩阵的积LL ’。

这部分被解释的信息叫作公因子方差 (communality)。

在SPSS 中我们可以13 得到LL ’是:
14
15 Reproduced Correlations
16
17
know1 know2 know3 topic1 topic2 topic3 topic4 ri4 ri5 know1 0.92 0.91 0.91 -0.18 -0.23 -0.11 -0.09 ….
0.17 0.24 know2 0.91 0.94 0.90 -0.17 -0.24 -0.13 -0.12 0.11 0.20 know3 0.91 0.90 0.91 -0.15 -0.19 -0.07 -0.09 0.17 0.22 topic1 -0.18 -0.17 -0.15 0.80 0.78 0.77 0.72 0.23 0.14 topic2 -0.23 -0.24 -0.19 0.78 0.83 0.84 0.72 0.17 0.02 topic3 -0.11 -0.13 -0.07 0.77 0.84 0.87 0.77 0.25 0.09 topic4 -0.09 -0.12 -0.09
0.72 0.72 0.77 0.75 0.26
0.15
…. ri1 -0.11 -0.17 -0.12 0.26 0.23 0.27 0.28 0.59 0.55 ri3 0.17 0.12 0.17 0.28 0.28 0.39 0.39 0.64 0.59 ri4 0.17 0.11 0.17 0.23 0.17 0.25 0.26 0.82 0.80 ri5
0.24
0.20
0.22
0.14
0.02
0.09
0.15
0.80
0.85
Reproduced Correlations
18 Extraction Method: Principal Component Analysis.
19 a Residuals are computed between observed and reproduced correlations. There are 60 (21.0%) 20 nonredundant residuals with absolute values greater than 0.05. 21 b Reproduced communalities
22
23 这个拟合的相关系数矩阵中的对角线对应于每个测度项的公因子方差。

这个矩阵正好是24 Rotated Component Matrix 与其自身转置的积,读者可以自行验证。

同时,SPSS 也会报告每个25 测度项的公因子方差 (通过设置descriptives 中的选项),其结果与这里是一致的。

26 我们现在来尝试对这个数据进行斜旋转。

我们使用一种叫Oblimin 的方法 (并使用默认参27 数)。

斜旋转产生与前面一样的因子个数以及Component Matrix 。

唯一不同的是旋转以后的载荷28 矩阵。

斜旋转产生两个矩阵,一个是Factor Pattern Matrix ,一个是 Factor Structure Matrix 。

其29 中Factor Pattern Matrix 表示的是因子的构造方法,即各测度项是如何通过一个类似回归的方法30 加权求和得到一个因子的值。

相反,Factor Structure Matrix 表示的是因子与测度项之间的载31 荷,即如何对因子进行加权求和得到测度项 (的近似值)。

所以,在报告中,我们应该报告后32 者。

33
DRAFT ONLY
1 2 3 4
5
Pattern Matrix (a)
6
7
8 Rotation Method: Oblimin with Kaiser Normalization. 9 a Rotation converged in 7 iterations. 10
11 从以下的Structure Matrix 中,我们可以看到测度项在对应的因子上的载荷几乎都增加了。

12 但是,有几个测度项 (比如topic4) 违反了正交时区别效度 (虽然这个规则不适用于斜旋转)。

在13 本例中,正交旋转与斜旋转的差别不大。

但这种差别在因子相关性较大时就会相当明显。

14
15
Structure Matrix
16 17
DRAFT ONLY
1 Rotation Method: Oblimin with Kaiser Normalization. 2
3 我们也可以看一眼斜旋转后因子之间的相关性 (下表)。

相关系数大多在0.3以内。

如果相
4 关系数增加,我们的Structure Matrix 就会变得更难以解释了。

5
6
Component Correlation Matrix
7 8
9 Rotation Method: Oblimin with Kaiser Normalization.
10。

相关文档
最新文档