SPSS第10章主成分分析和因子分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
每个主成分均是原始变量的线性组合,且各个主成分之间 互不相关,这就使得主成分比原始变量具有某些更优越的性能。 主成分分析不能看作是研究的结果,而应该在主成分分析的基 础上继续采用其他多元统计方法来解决实际问题。
3
西南财经大学出版社
11.1 主成分析
(2)统计原理
第i个主成分:
SPSS16.0与统计数据分析
yi ei ' x e1i x1 e2i x2 L epi xp
设第k个主成分的方差占总方差的比例为 p,k 则有:
pk
k
p
i
i 1
主成分的计算 公式为:
y1 e11x1 e12 x2 L e1m xm
y2
e21x1
e22 x2
L
e2m xm
M
yp ep1x1 ep2 x2 L epm xm
y综 -0.63 -1.11 0.88 -0.88 -0.20
6
美国
3.30 6.07 1.46 3.80
7
加拿大
-0.43 -0.47 -0.31 -0.38
8
巴西
-1.91 -0.06 -0.43 -0.83
9
墨西哥
-1.68 -0.68 0.03 -0.94
10
英国
4.46 0.98 -1.75 2.05
x1 3.205 1.449 14.079 1.318 0.275 29.641 2.056 2.434 1.567 4.67 4.639 6.84 3.792
1.3 1.309 0.177
x2
x3
x4
x5
x6
x7
x8
x9
x10 x11 x12 x13
x14
来自百度文库x15
54.5 28.53 0.878 1.409 0.894 11.6 2.305 0.547 2.932 4.818 9.003 2.7
136.3 1.011
1.6
0.42
1.838 1.3
0.77
0.78 2.267 23.32 42.875 9.1 12.129 0.452
739.5 3.572 27.841 0.884 13.314 28.6 0.622 0.143 1.885 169.772 319.907 54.2 917.328 0.718
132.9 2.252 9.558 6.646 7.747 2.2 8.589 8.971 8.843 32.121 63.174 36 51.514 12.18
104.5 0.321 8.153 3.724 1.059 2.5
0.77
1.913 4.032 22.869 43.924 27
17.776 5.678
x5
.614
.763
.028
x6
.826
-.124
-.281
x7
.273
-.627
.184
x8
.636
.703
.041
x9
.619
.703
.008
x10
.552
.766
.196
x11
.654
-.691
.172
x12
.666
-.685
.166
x13
.863
-.191
-.297
x14
.728
-.632
.144
计算结束后得到的特征向量矩阵如下表所示。
变量 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15
t1 0.17 0.24 -0.06 0.36 0.25 0.34 0.11 0.26 0.25 0.22 0.27 0.27 0.35 0.30 0.24
40.325
2
5.813
38.755
79.080
3
1.142
7.616
86.696
4
.876
5.842
92.538
5
.599
3.996
96.534
6
.326
2.174
98.709
7
.119
.796
99.505
8
.041
.272
99.776
9
.018
.121
99.897
10
.010
.063
99.961
3.914
1.472
31.1 0.279 0.339 0.272
0.1
2.7 0.128 0.193 0.825 2.318 5.127 0.6
4
0.218
52.3 0.653 10.254 11.769 1.097
0
1.967
1.3 6.178 14.746 27.297 30.9 57.734 15.125
110.5 0.218 7.374 0.179
3.04
31.5
0.126
6 0.338 0.248 23.221 47.387 19.8 41.274 0.215
西南财经大学出版社
SPSS16.0与统计数据分析
11.1 主成分析
➢第1步 分析:根据题目要求,需进行主成分分析。
➢第2步 数据组织:按如上表所示的“指标”一列定义变量, 输入数据并保存;
1.362
27.1 1.584 2.327 0.962 2.905 6.8 1.953
2.3
0.857 4.716 10.101 6.7
5.498
1.104
151.4 1.657 2.837 0.797 1.471 10.9 0.67
0.212 2.186 18.485 37.986 4.5
4.887
将上表因子载荷矩阵中的数据输入SPSS数据编辑窗口中,将 3个变量名分别命名为a1,a2和a3。 用公式eij aij / i 计算出标准化特征向量。其步骤为:打开 Analyze→ Compute Variable,计算过程如下图所示。
11
西南财经大学出版社
11.1 主成分析
SPSS16.0与统计数据分析
SPSS16.0与统计数据分析
该图从另一个侧面说明了取前三个主成分为宜。
9
西南财经大学出版社
11.1 主成分析
旋转前的因子载荷矩阵
SPSS16.0与统计数据分析
Component
1
2
3
x1
.407
.805
.268
x2
.596
-.727
.209
x3
-.147
.016
.821
x4
.895
-.333
-.181
12
西南财经大学出版社
SPSS16.0与统计数据分析
11.1 主成分析
对原始的数据变量进行标准化。由于是以相关系数矩阵 为出发点进行因子分析的,所以主成分分析表达式中的 变量应该是经过标准化的数据。
计算主成分:再通过表各个主成分所分析的方差百分比 计算出综合得分函数,其公式为:
y综 0.40325y1 0.38755y2 0.07616 y3
11
法国
0.87 0.46 -0.52 0.49
12
德国
1.40 1.34 -0.26 1.06
13
意大利
-0.61 0.10 -0.54 -0.25
14
俄罗斯
-2.35 -0.20 -0.30 -1.05
15
澳大利亚 -1.36 -0.92 -0.30 -0.93
16
新西兰
-0.99 -1.73 -0.28 -1.09
11.1 主成分析
(4)SPSS实现举例
【例11-1】为了从总体上反映世界经济全球化的状况,现选择 了具有代表性的16个国家的数据,这些国家参与经济全球化程 度指标值见下表。试对其进行主成分分析。
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
国家 中国 印度 日本 韩国 新加坡 美国 加拿大 巴西 墨西哥 英国 法国 德国 意大利 俄罗斯 澳大利亚 新西兰
西南财经大学出版社
第十章
SPSS16.0与统计数据分析
主成分分析和因子分析
1
西南财经大学出版社
主要内容
11.1 主成分析 12.2 因子分析
SPSS16.0与统计数据分析
2
西南财经大学出版社
SPSS16.0与统计数据分析
11.1 主成分析
(1)基本概念
主成分分析(Principal Component Analysis)就是考虑 各指标之间的相互关系,利用降维的方法将多个指标转换为少 数几个互不相关的指标,从而使进一步研究变得简单的一种统 计方法。主成分分析是由Hotelling于1933年首先提出的,是利 用“降维”的思想,在损失很少信息的前提下把多个指标转化 为几个综合指标,称为主成分。分类变量和连续变量均可以参 与两步聚类分析。
x15
.579
.760
.005
Extraction Method: Principal Component Analysis.
a. 3 components extracted.
10
西南财经大学出版社
SPSS16.0与统计数据分析
11.1 主成分析
➢第5步 利用因子分析的结果进行主成分分析:上表是旋转 前的因子载荷矩阵,并不是主成分分析中所需要的标准化的 正交向量,要得到标准化正交向量还需作如下运算:
t2 0.33 -0.30 0.01 -0.14 0.32 -0.05 -0.26 0.29 0.29 0.32 -0.29 -0.28 -0.08 -0.26 0.32
t3 0.25 0.20 0.77 -0.17 0.03 -0.26 0.17 0.04 0.01 0.18 0.16 0.16 -0.28 0.13 0.00
46.1 3.682 6.429 20.563 4.808 5.4 24.253 29.941 15.638 10.784 24.555 13.6 24.495 21.274
101.5 0.898 8.276 2.313 5.369 10.5 2.444 5.145 3.854 34.691 67.047 15.1 21.83
13
西南财经大学出版社
11.1 主成分析
主成分及综合得分表:
SPSS16.0与统计数据分析
编号 1 2 3 4 5
国家 中国 印度 日本 韩国 新加坡
y1 -2.19 -2.56 0.45 -1.69 5.28
y2 0.07 -0.11 1.85 -0.46 -6.26
y3 3.01 -0.46 -0.27 -0.27 1.19
4
西南财经大学出版社
SPSS16.0与统计数据分析
11.1 主成分析
(3)分析步骤
➢第1步 原始数据的标准化处理;
➢第2步 计算相关系数矩阵;
➢第3步 计算特征值及单位特征向量;
➢第4步 计算主成分的方差贡献率和累计方差贡献率;
➢第5步 计算主成分。
5
西南财经大学出版社
SPSS16.0与统计数据分析
14
西南财经大学出版社
主要内容
11.1 主成分析 11.2 因子分析
SPSS16.0与统计数据分析
15
西南财经大学出版社
SPSS16.0与统计数据分析
11.2 因子分析
(1)基本概念
因子分析是一种通过显在变量测评潜在变量,通过具体指 标测评抽象因子的分析方法,最早是由心理学家Chales Spearman在1904年提出的,它的基本思想是将实测的多个指标, 用少数几个潜在的指标(因子)的线性组合表示。因子分析主 要应用到两个方面:一是寻求基本结构,简化观测系统;二是 对变量或样本进行分类。
11
.004
.027
99.988
12
.001
.009
99.997
13
.000
.002
99.999
14
.000
.001
100.000
15
4.080E-7
2.720E-6
100.000
Extraction Method: Principal Component Analysis.
Extraction Sums of Squared Loadings
0.468
118.4 0.497 26.151 12.456 22.137 11.2 16.552 19.642 5.542 28.434 58.7 66.1 278.968 11.289
120.6 1.84 9.242 4.492 10.848 8.5 8.282 5.841 5.21 28.46 54.052 29.2 56.453 8.889
58.6 1.533 1.499 0.552 0.499 2.5
0.31
0.298 0.987 7.77 12.581 1.1
2.001
0.469
94.5 0.502 5.773 0.941 1.987 18.9 0.527 1.371 1.131 15.745 33.795 13.2 24.117 0.797
Total
% of Variance Cumulative %
6.049
40.325
40.325
5.813
38.755
79.080
1.142
7.616
86.696
从表中可以看出前3个主成分已经解释了总方差的近86.7%,故
可以选择前3个主成分进行分析。
8
西南财经大学出版社
11.1 主成分析
主成分的碎石图
➢第3步 主成分分析的设置,主要如下两图所示。
7
西南财经大学出版社
SPSS16.0与统计数据分析
11.1 主成分析
➢第4步 因子分析的结果; 特征值与方差贡献表
Compon
Initial Eigenvalues
ent
Total
% of Variance Cumulative %
1
6.049
40.325
相关文档
最新文档