主成分分析-实例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§8 实例 实例1
英
语x1
数学x2
1 100 65
2 90 85
3 70 70
4 70 90
5 85 65
6 55 45
7 55 55 8
45
65
计算得
1x =71.25,2x =67.5 分析1:基于协差阵
求主成分。
369.6117.9117.9214.3S ⎛⎫
= ⎪⎝⎭
特征根与特征向量(S无偏,用SPSS )
Fac tor 1
Fac tor 2
11x x - 0.880
-0.474
22x x -
0.474
0.880
特征值
433.12
150.81
贡献率
0.7417
0.2583
注:样本协差阵为无偏估计11(11)1n n n S X I X n n
''=
--, 所以,第一、二主成分的表达式为
112212
0.88(71.25)0.47(67.5)
0.47(71.25)0.88(67.5)y x x y x x =-+-⎧⎨
=--+-⎩ 第一主成分是英语与数学的加权和(反映了综合成绩),且英语的权数要大于数学的权数。1y 越大,综合成绩越好。(综合成分)
第二主成分的两个系数异号(反映了两科成绩的均衡性)。不妨将英语称为文科,数学称为理科。2y 越大,说明偏科(文、理成绩不均衡),2y 越小,越接近于零,说明不偏科(文、理成绩均衡)。(结构成分)
问题:英语的权数为何大?如何解释? 分析2:
基于相关阵R 求主成分。因为
1x =71.25,2x =67.5
所以相关阵
11R ⎛
=⎪
⎪
⎭
解得R 的特征根为:1λ=1.419,2λ=0.581,对应的单位特征向量分别为:
Fac tor 1
Fac tor 2
111
x x s -
0.707
0.707
22
2
x x s -
0.707
-0.
707 特征根
1.419
0.5
81 贡献率
0.709
0.2
91
所以,第一、二主成分的表达式为
12 1
12 2
71.2567.5
0.7070.707
17.9813.69
71.2567.5
0.7070.707
17.9813.69
x x y
x x y
--⎧
=+=+
⎪⎪
⎨
--⎪=-=-
⎪⎩
112
212
0.039(71.25)0.052(67.5)
0.039(71.25)0.052(67.5)
y x x
y x x
=-+-
⎧
⎨
=---
⎩
112
212
0.0390.052 6.273
0.0390.0520.671
y x x
y x x
=+-
⎧
⎨
=-+
⎩
*
2
*
1
1
707
.0
707
.0x
x
y+
=
*
2
*
1
2
707
.0
707
.0x
x
y-
=
基于相关阵的更说明了:
第一主成分是英语与数学的加权总分。
第二主成分是对两科成绩均衡性的度量。
此例说明:基于协差阵与基于相关阵的主成分分析的结果不一致。结合此例的实际背景,经对比分析可知,基于协差阵的主成分分析更符合实际。
实例2
例、用“
Y 1
Y
2
Y3
Y 4
Y 5
Y
6
x1:身高
0.469
-0.365 -0.
092
-0.122
0.08
-0.786
x2:坐高
0.404
-0.397 -0.
613
0.326
-0.027
0.
443
x3:胸围
0.394
0.397
0.2
79
0.656
-0.405
-0.
125
x4:臂长
0.408
-0.365 0.7
05
-0.108
0.235
0.
371
x5:肋围
0.337
0.569
-0.
164
-0.019
0.731
0.
034
x6:腰围
0.427
0.308
-0.1
19
-0.661
-0.49
0.
179
特征值
3.287 1.
406 0.4
59
0.426 0.295
0.
126
贡献率 0.
6373 0.
169 0.0
719
0.
0508 0.
0351 0.
0091
累计贡献率
0.
6373 0.
8063 0.8
781
0.9289 0.
964
1
从第一主成分可看出,各原始变量的载荷均为正,且近似相等。若1y 较大,则意味着各原始变量也较大,说明身材高大;若1y 较小,则意味着各原始变量也较小,说明身材矮小。因此,第一主成分1y 可称为(身材)大小成分。(规模成分)
从第二主成分可看出,在“身高*1x 、坐高*2x 、臂长*
4x ”等纵向指标上有中等的负载荷,在“胸围*3x 、肋围*5x 、腰围*
6x ”等横向指标上有中等的正载荷。因此,
第二主成分2y 可称为体形成分。(比例成分—纵、横比例)
从第三主成分可看出,在“坐高*2x ”上有较大的负载荷,在“臂长*
4x ”上有较
大的正载荷,而其他变量上的载荷都较小。故第三主成分基本上是反映的是“坐
高*2x ”与“臂长*
4x ”的比例。因此,第三主成分3y 可称为上身比例成分。(局部比