主成分分析-实例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§8 实例 实例1

语x1

数学x2

1 100 65

2 90 85

3 70 70

4 70 90

5 85 65

6 55 45

7 55 55 8

45

65

计算得

1x =71.25,2x =67.5 分析1:基于协差阵

求主成分。

369.6117.9117.9214.3S ⎛⎫

= ⎪⎝⎭

特征根与特征向量(S无偏,用SPSS )

Fac tor 1

Fac tor 2

11x x - 0.880

-0.474

22x x -

0.474

0.880

特征值

433.12

150.81

贡献率

0.7417

0.2583

注:样本协差阵为无偏估计11(11)1n n n S X I X n n

''=

--, 所以,第一、二主成分的表达式为

112212

0.88(71.25)0.47(67.5)

0.47(71.25)0.88(67.5)y x x y x x =-+-⎧⎨

=--+-⎩ 第一主成分是英语与数学的加权和(反映了综合成绩),且英语的权数要大于数学的权数。1y 越大,综合成绩越好。(综合成分)

第二主成分的两个系数异号(反映了两科成绩的均衡性)。不妨将英语称为文科,数学称为理科。2y 越大,说明偏科(文、理成绩不均衡),2y 越小,越接近于零,说明不偏科(文、理成绩均衡)。(结构成分)

问题:英语的权数为何大?如何解释? 分析2:

基于相关阵R 求主成分。因为

1x =71.25,2x =67.5

所以相关阵

11R ⎛

=⎪

解得R 的特征根为:1λ=1.419,2λ=0.581,对应的单位特征向量分别为:

Fac tor 1

Fac tor 2

111

x x s -

0.707

0.707

22

2

x x s -

0.707

-0.

707 特征根

1.419

0.5

81 贡献率

0.709

0.2

91

所以,第一、二主成分的表达式为

12 1

12 2

71.2567.5

0.7070.707

17.9813.69

71.2567.5

0.7070.707

17.9813.69

x x y

x x y

--⎧

=+=+

⎪⎪

--⎪=-=-

⎪⎩

112

212

0.039(71.25)0.052(67.5)

0.039(71.25)0.052(67.5)

y x x

y x x

=-+-

=---

112

212

0.0390.052 6.273

0.0390.0520.671

y x x

y x x

=+-

=-+

*

2

*

1

1

707

.0

707

.0x

x

y+

=

*

2

*

1

2

707

.0

707

.0x

x

y-

=

基于相关阵的更说明了:

第一主成分是英语与数学的加权总分。

第二主成分是对两科成绩均衡性的度量。

此例说明:基于协差阵与基于相关阵的主成分分析的结果不一致。结合此例的实际背景,经对比分析可知,基于协差阵的主成分分析更符合实际。

实例2

例、用“

Y 1

Y

2

Y3

Y 4

Y 5

Y

6

x1:身高

0.469

-0.365 -0.

092

-0.122

0.08

-0.786

x2:坐高

0.404

-0.397 -0.

613

0.326

-0.027

0.

443

x3:胸围

0.394

0.397

0.2

79

0.656

-0.405

-0.

125

x4:臂长

0.408

-0.365 0.7

05

-0.108

0.235

0.

371

x5:肋围

0.337

0.569

-0.

164

-0.019

0.731

0.

034

x6:腰围

0.427

0.308

-0.1

19

-0.661

-0.49

0.

179

特征值

3.287 1.

406 0.4

59

0.426 0.295

0.

126

贡献率 0.

6373 0.

169 0.0

719

0.

0508 0.

0351 0.

0091

累计贡献率

0.

6373 0.

8063 0.8

781

0.9289 0.

964

1

从第一主成分可看出,各原始变量的载荷均为正,且近似相等。若1y 较大,则意味着各原始变量也较大,说明身材高大;若1y 较小,则意味着各原始变量也较小,说明身材矮小。因此,第一主成分1y 可称为(身材)大小成分。(规模成分)

从第二主成分可看出,在“身高*1x 、坐高*2x 、臂长*

4x ”等纵向指标上有中等的负载荷,在“胸围*3x 、肋围*5x 、腰围*

6x ”等横向指标上有中等的正载荷。因此,

第二主成分2y 可称为体形成分。(比例成分—纵、横比例)

从第三主成分可看出,在“坐高*2x ”上有较大的负载荷,在“臂长*

4x ”上有较

大的正载荷,而其他变量上的载荷都较小。故第三主成分基本上是反映的是“坐

高*2x ”与“臂长*

4x ”的比例。因此,第三主成分3y 可称为上身比例成分。(局部比

相关文档
最新文档