spss主成分分析PCA
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
in cos
y1 cos sin x1 Ux y2 sin cos x2
U为旋转变换矩阵,它是正交矩阵,即有
U U1, UU I
•
16 cxt
旋转变换的目的:为了使得n个样品点在Fl轴方向上的 离散程度最大,即Fl的方差最大。
•
5 cxt
主成分分析得到的主成分与原始变量之间的关 系: 1、主成分保留了原始变量绝大多数信息。 2、主成分的个数大大少于原始变量的数目。 3、各个主成分之间互不相关。 4、每个主成分都是原始变量的线性组合。
•
6 cxt
主成分分析的运用: 1、对一组内部相关的变量作简化的描述
2、用来削减回归分析或群集分析(Cluster)中 变量的数目
•
10 cxt
5.2 数学模型与几何解释-几何解释
为了方便,我们在二维空间中讨论主成分的几 何意义: 设有n个样品,每个样品有两个观测变量xl和x2, 在由变量xl和x2 所确定的二维平面中,n个样本 点所散布的情况如椭圆状。由图可以看出这n个 样本点无论是沿着xl 轴方向或x2轴方向都具有 较大的离散性,其离散的程度可以分别用观测 变量xl 的方差和x2 的方差定量地表示。显然, 如果只考虑xl和x2 中的任何一个,那么包含在 原始数据中的经济信息将会有较大的损失。
•
19 cxt
了解了主成分分析的基本思想、数学和几何意义后,问 题的关键:
1、如何进行主成分分析?(主成分分析的方法) 基于相关系数矩阵还是基于协方差矩阵做主成分分析。 当分析中所选择的变量具有不同的量纲,变量水平差异 很大,应该选择基于相关系数矩阵的主成分分析。 2、如何确定主成分个数? 主成分分析的目的是简化变量,一般情况下主成分的个 数应该小于原始变量的个数。关于保留几个主成分,应 该权衡主成分个数和保留的信息。
•
7 cxt
二、数学模型与几何解释-数学模型
假设我们所讨论的实际问题中,有p个指标,我 们 把 这 p 个 指 标 看 作 p 个 随 机 变 量 , 记 为 X1, X2,…,Xp, 主 成 分 分 析 就 是 要 把 这 p 个 指 标 的问题,转变为讨论p个指标的线性组合的问题, 而 这 些 新 的 指 标 F1,F2,…,Fk(k≤p), 按 照 保留主要信息量的原则充分反映原指标的信息, 并且相互独立。
x 2
F 1
F2
•
•••
•••
• •
•
•••••••••••••••••••••••
• •
x 1
•••
•
14 cxt
平移、旋转坐标轴
x 2
F 1
F2 •••••••••
••••
••••••••••••
••••••
•••
•
x 1
•
15 cxt
根据旋转变换的公式:
y1 y2
x1 cos x2 s x1 sin x2
(变量Fl代表了原始数据的绝大部分信息,在研究某问题 时,即使不考虑变量F2也无损大局)。经过上述旋转变 换原始数据的大部分信息集中到Fl轴上,对数据中包含 的信息起到了浓缩作用。
•
17 cxt
Fl,F2除了可以对包含在Xl,X2中的信息起着浓 缩作用之外,还具有不相关的性质,这就使得
在研究复杂的问题时避免了信息重叠所带来的
•
3 cxt
在进行主成分分析后,竟以97.4%的精度,用三新变量 就取代了原17个变量。根据经济学知识,斯通给这三 个新变量分别命名为总收入F1、总收入变化率F2和经 济发展或衰退的趋势F3。
•
4 cxt
主成分分析:将原来较多的指标简化为少数几个新的综 合指标的多元统计方法。
主成分:由原始指标综合形成的几个新指标。依据主成 分所含信息量的大小成为第一主成分,第二主成分等等。
•
9 cxt
满足如下的条件:
1、每个主成分的系数平方和为1。即
2、主成分u12之i 间u22相i 互独立u2p,i 即1无重叠的信息。即 3、主Co成v(分F的i,方F差j)依 0次,递i 减,j,重i,要j性依1,次2递,减,,即p
F1、分F。2…V.aFrp(分F别1)称 为Va原r(变F2量) 的第一V、ar第(F二p )….第p个主成
•
8 cxt
这种由讨论多个指标降为少数几个综合指 标的过程在数学上就叫做降维。主成分分 析通常的做法是,寻求原指标的线性组合
Fi。
F1 u11X1 u21X 2 u p1X p F2 u12 X1 u22 X 2 u p2 X p
Fp u1p X1 u2 p X 2 u pp X p
spss主成分分析PCA
zf
主成分分析的重点
1、掌握什么是主成分分析? 2、理解主成分分析的基本思想和几何意义? 3、理解主成分求解方法:协方差矩阵与相关系数矩阵
的差异? 4、对结果进行正确分析
•
2 cxt
5.1 主成分分析的基本思想
一项十分著名的工作是美国的统计学家斯通(stone)在 1947年关于国民经济的研究。他曾利用美国1929一 1938年各年的数据,得到了17个反映国民收入与支出 的变量要素,例如雇主补贴、消费资料和生产资料、纯 公共支出、净增库存、股息、利息外贸平衡等等。
•
11 cxt
如果我们将xl 轴和x2轴先平移,再同时按逆时针方向 旋转角度,得到新坐标轴Fl和F2。Fl和F2是两个新变 量。
•
12 cxt
平移、旋转坐标轴
x2
F1
F2
•• • • •
•• • •
•• •
•
• •
•
• •
Fra Baidu bibliotek
•
•
•
• •••
• •• •
•• •
• ••
x1
••
•
13 cxt
平移、旋转坐标轴
虚假性。二维平面上的个点的方差大部分都归
结在Fl轴上,而F2轴上的方差很小。Fl和F2称为 原始变量x1和x2的综合变量。F简化了系统结构, 抓住了主要矛盾。
•
18 cxt
由此可概括出主成分分析的几何意义:
主成分分析的过程也就是坐标旋转的过程,各主 成分表达式就是新坐标系与原坐标系的转换关 系,新坐标系中各坐标轴的方向就是原始数据 方差最大的方向。