第八章因子分析--精品-PPT精选

合集下载

第八章因子分析

第八章因子分析
对 x i 所特有的,即每门课程的考试成绩可以
看作由一个公因子(与智力相一致)和一个特殊 因子之和组成。
例2 考虑人的五个生理指标:收缩压(x 1 ),舒 张压( x 2 ),心跳间隔( x 3 ),呼吸间隔( x 4 ),舌 下温度( x 5 )。从生理学的知识知道这五个指标
是受植物神经的交感神经和副交感神经这两个
(8.1)
神经和副交感神经,那么可以设想变量
xp ap1F1 ap2F2 apmFm p
用矩阵表示:
x1 a11 a12 a1m F1 1
x2
a21
a22
a2m
F2
2
x
p
a
p1
ap2
a
pm
Fm
p
X AF ε
高维空间中的互相垂直的m个坐标
例1
1
2
3
4
5
6
1.古典语 1
2.法语 0.83
1
3.英语 0.78 0.67
1
4.数学 0.70 0.67 0.64
1
5.判别 0.66 0.65 0.54 0.54 1
6.音乐 0.63 0.57 0.51 0.51 0.4 1
表中课程是按照相关系数从上到下递减排列的。 Spearman注意到相关矩阵中一个有趣的规律: 如果不考虑对角元素的话,任意两列的元素大致
Y1 11X1 12X2 Y2 21X1 22X2
1p X p 2pXp
Yp p1X1 p2X2 pp X p
(8.2)
其中, i j 为随机向量 X 的相关矩阵的特征值 所对应的特征向量的分量,因为特征向量之 间彼此正交,从X 到 Y 的转换关系是可逆的, 即有

因子分析

因子分析
因子分析的数学模型
表达式中的 xi 已经 不是原始变量,而 是标准化变量
旋转后的因子载荷图
旋转后的因 子载荷系数 更加接近于 1( 如 果 旋 转 后的因子载 荷系数向 0— 1分化越明显, 说明旋转的 效果越好 ) , 从而使因子 的意义更加 清楚了
因子得分函数
因子得分是各变量 的线性组合
因子分析的应用
(实例分析)
【例】根据我国 31 个省市自治区 2006 年的 6 项主 要经济指标数据,进行因子分析,对因子进行 命名和解释,并计算因子得分和排序
31个地区6项经济指标的因子分析


第 1步 将所
选择【Analyze】【Data Reduction-Factor】主对话框。
Bartlett球度检验
以变量的相关系数矩阵为基础,假设相关系数矩阵是 单位阵(对角线元素不为0,非对角线元素均为0)。如 果相关矩阵是单位阵,则各变量是独立的,无法进行 因子分析
KMO检验
用于检验变量间的偏相关性,KMO统计量的取值在 0~1之间
如果统计量取值越接近1,变量间的偏相关性越 强,因子分析的效果就越好
因变量和因子个数的不一致,使得不仅在数学模 型上,而且在实际求解过程中,因子分析和主成 分分析都有着一定的区别,计算上因子分析更为 复杂。 因子分析可能存在的一个优点是:在对主成分和 原始变量之间的关系进行描述时,如果主成分的 直观意义比较模糊不易解释,主成分分析没有更 好的改进方法;因子分析则额外提供了“因子旋 转(factor rotation)”这样一个步骤,可以使分析 结果尽可能达到易于解释且更为合理的目的。
因子分析
Factor analysis
因子分析

第八章 因子分析地理模型

第八章  因子分析地理模型
R=X*X’ (为方便计,假定标准化处理后的矩阵仍记为X)。
求解R矩阵的特征方程|R-λI|=0,记特征值为
λ1>λ2 …>λp>=0,特征向量矩阵为U,这样有关
系: R=U
λ1 0
λ2 …
U’
0 λp
U为正交矩阵,并且满足U’U=UU’=I
令F=U’X,则得
λ1 0
FF’=
λ2 …
0 λp
F为主因子阵,并且 Fα=U’Xα(α=1,2…n),即每 一个Fα为第α个样品主因子观测值。 在因子分析中,通常只选其中 m(m<p) 个主因子。
浙 江 6149 41.88 6221
2966
37 8721
安 徽 2521 55 6380 51.82 7438
2699
42 8848
1、将原始数据标准化 2、建立六个指标的相关系数阵R 3、共因子方差 4、总方差解建立因子载荷阵: 5、建立因子载荷阵: 由于前三个特征值的累计贡献率已达 93.505%,所以取前三个特征值建立因子 载荷阵如下:
主成分分析从原理上是寻找椭球的所有主轴。因此, 原先有几个变量,就有几个主成分。
而因子分析是事先确定要找几个成分,这里叫因子 (factor)(比如两个),那就找两个。
这使得在数学模型上,因子分析和主成分分析有不少 区别。而且因子分析的计算也复杂得多。根据因子分 析 模 型 的 特 点 , 它 还 多 一 道 工 序 : 因 子 旋 转 ( factor rotation);这个步骤可以使结果更好。
x11 x12……x1n x21 x22……x2n
..
X=
..
..
xP1 xP2……xPn
p表示变量数,n表示样本数。

主成分与因子分析-新版分解

主成分与因子分析-新版分解
Aˆ 1u1, , p up
当相关变量所取单位不同时,我们常常先对变量标准化, 标准化样本协差阵S就是原始变量的样本相关阵R,再用R代 替S,与上类似,进行载荷矩阵的估计。
第8章 主成分与因子分析
主成分分析与因子分析的目的在于降 维,即在众多存在的相关性的变量中,找 出少数几个综合性变量,来反映原来变量 所反映的主要信息,使问题简化。
主要作用
能降低所研究的数据空间的维数; 可用于分析筛选回归变量,构造回归模型; 可用于综合评价; 可对变量进行分类
导入案例:如何对学生成绩进行综合评价
i 1
i 1
ห้องสมุดไป่ตู้i 1
i 1
知识要点提醒1:主成分的计算
需要说明的是,从协差阵和相关阵计算 主成分一般是不同的,当变量取值范围彼此 相差很大或度量单位不同时,可以考虑标准 化,以便使计算结果有合理的解释,避免出 现误解。如没有上述度量单位和数量级的差 异,从协差阵和相关阵出发计算的结果对主 成分的解释或计算方差贡献时,一般不会矛 盾。
X i ai1F1 ai2 F2 ai3 F3 ai4 F4 i F1、F2、F3、F4 是不可观测的潜在因子,即公共因子。15个变量 共享这4个公共因子,但是每个变量又有自己的个性,即不被包
含的特殊因子 i
3.因子分析的数学模型
假设有n个样品,每个样品观测p项变量(指标),记为X1, X2,…,Xp,原始数据资料阵
指标2(X2)
指标1(X1)
指标p(Xp)

x11 x12
x1 p
x x21 x22
x2 p
第1次观测值

xn1 xn2
xnp
第n次观测值
为找出主成分,寻求原变量X1,X2,…,Xp的线性组合 Fi,其数学模型

SPSS主成分分析与因子分析.ppt

SPSS主成分分析与因子分析.ppt
X2 变量 Y1
系列1

0
样品
X1
2
4
6
8
1
5
2
2 5
3
3 5
4
4 5
5
5 5
6
6 5
Y1
将X1和X2轴同时逆时针旋转
Y2 X2
Y1
. .. .. . . .
. . . .. . ... . . . . . ..
Y1 X 1 cos X 2 sin Y2 X 1 sin X 2 cos
参考文献
6、甘肃省区域综合经济实力变动分析 作者:魏奋子《开发研究》2003年第3期P43~45 7、江苏省区域经济实力的综合评价与实证分析 作者:门可佩《江苏统计》2001年第12期P15~17 8、数理统计方法在河南经济发展水平和分区研究中 的应用 作者:刘钦普《数理统计与管理》 2002年第3期 P10~15 8、科技实力国际比较的因子分析 作者:徐小阳《统计与决策》2003年第1期 P15~17
第八章 主成分分析与因子分析 Principle Component Analysis & Factor Analysis
§8-1
概述
在许多研究中,为了全面系统地分析问题,都尽可能
完整地搜集信息,对每个观测对象往往需测量很多指标
(变量),人们自然希望用较少的新变量代替原来较多的旧 变量,而这些新变量应尽可能地反映旧变量的信息.
§8.1.2主成分分析的基本概念
主成分分析(Principle 标的统计分析方法。 Component Analysis) 也称主分量分析,是一种将多个指标化为少数几个综合指
基本思想:描述经济现象需要用很多指标(也称变量)来刻划,

第八章-因子分析

第八章-因子分析

因子分析和主成分分析的一些注意事项
可以看出,因子分析和主成分分析都依赖于原始变 量,也只能反映原始变量的信息。所以原始变量的 选择很重要。
另外,如果原始变量都本质上独立,那么降维就可 能失败,这是因为很难把很多独立变量用少数综合 的变量概括。数据越相关,降维效果就越好。
在得到分析的结果时,并不一定会都得到如我们例 子那样清楚的结果。这与问题的性质,选取的原始 变量以及数据的质量等都有关系
在SPSS软件中, 可以获得各样本 各因子的得分。 然后据此可以对 样本进行排序, 也可以在此基础 上进行聚类分析。
F 1 0 . 0 X 1 0 7 . 1 X 2 0 . 1 3 X 3 0 2 . 3 X 4 9 0 3 . 3 X 5 5 0 2 . 3 X 6 2 6
在用因子得分进行排序时要特别小心,特别是对于 敏感问题。由于原始变量不同,因子的选取不同, 排序可以很不一样。
旋转 成分 矩阵 a
数学
成分 1
-.1 07
2 .93 2
物理
-.5 17
.79 6
化学
.03 9
.93 4
语文
.93 9
-.1 86
历史
.89 2
-.1 43
英语
.95 9
-.0 02
提取 方法 :主成 分分 析法 。 旋转 法 : 具有 Kai ser 标准 化的 正交旋 转法 。
a. 旋转 在 3 次迭 代后收 敛。
X 4 0 .8F 6 1 0 1 .4F 1 26X 4 0 .9F 3 1 0 9 .1F 8 26
X 5 0 .7F 9 1 0 8 .4F 2 22X 5 0 .8F 9 1 0 2 .1F 4 23

主成分和因子分析

主成分和因子分析

• 对于计算机,因子分析并不费事。
• 从输出旳成果来看,因子分析也有 因子载荷(factor loading)旳概念, 代表了因子和原先变量旳有关系数。 但是在因子分析公式中旳因子载荷 位置和主成份分析不同。
• 因子分析也给出了二维图;其解释 和主成份分析旳载荷图类似。
• 主成份分析与因子分析旳公式上旳区别
xp ap1 f1 ap2 f2 apm fm p
f1 11x1 12 x2 1p xp f2 21x1 22 x2 2 p xp
因子得分
fm m1x1 m2 x2 mp xp
因子分析旳数学
• 因子分析需要许多假定才 干够解. • 详细公式.
• 对于我们旳数据,SPSS因子分析输出为
Extraction Sums of Squared Loadings
Total % of Variance Cumulative %
3.735
62.254
62.254
1.133
18.887
81.142
• 这里旳Initial Eigenvalues就是这里旳六个
主轴长度,又称特征值(数据有关阵旳特
• 假如长轴变量代表了数据包括旳 大部分信息,就用该变量替代原
先旳两个变量(舍去次要旳一 维),降维就完毕了。
• 椭圆旳长短轴相差得越大,降维 也越有道理。
-4
-2
0
2
4
-4
-2
0
2
4
主轴和主成份
• 多维变量旳情况和二维类似,也有 高维旳椭球,只但是不那么直观罢 了。
• 首先把高维椭球旳主轴找出来,再 用代表大多数数据信息旳最长旳几 种轴作为新变量;这么,主成份分 析就基本完毕了。

因子分析

因子分析
KMO统计量在0.7以上时,因子分析效果较好;KMO 统计量在0.5以下时,因子分析效果很差
Principal components(主成分法):多数情况下可以使 用该方法(这也是SPSS的默认选项)。通过主成分分析的 思想提取公因子,它假设变量是因子的线性组合 Unweight Least Square(不加权最小平方法):该方法 使实际的相关矩阵和再生的相关矩阵之差的平方和达到 最小 Generalized Least Square(加权最小平方法):用变量 值进行加权,该方法也是使实际的相关矩阵和再生的相 关矩阵之差的平方和达到最小 Maximum Likelihood(最大似然法):该方法不要求数 据服从正态分布,在样本量较大时使用较好 Principal Axis Factoring(主轴因子法):该方法从原始 变量的相关性出发,使得变量间的相关程度尽可能地被 公因子解释


共同度量(Communality)
2 hi2 aij ( j 1, 2, ,k ) i 1 p
变量xi的信息能够被k个 公因子解释的程度,用 k 个公因子对第 i 个变量 xi的方差贡献率表示
因子的方差贡献率
2 g2 a 2, ,p) ij (i 1, j j 1 k
Bartlett球度检验
以变量的相关系数矩阵为基础,假设相关系数矩阵是 单位阵(对角线元素不为0,非对角线元素均为0)。如 果相关矩阵是单位阵,则各变量是独立的,无法进行 因子分析
KMO检验
用于检验变量间的偏相关性,KMO统计量的取值在 0~1之间
如果统计量取值越接近1,变量间的偏相关性越 强,因子分析的效果就越好
因变量和因子个数的不一致,使得不仅在数学模 型上,而且在实际求解过程中,因子分析和主成 分分析都有着一定的区别,计算上因子分析更为 复杂。 因子分析可能存在的一个优点是:在对主成分和 原始变量之间的关系进行描述时,如果主成分的 直观意义比较模糊不易解释,主成分分析没有更 好的改进方法;因子分析则额外提供了“因子旋 转(factor rotation)”这样一个步骤,可以使分析 结果尽可能达到易于解释且更为合理的目的。

第八章 因子分析

第八章  因子分析
称它为变量 x1 , x2 ,, x p 的共同度。因为已将假设原始变量 xi 和主因子、特殊因子都进行了标准化处理,所以
1 Var ( xi ) Var ( aij F j i ) aij 2 ii 2 hii 2 ii 2
j 1 j 1
m
m
式(8.9)表明变量 xi 的方差 Var ( xi ) 由两部分组成,第一部分是 hi 2, 它反映了全部公共因子对变量xi 的影响,是全部公共因子对 xi 的方差贡献。若全部公共因子对的 xi 方差贡献接近于1,则表 明该变量的几乎全部原始信息都被选取的公共因子说明了。第二 部分是特殊因子 i 的方差,仅与变量 xi 本身的变化有关,称为 h2 剩余方差。由式(8.9)知, i 增大则 ii 2 必减小,因此 hi 2 的值
表示x的第i个分量 xi 对于F的每一分量 F1 , F2 , , Fm 的共同依赖 程度,故 hi 2 为变量 xi 的共同度。
三、公共因子的方差贡献的统计意义
如果将因子载荷矩阵A的第 j( j 1,2,, m)列的各元素的平方 2 和记为 g j ,即
g12 a112 a212 a p12 2 g2 a212 a22 2 a p 2 2 Байду номын сангаас g 2 a 2 am 2 a 2 1m pm m
我们的目的也就是要从一些相互关联的问题的回答中找出这少 数几个主要因子,每一个主要因子可以帮助我们对学生的知识 和能力进行分析和解释。 因子分析的另一个作用是对变量(或样品)进行分类处理。 我们可以根据因子得分值,在因子铀所构成的空间中把变量 (或样品)点画出来,形象直观地达到分类的目的。 为了给出因子分析模型,我们先看下面的两个例子。 例8.1 某企业招聘人才,对每位应聘者进行外貌、申请书 的形式、专业能力、讨人喜欢的能力、自信心、洞察力、诚 信、推销本领、经验、工作态度、抱负、理解能力、潜在能 力、实际能力、适应性的15个方面考核.这15个方面可归结 为应聘者的表现力、亲和力、实践经验、专业能力4个方面, 每一方面称为一个公共因子。企业可根据这4个公共因子的 情况来衡量应聘者的综合水平。

因子分析模型讲解PPT

因子分析模型讲解PPT
• 因子旋转的目的是为了找到意义更为明确,实际 意义更明显的公因子。
• 因子旋转不改变变量共同度,只改变公因子的方 差贡献。
11
因子旋转分为两种:正交旋转和斜交旋转
特点:
正交旋转:由因子载荷矩阵A左乘一正交阵而得到,经过 旋转后的新的公因子仍然保持彼此独立的性质。正交变化 主要包括方差最大旋转法、四次最大正交旋转、平均正交 旋转。
X2
a21
a22
a1mF1 1
a2m
F2
2
Xp
ap1
ap2
apm
Fp
p
3
简记为
X=AF+ε
且满足
m p
cov(F,ε)0
1
D(F)
1
0
0
Im
1
2 1
D (ε )
2 2
0
0
2 p4因子分析的的通过模型 X=AF+ε 以F 代替X ,由于m≤p,从而达到简化变量维
b11 b12 b1p b1
b21
b22
b2 p
b2
bm1
bm2
bmp
bm
20
我们现在仅知道由样本值可得因子载荷阵A,由因 子载荷的意义知:
ijxiF j E (X iF j)
E [ X i( b j 1 X 1 b jX p p )]
b j1i1 b jp ip
因子旋转
通过坐标变换使每个原始变量在尽可能少的因子之间有密切的关系, 这样因子解的实际意义更容易解释,并为每个潜在因子赋予有实际意义 的名字。
26
计算因子得分
求出各样本的因子得分,有了因子得分值,则可以在许多分析中使用 这些因子,例如以因子的得分做聚类分析的变量,做回归分析中的回 归因子。

1第八章因子分析

1第八章因子分析

1第⼋章因⼦分析第⼋章因⼦分析第⼀节因⼦分析的基本理论1904年查尔斯.斯⽪尔曼(Chales Spearman )发表⼀篇名为《对智⼒测验得分进⾏统计分析》的论⽂,此篇论⽂的发表被视为因⼦分析的起点。

因⼦分析的形成和发展有相当长的历史,最早⽤于研究⼼⾥学和教育学⽅⾯的问题,但由于计算量⼤,⼜缺乏强有⼒的计算⼯具,使因⼦分析的应⽤和发展受到很⼤限制,甚⾄停滞了很长⼀段时间。

⾼速计算机的出现,使因⼦分析的理论研究和计算有了很⼤的进展。

⽬前,这⼀⽅法在经济学、社会学、考古学、⽣物学、医学、地质学及体育科学等领域都得到了⼴泛的应⽤,并取得了显著的成绩。

⼀、什么是因⼦分析因⼦分析是主成分分析的推⼴和发展,它是将具有错综复杂关系的变量(或样品)综合为数量较少的⼏个因⼦,以显⽰原始变量与因⼦之间的相互关系,同时根据不同因⼦还可以对变量进⾏分类,是多元统计分析中处理降维的⼀种统计分析⽅法。

例如某公司对100名招聘⼈员的知识和能⼒进⾏测试,出了50道试题的试卷,其内容包括的⾯较⼴,但总的来讲可归纳为6个⽅⾯:语⾔表达能⼒、逻辑思维能⼒、判断事物的敏捷和果断程度、思想修养、兴趣爱好、⽣活常识等,我们将每⼀个⽅⾯称为⼀个因⼦。

假设这100个⼈测试的分数为{}100,,2,1, =i X i 可以⽤上述6个因⼦表⽰成线性函数:i i i i i F a F a F a X ε++++=662211 ,100,,2,1 =i其中61,,F F 表⽰6个公共因⼦,它们的系数61,,i i a a 称为因⼦载荷,表⽰第i 个应试⼈员在6个因⼦⽅⾯的能⼒,i ε是第i 个应试⼈员的能⼒和知识不能被前6个因⼦包括的部分,称为特殊因⼦,通常假定),0(~2i i N σε。

这个模型与回归模型在形式上相似,但实质很不同。

这⾥的61,,F F 的值是未知的,有关参数的统计意义更不⼀样。

因⼦分析的任务就是先估计出{}ij a 和⽅差{}2i σ,然后将这些抽象因⼦{}j F 赋予有实际意义的解释。

因子分析法详细步骤因子分析法操作步骤 ppt课件

因子分析法详细步骤因子分析法操作步骤 ppt课件
因子分析法详细步骤因子分析法操 作步骤
(1)hi2是m个公共因子对第i个变 量的贡献,称为第i个共同度 (communality)或共性方差, 公因子方差(common variance)
(2)δi称为特殊方差(specific variance),是不能由公共因子解 释的部分
因子分析法详细步骤因子分析法操 作步骤
(h1’)2 r12 … r1p
r21 (h2’)2 … r2p
R’= .. …. Nhomakorabea.
. ….
rp1 rp2 … (hp’)2
R’的前m个特征根及其对应的单位化特征向 量就是主因子解。
因子分析法详细步骤因子分析法操 作步骤
• 迭代主因子法(iterated principal factor)
主因子的解很不稳定。因此,常以估计 的共同度为初始值,构造新的约化矩 阵,再计算其特征根及其特征向量, 并由此再估计因子负荷及其各变量的 共同度和特殊方差,再由此新估计的 共同度为初始值继续迭代,直到解稳 定为止。
• 你所经历的课堂,是讲座式还是讨论式? • 教师的教鞭
• “不怕太阳晒,也不怕那风雨狂,只怕先生骂我 笨,没有学问无颜见爹娘 ……”
• “太阳当空照,花儿对我笑,小鸟说早早早……”
二、因子分析模型
一般地,设X=(x1, x2, …,xp)’为可观 测的随机变量,且有
X i i a i 1 f 1 a i2 f 2 a i m f m e i
• 因子载荷(负荷)aij是随机变量xi与 公共因子fj的相关系数。
•设
p
g
2 j
a
2 ij
i1
j 1, 2 ,..., m
称gj2为公共因子fj对x的“贡献”,是 衡量公共因子fj重要性的一个指标。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档