第九章因子分析
因子分析-PPT
因子 得分
因子分析
什么 叫因 子分
析
定义解释
因子分析就是主成分分析得推广和发展, 她就是把具有复杂关系得多个变量(或样 品)综合为少数几个因子,并给出原始变量 与综合因子之间得相关关系得多元统计 分析方法
种类
R型因子分析(对变量进行因子分析) Q型因子分析(对样品进行因子分析)
应用意义
应用范围
表示得形式不同。
因子 分析 得统 计意
义
假定因子模型中,各个变量、 公共因子、特殊因子都已经进 行了标准化处理
因子载荷矩阵得统计意义
变量共同度得统计意义
公因子方差贡献得统计意义
因子 载荷 矩阵 得估 计方
法
方法一:流
应用类型
基本思想 数学模型
因子 分析 得模
型
主成 分分 析与 因子 分析 得区
别
主成分分析就是一种数学变换 (正交变换)不能称为一种数学 模型;而因子分析需要构造数 学模型。
主成分得个数与原始数据个数 相等,就是把原始变量变换成 为相互独立得新得变量;而因 子个数一般要求小于原始数据 个数,目得在于得到一个结构 简单得因子模型。
可以互相讨论下,但要小声点
因子 旋转
含义:
因子旋转就是根据因子载荷矩阵 得不唯一性,用一个正交矩阵右乘 因子载荷矩阵,实行旋转(由线性代 数,一次正交变换,对应坐标系得一 次旋转),使旋转后得因子载荷矩阵 结构简化,以便对公共因子进行合 理得解释。
所谓结构简化就就是使得每个变 量仅在一个公共因子上有较大得 载荷,而在其她得公共因子上得载 荷比较小。
常用得方法有:
第九讲 因子分析
其中 i 1,,24
3
例:某公司对100名招聘人员的知识和能力进行测评,主要 测评六个方面的内容:语言表达能力、逻辑思维能力、判断 事物的敏捷和果断程度、思想修养、兴趣爱好、生活常识等, 我们将每一个方面称为因子,显然这里所说的因子不同于回 归分析中的因素,因为前者是比较抽象的一种概念,而后者 有着极为明确的实际意义。假设100人测试得分xi可以用上 述六个因子表示成线性函数:
* 6
还可求出各变量的共同度,各变量对应的特殊因子方差, 各公共因子方差贡献率以及两个公共因子的累计方差贡献
变量 X1* X2* X3* X4* X5* X6* 方差贡献率 累计方差贡献率 ai1 0.272 0.409 0.477 0.926 0.848 0.843 45.9% 45.9% ai2 0.293 0.439 0.513 -0.179 0.031 0.172 10.1% 56% 共同度 0.16 0.36 0.49 0.89 0.72 0.74 56% 特殊因子方差 0.84 0.64 0.51 0.11 0.28 0.26 44%
因子载荷不唯一。对于m m的正交阵T , 令A AT , F T F 则模型可表示为X A F 由于 D( F ) I mm cov(F , ) 0 仍满足模型条件,同样 可分解为: A A D 实际中,常利用这一点,通过因子的变换,使得新的因子有更 好的实际意义
注:
因子分析与回归分析不同,因子分析中的因子是一个 比较抽象的概念,而回归因子有非常明确的实际意义; 主成分分析分析与因子分析也有不同,主成分分析仅 仅是变量变换,而因子分析需要构造因子模型。 主成分分析:原始变量的线性组合表示新的综合变量, 即主成分;
因子分析:潜在的假想变量和随机影响变量的线性组 合表示原始变量。
第九章 因子分析
(9-4)
可以证明,上式系数的平方和满足: 可以证明,上式系数的平方和满足:
4
2 aki = 1 (i = 1,2,L, m) ∑ k =1
m
在此条件下, 在此条件下,由原始变量经线性组合而得到的新 主因子或 变量f 叫做主因子 综合变量。 变量 i叫做主因子或综合变量。 组合成新变量有什么用途呢? 组合成新变量有什么用途呢? m个原始变量表示为 个主因子的线性组合, 个原始变量表示为p个主因子的线性组合 把m个原始变量表示为p个主因子的线性组合, 小于m, 当p小于 ,特别是 p=2时,可以在二维空间对变 小于 时 量作图,进而对变量的相关性及成因联系进行研 量作图, 究。
xi = ai1 f1 + ai 2 f2 +L+ aim fm (i = 1,2,L, m)
a11 a12 a 21 a22 其中 A = L L am1 am2 L L L L
(9-5)
a1m a 2m 因子载荷矩阵。 称因子载荷矩阵。 L amm
7
在进行综合地质研究时,如果用前 在进行综合地质研究时,如果用前p(p << m)个主 个主 因子就能解释原始数据80~ 以上的信息, 因子就能解释原始数据 ~90%以上的信息,那么 以上的信息 可改写为: 式(9-5)可改写为: 可改写为
那么可以证明前p个主因子载荷矩阵为 那么可以证明前 个主因子载荷矩阵为: 个主因子载荷矩阵为
A1 = [ a ij ] m× p = [u ij λ j ] m× p
相应的R型因子分析模型为: 型因子分析模型为:
xi = ai1 f1 + ai 2 f 2 + L+ aip f p + αi ei
因子分析
因子分析因子分析是一种常用的统计方法,广泛应用于社会科学、经济学、心理学等领域。
它可以帮助研究者找出数据中的主要因素,并将原始变量转化为更少的几个综合指标,从而简化数据分析和解释。
本文将介绍因子分析的基本原理、应用场景以及一些常见的因子分析方法。
一、因子分析的基本原理因子分析基于一种潜在变量模型,假设观察到的一组变量是由少数几个潜在的因子所决定的。
这些潜在因子无法直接观察到,但可以通过观察到的变量来推断。
通过因子分析,我们可以找出这些潜在因子,并将原始变量转化为这些因子的得分。
在因子分析中,我们假设每个潜在因子与一组观察到的变量相关联,这些变量称为因子载荷。
因子载荷可以解释变量之间的协方差结构,反映了变量与潜在因子之间的相关程度。
我们可以通过计算因子载荷矩阵来评估这种关系。
同时,我们还假设观察到的变量之间相互独立,即不存在多重共线性。
多重共线性会使得因子分析的结果不准确,因此在进行因子分析之前,我们需要先进行相关性分析和多重共线性检验。
二、因子分析的应用场景因子分析在许多领域都有广泛的应用。
以下是其中一些常见的应用场景:1.心理学研究:因子分析可以帮助心理学家理解人类行为的潜在因素。
例如,在人格心理学中,我们可以使用因子分析来研究人格特征的结构,并找出彼此相关的因素。
2.市场研究:因子分析可以帮助市场研究人员理解消费者行为的背后因素。
例如,在消费者调查中,我们可以使用因子分析来提取消费者购买决策中的主要影响因素,并根据这些因素进行市场定位和目标群体选择。
3.经济学研究:因子分析可以帮助经济学家理解经济变量之间的关系。
例如,在宏观经济学中,我们可以使用因子分析来提取经济增长、通货膨胀和失业率等变量的主要因素,并分析它们之间的相互作用。
4.社会科学研究:因子分析可以帮助社会科学家理解社会现象的潜在因素。
例如,在教育研究中,我们可以使用因子分析来研究学生学习成绩的主要影响因素,并提供相应的教学策略。
三、常见的因子分析方法在因子分析中,有许多不同的方法可以选择。
财务报表分析方法 第9章 因子分析与主成分分析.ppt
因子分析法在财务比率分类中的应用
(三)应用的基本步骤
1.收集所要研究企业的财务比率数据, 得到样本原始数据矩阵
Y11 Y12
Y
Y21
Y22
Y31 Y32
Y13
Y23
Y33
因子分析法在财务比率分类中的应用
2.对样本原始数据进行标准化处理 变量标准化的公式为:
财务比率因子分析法的作用
财务比率因子分析法的作用主要体现在如下几 个方面:
首先,因子分析法能够应用实际的数据提供对这些 财务比率的关系的实质性测试及使分类合理化,这 种研究是有用的,它基于的思想是:相关的比率归 为一类,不相关的归为不同类。
其次,因子分析法会因为数据及方法的不同产生不 同的分类。财务比率分类的研究表明了财务比率相 互之间的关系,有助于研究者或使用者通过财务比 率的分类来选择财务比率。
因子分析法在财务比率分类中的应用
(一)应用的理论依据
将因子分析法的基本思想应用于其中,一 方面将相类似的指标(比率)归为一个因 子,另一方面将不相似的指标归为不同的 因子,可以有效地将大量的财务比率由几 个因子来进行代表。基于财务比率的来源 与构成,利用因子分析的方法,可以将它 们按照特性进行分类,将相类似的项目归 为一组,而不相类似的归在不同的类别中, 不同组的比率反映企业不同的特性。
8.运算过程的辅助实现
实务中,我们可以借助计算机进行辅助处理,例如 可直接利用SPSS软件、SAS软件,或者运用高级 语言(如Visual C++,Visual Basic)编制运算 程序等进行辅助运算。
财务比率因子分析法的特征评价
(一)因子分析法的性质
九章节因子分析
该方程组表示了得到m 个公共因子后,就可以使用这些公共因 子在一定程度上预测每一个观测变量。方程中的系数正好是相对应 的观测变量与公共因子的相关系数,也叫做该观测变量在对应因子 上的载荷,即因子载荷,它反映了二者的关系强度。
几个重要概念:
1. 因子载荷:某个因子与某个原变量的相关系数,主要反映该公共因
出发点 13 15 17 17 16 16 16 18 15 20 14 18 15 12 14 13 15 15 18 13
工作投入 发展机会 社会地位 权力距离 职位升迁 领导风格
18
16
17
15
16
16
16
18
18
18
17
19
14
17
18
16
161616 Nhomakorabea19
18
19
20
19
16
18
18
15
16
(3) 在“Display”下选中“Unrotated factor solution”和 “Scree plot”以输出未经旋转的因子载荷矩阵、碎石图。执行之 后根据输出信息确定提取因子数,比如根据碎石图来确定;
第四步:点击“Rotation”按钮打开选择因子载荷矩阵的旋转 方法。一般使用最多的是正交旋转(选中Varimax)或斜交旋转 方法(选中Promax),其中斜交旋转速度快,所以大样本时多选 此方法。同时可选中“Rotated solution”和 “Loading plot(s)”, 以输出旋转后因子旋转矩阵、载荷散点图。
第九章因子分析
14
65
60
60
50
65
62
60
80
15
96
86
75
70
82
65
88
82
操作练习
感谢您的关注
点击打开数据文件
2.根据15名学生的8门课程成绩,对之进行因素分析
学号 代数x1 几何x2 物理x3 地理x4 英语x5 语文x6 化学x7 历史x8
1
94
83
78
80
70
50
65
80
2
73
75
80
65
70
60
52
75
3
52
55
65
40
80
40
55
70
4
50
45
68
60
80
60
65
80
5
68
85
75
三、因子分析的SPSS过程
第一步:准备数据文件,打开对话框,加载观测变量。数据 文件主要是由较多的(一般在10个以上)可观测变量组成,个案 数应比较大 。然后点击“Analyze” ,选择 “Data Reduction” 中 的“Factor”打开因子分析对话框,将参与分析的所有观测变量加 载到“Variables”下边的方框中。 。
一因子分析的基本概念和原理通常在科学研究中首先得到的观测资料都是关于事物的外在特征或个别的具体特征这些特征的观测值存在聚合趋势有倾向于聚合的一些变量具有高度相关性这种高度的相关性显示出这些变量的背后存在着一个共同的制约因素称为共同因子或因子
第九章因子分析
1
3.因子变量的命名解释
第9章:因子分析
第9章因子分析与主成份分析因子分析与因子分析过程因子分析是将多个实测变量转换为少数几个不相关的综合指标的多元统计分析方法。
线性综合指标往往是不能直接观测到的,但它更能反映事物的本质。
因子分析概念在各个领域的科学研究中往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律。
多变量大样本无疑会为科学研究提供丰富的信息,但也在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可能存在相关性而增加了问题分析的复杂性。
由于各变量之间存在一定的相关关系,因此有可能用较少的综合指标分别综合存在于各变量中的各类信息,而综合指标之间彼此不相关,即各指标代表的信息不重叠。
这样就可以对综合指标根据专业知识和指标所反映的独特含义给予命名。
这种分析方法成为因子分析,代表各类信息的综合指标就称为因子或主成份。
根据因子分析的目的我们知道,综合指标应该比原始变量少,但包括的信息量应该相对损失较少。
原始变量:X1、X2、X3、X4……Xm主成份:Z1、Z2、Z3、Z4……Zn则各因子与原始变量之间的关系可以表示成:X1=b11Z1+b12Z2+b13Z3……+b1n Z n+e1X2=b21Z1+b22Z2+b23Z3……+b2n Z n+e2X3=b31Z1+b32Z2+b33Z3……+b3n Z n+e3……X m=b m1Z1+b m2Z2+b m3Z3……+b mn Z n+en写成矩阵形式为:X=BZ+E。
其值X为原始变量向量,B为公因子负荷系数矩阵,Z为公因子向量,E为残差向量。
公因子Z1、Z2、Z3…Zn之间彼此不相关,称为正交模型。
因子分析的任务就是求出公因子负荷系数和残差。
如果残差E的影响很小可以忽略不计,数学模型变为X=BZ。
如果Z中各分量之间彼此不相关,形成特殊形式的因子分析,称为主成分分析。
主成分分析的数学模型可以写成:Z1=a11X 1+a12X2+a13X 3……+a1m X mZ2=a21X 1+a22X2+a23X 3……+a2m X mZ3=a31X 1+a32X2+a33X 3……+a3m X m……Z n=an1X 1+an2X2+an3X 3……+anm X m写成矩阵形式为:Z=AX。
因子分析(因子评价)
因子分析一.因子分析原理因子分析是根据相关性大小把原始变量进行分组,使得同组内的变量之间相关性高,而不同组的变量之间的相关性低。
每组变量代表一个基本结构(即公共因子),并用一个不可观测的综合变量来表示。
对于所研究的某一具体问题,原始变量分解为两部分之和。
一部分是少数几个不可观测的公共因子的线性函数,另一部分是与公共因子无关的特殊因子。
从全部计算过程来看作R 型因子分析与作Q 型因子分析都是一样的,只不过出发点不同,R 型从相关系数矩阵出发,Q 型从相似系数阵出发都是对同一批观测数据,可以根据其所要求的目的决定用哪一类型的因子分析因子模型的性质:模型不受变量量纲的影响;因子载荷不是唯一的。
二.因子分析的数学模型设有p 个指标,则因子分析数学模型为:11111221221122221122p p p pp p p pp p X r Y r Y r Y X r Y r Y r Y X r Y r Y r Y=+++⎧⎪=+++⎪⎨⎪⎪=+++⎩ 其中,12,,,p X X X 是已标准化的可观测的评价指标。
12,,,k F F F 出现在每个指标i X 的表达式中,称为公共因子,公共因子是不可观测的,其含义要根据具体问题来解释。
i ε是各个对应指标i X 所特有的因子,故称为特殊因子,它与公共因子之间彼此独立。
ij r 是指标i X 在公共因子j F 上的系数,称为因子载荷,因子载荷ij r 的统计含义是指标i X 在公共因子j F 上的相关系数,表示i X 与j F 线性相关程度。
用矩阵形式表示为:X AF ε=+其中12(,,,)p X X X X '=,12(,,,)k F F F F '=,12(,,,)p εεεε'=,111212122212m m p p pm r r r r r r A rr r ⎛⎫⎪⎪= ⎪ ⎪ ⎪⎝⎭,A 称为因子载荷矩阵。
其统计含义是:A 中的第i 行元素12,,,i i im r r r 说明了指标i X 依赖于各个公共因子的程度。
因子分析PPT课件
3. 公共因子的方差贡献:是某公共因子对所有原变量载荷的平方和, 它
反映该公共因子对所有原始总变异的解释能力,等于因子载荷矩阵中某 一列载荷的平方和。一个因子的方差贡献越大,说明该因子就越重要。
2024/6/2
15
★ 确定公因子数目的准则
1)因素的特征值(Eigenvalues)大于或等于1;
2)因素必须符合陡阶检验(Screen Test),陡阶检
仅仅是为了化简、浓缩数据,则采用正交旋转(保持
直角90度,不允许公因子相关)。如果研究的目的是
为了得到理论上有意义的研究结果,则采用斜交旋转。
(不呈90度,允许公因子相关;有证据表明公因子之
间是相关的才用)
旋转之后,特征值发生变化,但共同度不变
2024/6/2
18
第六步:单击Scores按纽,弹出对话框
输出旋转后的 因子载荷矩阵
2024/6/2
输出载荷散点图17
★ 因子旋转
为了更好地解释因子分析解的结果,常常需要将
因子载荷转换为比较容易解释的形式(相当于相机的
调焦,使看得更清楚;一般会使各因子对应的载荷尽
可能地向0和1两极分化)。
常用的方法有正交旋转(varimax procedure)
和斜交旋转(oblique rotation),如果研究的目的
2024/6/2
1
二、因子分析思想与方法的由来
● 英国统计学家Scott 1961年对英国157个 城镇发展水平进行调查时,原始测量的变量有57 个,而通过因子分析发现,只需要用5个新的综 合变量(它们是原始变量的线性组合),就可以 解释95%的原始信息。
● 美国统计学家Stone在1947年研究国民经
09_因子分析
计算因子得分
计算因子得分是因子分析的最后一步。 因子变量确定以后,对每一样本数据, 希望得到它们在不同因子上的具体数据 值,这些数值就是因子得分,它和原变 量的得分相对应。有了因子得分,在以 后的研究中,就可针对维数少的因子得 分来进行。
菜单选项: Analyze -> Data Reduction -> Factor 研究问题 :打开数据文件“企业经济指标” , 按要求分析
因子分析有如下特点。
(1)因子变量的数量远少于原有的指标变量的数量,对 因子变量的分析能够减少分析中的计算工作量。
(2)因子变量不是对原有变量的取舍,而是根据原始变 量的信息进行重新组构,它能够反映原有变量大部分 的信息。 (3)因子变量之间不存在线性相关关系,对变量的分析 比较方便。
(4)因子变量具有命名解释性,即该变量是对某些原始 变量信息的综合和反映。
对多变量的平面数据进行最佳综合和简 化,即在保证数据信息丢失最少的原则 下,对高维变量空间进行降维处理。显 然,在一个低维空间解释系统,要比在 一个高维系统空间容易得多。
因子分析因子载荷:在因子不相关的前提下,因子载荷是变量与因
子的相关系数。它反映了因子对解释变量的重要程度。 2.变量共同度:即公共方差,变量的共同度是因子载荷矩阵 中第m行元素的平方和。 3.公共因子Fj的方差贡献:因子的方差贡献是因子载荷矩阵 第n列元素的平方和。反映了因子对原有变量总方差的解 释能力,该值越高,说明相应的因子越重要。
最简单的方法就是计算变量之间的相关系数矩阵。如 果相关系数矩阵在进行统计检验中,大部分相关系数 都小于0.3,并且未通过统计检验,那么这些变量就不 适合于进行因子分析。
9因子分析
因此我们知道,可借助因子分析法,由九 个彼此相观的变量中萃取出其背后真正影 响结果的三个主要因素:
就统计上而言,主成份分析所著重的在於如何〝转换〞原 始变项使之成为一些综合性的新指标,而其关键在『变异 数』问题。 与主成份分析不同的是,因子分析重视的是如何解变量之 间的「共变异数」(Covariance)问题,因每一位受试者的 反应变量均为一些“共同因子变量”(Common factor variate)和“唯一性变量” (Unique variate)的线性函数。 其中“共同因子变量”可产生反应变项之间的共变量(标准化 时,即为相关系数),而唯一性变量部分则只对其所属的变 项之变异数有所贡献,所以主成份分析是“变异数”导向的 方法,因子分析则是“共变异数”导向的方法。
由上表得知氣力和耐力之间有高度正相 关,而速度與協調之间也呈現高度正相 关。
因素組型(未轉軸)
由以上報表所知,第一因子解釋性較第二 因子強。而由相关矩陣得知,A、B具有高 度正相关,C、D 也具有高度正相关。我們 大致可區分成A、B一類,C、D一類,即氣 力和耐力、速度和協調分類。
因素組型(已轉軸)
以(hi’)2代替相关矩阵中的对角线上的元素,得到约化相 关矩阵。
(h1’)2 r12 r21 (h2’)2 R’= . . . . rp1 rp2 … r1p … r2p … . … . … (hp’)2
R’的前m个特征根及其对应的单位化特征向量就是主因子 解。
五、因子旋转
目的:使因子负荷两极分化,要 么接近于0,要么接近于1。 常用的旋转方法:
求样本相关系数矩阵R=(rij)p*p; 求相关系数矩阵的特征根λi (λ1,λ2,…,λp>0)和相应的标准正交的 特征向量li;
因子分析的原理及步骤
因子分析的原理及步骤因子分析是一种多变量统计方法,用于探索观测数据背后的潜在结构,包括变量之间的关系和潜在因子的存在。
在因子分析中,我们希望将多个观测变量解释为较小数量的潜在因子,这有助于简化数据和理解数据背后的结构。
因子分析的基本原理是假设观测变量通过潜在因子来解释,这些潜在因子无法直接观测到,只能通过观测变量的共同方差来间接体现。
根据这个假设,因子分析通过对观测变量之间的协方差矩阵进行分解,得到潜在因子与观测变量之间的关系,以及每个观测变量对于每个潜在因子的贡献。
因子分析的步骤如下:1. 收集数据:首先,需要收集包含多个观测变量的数据集。
这些变量可以是定量的,如身高、体重等,也可以是分类变量,如性别、职业等。
数据集应该是相对完整和可靠的。
2. 确定分析目标:在进行因子分析之前,需要明确分析的目标。
例如,我们可能希望找到最能解释原始数据的因子数目,或者找到最能准确预测观测变量的因子。
3. 数据预处理:在进行因子分析之前,需要对数据进行预处理。
常见的预处理方法包括标准化、缺失值处理等。
标准化可以使得不同变量之间的量级一致,从而减少因子分析结果的偏差。
4. 估计因子载荷:因子载荷是指每个观测变量对于每个因子的贡献。
通过估计因子载荷,我们可以了解每个观测变量与每个因子之间的关系强度。
常用的估计方法包括主成分分析和最大似然估计。
5. 确定因子数目:在因子分析中,一个重要的问题是如何确定因子的数目。
常用的方法有Kaiser准则和屏蔽图。
Kaiser准则认为,仅保留特征值大于1的因子。
屏蔽图则通过观察各个因子的特征值曲线,选择特征值明显下降的截止点。
6. 解释因子:在确定了因子数目之后,我们可以解释每个因子所代表的含义。
这需要仔细研究每个因子的载荷矩阵和观测变量之间的关系。
通常,我们将大于0.4的载荷定义为显著载荷,表示该观测变量对该因子的贡献较大。
7. 旋转因子:旋转因子是为了更好地解释因子结构而进行的。
第九章 因子分析
11
例题 9.8 Examination Scores
12
正交 因子模型
X 1 1 11F1 12 F2 1m Fm 1 X 2 2 21F1 22 F2 2 m Fm 2 Xμ LF ε ij : 为第i个变量在第j个因素上的载荷 F1 , F2 , , Fm , 1 , 2 , , p : 均为不可观测的随机变量
2 ai 式中,21 ai22 aim表示公共因子解释 X i 方差的比例,称为 X i 的 共同度,相对的 var( ei )可称为 X i的特殊度或剩余方差,表示 X i 的方差中与公共因子无关的部分。因为共同度不会大于1,因 此, 1 aij 1。由模型(6.4)还可以很容易地得到如下 X i与 X j 相关系数的关系式:rij ai1a j1 ai 2 a j 2 aim a jm (6.6)
17
Example 9.1: Verification
19 30 Σ 2 12 4 7 1 1 12 57 5 23 5 38 47 23 47 68 30 2
1 2 0 0 0 2 4 7 1 1 0 4 0 0 6 1 2 6 8 0 0 1 0 8 0 0 0 3 2 2 2 2 2 2 h1 4 1 17, 11 19 17 2 h1 F1 p 2 F2 pm Fm p
其中
X : p维随机变量 μ, Σ : mean and covariance matrix of X F : 共同因子, 同 X独立 random vector wi th m components ε : 特定误差, L :因子载荷矩阵
lecture9因子分析
0.783 0.305 0.548
x1 0.569F1 0.814F2
x2 0.783F1 0.305F2 0.548F3
x3 0.783F1 0.305F2 0.548F3
可取前两个因子F1和F2为公共因子,第一公因 子F1物价就业因子,对X的贡献为1.55。第二公因子 F2为投资因子,对X的贡献为0.85。共同度分别为1, 0.706,0.706。
p
u1 u2
up
1
0
0
u1 u2
p
up
1u1u1 2u2u2 mumum m1um1um1
pupup
1u1
2u2
1u1
pu p
p
或X μ AF
称为 F1, F2,, Fm公共因子,是不可观测的变量,
他们的系数称为因子载荷。i 是特殊因子,是不能被
前m个公共因子包含的部分。并且满足:
cov(F, ) 0, F, 即不相关;
1
D(F)
1
I
1
即 F1, F2,, Fm 互不相关,方差为1。
主成分分析:原始变量的线性组合表示新的 综合变量,即主成分;
因子分析:潜在的假想变量和随机影响变 量的线性组合表示原始变量。
第一节 因子分析模型
一、数学模型 设 X i (i 1,2,, p) p 个变量,如果表示为
Xi i ai1F1 aimFm i (m p)
2
u2
因子分析ppt课件
因子分析的类型:
1、探索性因子分析 (exploratory)
2、验证性因子分析 (confirmatory)
EFA:事先对观测数 据背后的因子个数一 无所知,用于探索因 子的维度;
CFA:研究者根据某 种理论或先验知识对 因子个数或结构提出Hale Waihona Puke 假设,研究是作为检 验假设的工具;
一、因子分析原理
1、因子分析模型
因子抽取方法的选择一般考虑因子分 析的目的和对变量方差的了解程度:
如果因子分析的目的是用最少的因子 最大程度地解释原始数据中的方差,或特 殊因子、误差带来的方差很小,则用主 成分分析法。
如果目的是确定数据结构,但不了解 变量方差的情况,则用公因子分析法。
五、解释因子(rotation)
初始因子很难解释,大多数因子都和很多变 量有关,因子的实际意义难以理解和把握。 因子旋转使因子结构更简单、更易于理解。
了变量之间的相关分。析中最重要的统计量,相当于回归系
数,是连接观测变量与公因子的纽带,
如果公因子间不相关(常作为假设),
它反映了因子与变量间线性相关程度。
公因子方差(communality)也称共同度,指 观测变量方差中由公因子决定的比例,它说明 了如果以公因子替代观测变量,原来每个变量 的信息被保留的程度。
因子分析的应用:主要目的是浓缩数据
1、寻求基本结构(summarization) 2、数据化简(data reduction)
观测变量很多且 相互存在高相关时, 描述和分析问题存 在困难,进一步统 计分析受到限制;
将大量的观测变量 化为少数的几个因 子,建立简洁的概 念系统,并可用因 子值进行进一步的 统计分析;
当公因子间不相关时,某变量 xi 的公因子方差
因子分析
因子应用
在市场调研中,研究人员关心的是一些研究指标的集成或者组合,这些概念通常是通过等级评分问题来测量 的,如利用李克特量表取得的变量。每一个指标的集合(或一组相关联的指标)就是一个因子,指标概念等级得 分就是因子得分。
因子分析
统计学方法
01 简介
03 得到因子 05 分析描述
目录
02 隐性变量 04 验证因子 06 因子应用
因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学 生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某 些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代 表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。
简介
因子分析是简化、分析高维数据的一种统计方法。假定p维随机向量满足 是q维随机变量,,满足,它的分量称为公共因子,对X的每个分量都起作用。是p维不可观测的随机向量, 满足 且,e的分量称为特殊因子,它仅对X的分量起作用。 μ和A为参数矩阵。若X满足上式,则称随机向量X具有因子结构。这时,容易算得 矩阵A称为因子载荷,其元素是第i个分量在第j个因子上的载荷。记,则有 由此可见,反映了公共因子对的影响,称为公共因子对的“贡献”。当时,表明公共因子对的影响大于特殊 因子的影响,也可以看出反映了分量对公共因子的依赖程度。 另一方面,对一个指定的公共因子,记,称为公共因子对X的贡献。的值越大,反映了公共因子对X的影响也 越大,所以是衡量公共因子重要性的一个尺度。
因子分析 PPT课件
同时假定随机向量 X 满足以下模型: X 1 a11F1 a12 F2 a1m Fm 1 X a F a F a F 2 12 1 22 2 2m m 2 X p a p1 F1 a p 2 F2 a pm Fm P 则称模型(3.1)为正交因子模型。
设 X ( X1 , X 2 ,
E( F ) 0 , Cov( F ) I m (即 F 的各分量方差为 1,且互不相关) 。又设 (1, 2 , , p ) 与 F 互不相关,且
2 E ( ) 0 , Cov( ) diag(12 ,2 , 2 , p )。
之因子分析
SPSS软件
• 因子分析(Factor Analysis)是多元统计 分析中处理降维问题的一种重要方法。变 量的共线性很多是都对分析结果具有显著 的影响。所谓降维,就是独钓共线性,剩 下的,或者合并的都是线性无关的,或者 正交的,或者垂直的。
一、什么是主成分分析和因子分析?
• 主成分分析(Principal Components Analysis)也是多元统计分析中简化数据 结构(降维问题)的一种重要方法。简化 数据结构是指将某些较复杂的数据结构通 过变量变换等方法使相互依赖的变量变成 互不相关的;或把高维空间的数据投影到 低维空间,使问题得到简化而损失的信息 市的实证 设施建设情况。
案例1
• 中国统计年鉴,2005,各地区城市市政设施数据。 变量有: • City—城市名称; • X1—年末实有道路长度(公里); • X2—年末实有道路面积(万平方公里); • X3—城市桥梁(座); • X4—城市排水管道长度(公里); • X5—城市污水日处理能力(万立方米); • X6—城市路灯(盏);
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
要点:因子内高相关、因子间低相关,简化解释维度
误区:因子分析就是抱弃一些变量,用最少的变量代替全体变量
因子分析是简化结构ห้องสมุดไป่ตู้以较少的变量说明原始总体的全部信息。
A2-b2=(a+b)(a-b)
因素分析
四、常用术语
1.因子载荷(factor loading)
因子载荷也叫因素负荷,是指因子分析模型中各公共因素和 独特因素的加权系数。通常称公共因素的系数为因素负荷。若 从p个观测变量提取m个公共因素,第i个变量zi在第j个公共因 素fj上的因子负荷记作aij(也可称fj在zi上的因子负荷), i=1,2,...p,j=1,2,...,m。因素负荷aij 是变量zi与公共因素 fj
因素分析
一、基本含义
因素分析就是用最少的因素概括和解释大量的观测事实, 建立起最简洁的,基本的概念系统,以揭示事物之间,各种 复杂现象背后本质联系的一种统计分析方法。 当因素分析的重点放在从一堆观测变量中去探索/挖掘 出潜变量的时候,称为探索性因素分析。当方法的重点放在 检验假设(即事先对潜变量的维度有了假设)时候,称为验 证性因素分析。
四、常用术语
3.因子的贡献率(contributions)
每个公因子对原始数据的解释能力,可以用该因子所解释 的总方差来衡量,通常称为该因子的贡献率,记作Vp。它等于
和该因子有关的因子负载的平方和。实际中常用相对指标来表
示,相对指标体现着公因子的相对重要性。即每个公共因子所 解释的方差占所有变量总方差的比例。设k表示观测变量数, Vp/k表示第p个因子所解释的方差比例,则V/k表示所有公因子 累积解释的方差比例,它可以用来作为因子分析结束的判断指 标。
因素分析
五、数据处理过程
因素分析 二、基本含义
因素分析假定个体在某一变量上的反应由两部分组成: 一 是 各 个 变 量 共 有 的 部 分 , 称 为 共 同 因 素 ( Common Factor);另一部分是各变量所特有的部分,称为独特因 素(Unique Factor),可用下式表示:
zij = aj1Fi1 + aj2 Fi2 +... + ajmFim + d jUij
zij是第i个体在第j观测变量上的得分,(
对观测变量的加权系数,(Fik)是个体i在因素F k上的 得分,Uij为特殊因素,dj为特殊因素对观测变量的加权系 数;N为样本容量,n为观测变量的个数,m为公因素的个 数。
j k)是因素
因素分析
三、因素分析基本过程
1.计算相关矩阵,确定因素初始载荷值(矩阵) 2.确定公因子提取的方法。(特征值法或陡坡检验法) 3.计算各公因素的载荷情况,分析特征值。 4.因素旋转。 5.计算旋转后的因子载荷矩阵。 6.因子命名与解释
因素分析
四、常用术语
4.特征值(Eigenvalues)
特征值是指每个变量在某一公共因子上的因子负荷量的平 方总和,又叫特征根。在因子分析的公共因子提取中,特征值
最大的公共因子会最先被提取,其次是次大者,最后提取的公
共因子的特征值最小。因子分析的目的,在于使因子维度简单 化,希望以最少的公共因子,能对总变异量作最大的解释,因 而提取的因愈少愈好,但提取因子之累积解释的变异量则愈大 愈好。
表示m个公共因素能解释变量zi的方差的比例数。
公共因素 h i2 测量变量 Ⅰ .761 .774 .860 .873 .731 Ⅱ -.007 .296 -.007 .013 .420
1 2 3 4 5
段落大意 反义词 词语解释 同义词 词汇量
.579 .687 .740 .660 .710
因素分析
间的相关系数,即 aij=rzi,fj。如某一公共因素在若干个观测变
量上的负荷最大,则该公共因素的实际意义可由这几个变量的 测验内容来确定,因素负荷是识别公共因素的依据。
因素分析
四、常用术语
2.公因子方差(communality)
公因子方差也叫共同度,又称公共方差,指一个观测变量 在全部公共因素上的因素负荷的平方之和。记为h2。第i个变量 zi的公共因素方差hi2=ai12+ ai22+…+aim2 ,m为公共因素数。hi2