(优选)第六讲因子分析
因子分析 PPT课件
同时假定随机向量 X 满足以下模型: X 1 a11F1 a12 F2 a1m Fm 1 X a F a F a F 2 12 1 22 2 2m m 2 X p a p1 F1 a p 2 F2 a pm Fm P 则称模型(3.1)为正交因子模型。
设 X ( X1 , X 2 ,
E( F ) 0 , Cov( F ) I m (即 F 的各分量方差为 1,且互不相关) 。又设 (1, 2 , , p ) 与 F 互不相关,且
2 E ( ) 0 , Cov( ) diag(12 ,2 , 2 , p )。
之因子分析
SPSS软件
• 因子分析(Factor Analysis)是多元统计 分析中处理降维问题的一种重要方法。变 量的共线性很多是都对分析结果具有显著 的影响。所谓降维,就是独钓共线性,剩 下的,或者合并的都是线性无关的,或者 正交的,或者垂直的。
一、什么是主成分分析和因子分析?
• 主成分分析(Principal Components Analysis)也是多元统计分析中简化数据 结构(降维问题)的一种重要方法。简化 数据结构是指将某些较复杂的数据结构通 过变量变换等方法使相互依赖的变量变成 互不相关的;或把高维空间的数据投影到 低维空间,使问题得到简化而损失的信息 市的实证 设施建设情况。
案例1
• 中国统计年鉴,2005,各地区城市市政设施数据。 变量有: • City—城市名称; • X1—年末实有道路长度(公里); • X2—年末实有道路面积(万平方公里); • X3—城市桥梁(座); • X4—城市排水管道长度(公里); • X5—城市污水日处理能力(万立方米); • X6—城市路灯(盏);
6-因子分析
上式是假定了因子模型中特殊因子是不重要的,因而 从∑的分解中忽略掉特殊因子的方差 如果考虑了特殊因子以后,协差阵为:
当∑未知,可用样本协差阵S去代替,要经过标准化 处理,则S与相关阵R相同,仍然可作上面类似的表示。 一般设 则因子载荷阵的估计 即 为样本相关阵尺的特征根, 设 m < p, 相应的标准正交化特征向量为;
所以
也是公共因子,
ቤተ መጻሕፍቲ ባይዱ
也是因子载荷阵。
因子载荷这个不唯一性,从表面上看是不利的,但后面将 会看到当因子载荷阵A的结构不够简化时,可对A实行变 换以达到简化目的,使新的因子更具有鲜明的实际意义。 从因子分析的数学模型上看,它与多变量回归分析也有类 似之处,但本质的区别是因子分析模型作为“自变量”的 F是不可观测的。 2 因子模型中公共因子、因子载荷和变量共同度的 统计意义 为了便于对因子分析计算结果做解释,将因子分析数 学模型中各个量的统计意义加以说明是十分必要的, 假定因子模型中,各个变量以及公共因子、特殊因子 都已经是标准化(均值为0,方差为1)的变量。 (1)因子载荷的统计意义 已知模型:
为了说明它的统计意义,将下式两边求方差,即
由于
已标准化了,所以有
此式说明变量 的方差由两部分组成:第一部分为共 度 它刻划全部公共因子对变量 的总方差所作的贡 献, 越接近1,说明该变量的几乎全部原始信息都被 所选取的公共因子说明了,如 则说明 的 97%的信息被m个公共因子说明了,也就是说由原始变量 空间转为因子空间转化的性质越好, 保留原来信息量
A经过Tk j ,旋转(变换)后,矩阵A=A T k j ,其元素为
其中旋转角度
仍按下面公式求得:
m个因子,每次取两个全部配对进行旋转,共需旋转
第六章 因子分析
2
4
6
8
10 t
12
14
16
18
20
主因子的概念
如果对m个原变量(x1, x2,…, xm)进行n次观测,则各主成分的时间序列可表示为:
x11 x Y LT X LT 21 xm1 x12 ... x1n y11 y x22 ... x2 n = 21 xm 2 ... xmn ym1 y12 ... y1n y22 ... y2 n ym 2 ... ymn
第1主成分y1 第2主成分y2 第m主成分ym
主成分的方差,即X的协方差阵的特征值,按照y1、y2、…、ym的顺序从大到小进 行排列。 为了分析各主成分对原变量的作用、研究原变量与各主成分的关系:
对各主成分进行标准化,使它们的方差都等于1,这时的主成分称为“主因子”。
第i个主因子就是第i个主成分yi的标准化,记为fi, 有:
为了提高因子的利用率,需要将公共信息与独立信息尽可能地分离开来,以
便采取公共信息作为新的因子变量(少于原变量的个数m)建立预报方程,从而 达到减少误差,提高预报准确率的效果。 简言之,从数量较多的因子变量中分离出数量较少的新因子,并分析原变量 与各个新因子之间的关系,这称为“因子分析”。
例: x1和x2两个变量,存在相关性,寻找它们的共同信息和独立信息,并分离。 对x1和x2做了20次观测, 如右图所示20个散点,两样本的相关系 数为0.92。 可见,第一主成分y1可以表征x1和x2的共同的成分; 所以因子分析与主成分分析(或经验正交函数分解)有密切联系。
第六章 因子分析 (1)
第六章 因子分析首先通过主因子分析(factor),得到主成分因子:Factor | Eigenvalue Difference Proportion Cumulative -------------+------------------------------------------------------------Factor1 | 4.75929 3.71841 0.6954 0.6954 Factor2 | 1.04088 0.38315 0.1521 0.8475 Factor3 | 0.65773 0.37761 0.0961 0.9436 Factor4 | 0.28012 0.09188 0.0409 0.9845 Factor5 | 0.18825 0.19040 0.0275 1.0120 Factor6 | -0.00216 0.01548 -0.0003 1.0117 Factor7 | -0.01764 0.04472 -0.0026 1.0091 Factor8 | -0.06236 . -0.0091 1.0000 从上面的分析可以看出,只有两个成分大于1大于的特征值,同时两个成分解释了全部八个变量组合的方差还多。
不重要的第2 到8个主成分在随后的分析中可以放心地省略去。
运行factor 命令后,我们可以接着运行screeplot 命令画出碎石图。
碎石图中特征值等于1处的水平线标示了保留主成分的常用分界点,同时再次强调了本例中的成分3到成分6并不重要。
Variable | Factor1 Factor2 Factor3 Factor4 Factor5 -------------+--------------------------------------------------x1 | 0.9611 0.0193 0.2412 -0.0637 0.0013 x2 | 0.9119 0.3828 -0.1409 0.0380 0.0786 x3 | 0.8626 -0.0724 0.3816 0.0792 -0.2719 x4 | 0.9395 0.3468 -0.0299 -0.0313 0.0137 x5 | 0.7542 -0.0828 -0.2302 0.3307 0.1499E i g e n v a l u e sx6 | -0.3772 0.6987 0.2923 -0.1118 0.1221x7 | -0.6108 0.0367 0.4572 0.3336 0.0883x8 | 0.5416 -0.5217 0.2929 -0.1850 0.2505--------------------------------------------------------------------------------------------Variable | Uniqueness-------------+--------------x1 | 0.0136x2 | -0.0055x3 | 0.0249x4 | -0.0049x5 | 0.2396x6 | 0.2567x7 | 0.2975x8 | 0.2518----------------------------Variable | kmo-------------+---------x1 | 0.7491x2 | 0.5483x3 | 0.4993x4 | 0.5778x5 | 0.8127x6 | 0.2958x7 | 0.5122x8 | 0.4569-------------+---------Overall | 0.5671-----------------------Variable | smc-------------+---------x1 | 0.9726x2 | 0.9965x3 | 0.9662x4 | 0.9972x5 | 0.7447x6 | 0.7280x7 | 0.6925x8 | 0.7463根据kmo and smc,数据反映良好旋转会进一步简化因子结构。
因子分析ppt课件
(3)因子旋转
通过正交旋转或斜交旋转使提取出的因子具有可解 释性。
(4)计算因子得分
通过各种方法求解各样本在各因子上的得分,为进 一步分析奠定基础。
❖ 2、因子分析前提条件——相关性分析:
分析方法主要有:
(1)计算相关系数矩阵(correlation coefficients matrix)
1 2 为p的特0 征根,
标准化特征向量,则
为u对1 , 应u2 的,, up
1
Σ = U
2
U AA + D
p
u1 u2
up
1
0
1u1u1 2u2u2
0
u1 u2
p
up
mumum m1um1um1
1u1
2u2
pu p
1u1
2
u2
p
因子分析的基本理论 ❖ 3、因子分析的目的:
因子分析的目的之一,简化变量维数。即要使因素结 构简单化,希望以最少的共同因素(公共因子),能 对总变异量作最大的解释,因而抽取得因子愈少愈好, 但抽取因子的累积解释的变异量愈大愈好。
在因子分析的公共因子抽取中,应最先抽取特征值最 大的公共因子,其次是次大者,最后抽取公共因子的 特征值最小,通常会接近0。
(3)因子分析中因子载荷的不唯一性有利于对公因子进行有效解释; 而主成分分析对提取的主成分的解释能力有限。
因子分析的基本理论
❖ 5、因子分析模型: 设 Xi (i 1,2,个,变p)量p,如果表示为
X i i ai1F1 aimFm i (m p)
X1 1 11 12
或
X
2
第六章因子分析
第六章因子分析第六章因子分析§6.1因子分析的基本原理与模型一、因子分析的基本思想基本思想:根据相关性的大小将变量分组,使得同组内变量间的相关性较高,不同组间的相关性较低。
每组变量代表一个基本结构,并用一个不可观测的综合变量形式表示,这个基本结构成为公共因子。
此时的原始变量就可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。
目的:从一些有错综复杂的问题中找出几个主要因子,每个主要因子代表原始变量间相互依赖的一种作用。
二、因子分析的基本模型常用的因子分析模型:R型因子分析和Q 型因子分析(一)R型因子分析模型R型因子分析是对变量作因子分析。
R型因子分析中的公共因子是不可直接观测但又客观存在的共同影响因素,每一个变量都可以表示成公共因子的线性函数与特殊因子之和,即:其中:称为公共因子,称为的特殊因子矩阵表达式:且满足:(1)(2),即公共因子与特殊因子是不相关的(3),即各公共因子不相关且方差为1(4),即各个特殊因子不相关,方差不要求相等模型中称为因子载荷,是第个变量在第个因子上的负荷,如果把变量看成维空间中的一个点,则表示它在坐标轴上的投影,因此矩阵称为因子载荷矩阵。
(二)Q型因子分析Q型因子分析是对样品作因子分析。
模型同上注:主成分分析与因子分析的区别主成分分析的数学模型本质上是一种线性变换,是将原始坐标变换到变异程度大的方向上去,相当于从空间上转换观看数据的的角度,突出数据变异的方向,归纳重要信息。
因子分析与主成分分析一样都属降低变量维数的方法。
但因子分析的本质是从显在变量去“提炼”潜在因子的过程。
模型中应注意的问题:(1)变量的协方差阵的分解式为即(2)因子载荷不是唯一的。
三、因子载荷阵的统计意义(一)因子载荷的统计意义对于因子模型可知的协方差若对作标准化处理,的标准差为1,且的标准差为1则(相关系数)综上可知:对于标准化后的,是的相关系数,一方面表示的依赖程度,绝对值越大,密切程度越高;另一方面也反映了变量对公共因子的相对重要性。
第六讲因子分析
第六讲因⼦分析第五讲因⼦分析在许多实际问题中,涉及的变量众多,各变量间还存在错综复杂的相关关系,这时最好能从中提取少数综合变量,这些综合变量彼此不相关,⽽且包含原变量提供的⼤部分信息。
因⼦分析就是为解决这⼀问题提供的统计分析⽅法。
以后,如⽆特别说明,都假定总体是⼀个p维变量:它的均值向量,协⽅差矩阵V=(ij)pp都存在。
第⼀节正交因⼦模型1.1 公共因⼦与特殊因⼦从总体中提取的综合变量:F1, F2, … , F m(m于是,我们有:变量X i的信息=公共因⼦可以表达部分公共因⼦不可表达部分这就是所谓因⼦模型。
⽬前,公共因⼦可以表达的部分由公共因⼦的线性组合表⽰。
即上⾯的因⼦模型可以写成以下的形式:1.2 正交因⼦模型设总体,均值向量,协⽅差矩阵。
因⼦模型有形式:其中m如果引⼊以下向量与矩阵:则因⼦模型的矩阵形式为:对于正交的因⼦模型,还要进⼀步要求:z1. 。
即有:公共因⼦是互相不相关的。
z2. 。
即:特殊因⼦和公共因⼦不相关。
1.3 因⼦载荷矩阵1.矩阵A称为因⼦载荷矩阵(component matrix),系数a ij称为变量X i在因⼦F j上的载荷(loading)。
由于特别,如果总体是标准化的,则有Var(X i)=1,从⽽有:于是:即变量X i在公共因⼦F j上的载荷a ij就是X i与F j的相关系数。
2.载荷矩阵的估计:主成分法。
主成分法是估计载荷矩阵的⼀种⽅法,由于其估计结果和变量的主成分仅相差⼀个常数倍,因此就冠以主成分法的名称。
在学到这⾥的时候,不要和主成分分析混为⼀谈。
主成分法是SPSS系统默认的⽅法,在⼀般情况下,这是⽐较好的⽅法。
以数据“应征⼈员”为例,按特征值⼤于1提取公共因⼦。
在⽤不同⽅法获得因⼦载荷时,公共因⼦对总体⽅差的贡献率以主成分法为最⾼:⽅法贡献率 %Principle components 81.476Maximum likelihood74.304Unweighted least squares74.485Principal axis factoring74.462Alpha factoring74.540Image factoring69.365关于主成分法的内容可参看任何⼀本多元统计分析书,例如:《应⽤多元统计分析》,⾼惠璇著,北京⼤学出版社,p301。
因子分析(因子评价)
因子分析一.因子分析原理因子分析是根据相关性大小把原始变量进行分组,使得同组内的变量之间相关性高,而不同组的变量之间的相关性低。
每组变量代表一个基本结构(即公共因子),并用一个不可观测的综合变量来表示。
对于所研究的某一具体问题,原始变量分解为两部分之和。
一部分是少数几个不可观测的公共因子的线性函数,另一部分是与公共因子无关的特殊因子。
从全部计算过程来看作R 型因子分析与作Q 型因子分析都是一样的,只不过出发点不同,R 型从相关系数矩阵出发,Q 型从相似系数阵出发都是对同一批观测数据,可以根据其所要求的目的决定用哪一类型的因子分析因子模型的性质:模型不受变量量纲的影响;因子载荷不是唯一的。
二.因子分析的数学模型设有p 个指标,则因子分析数学模型为:11111221221122221122p p p pp p p pp p X r Y r Y r Y X r Y r Y r Y X r Y r Y r Y=+++⎧⎪=+++⎪⎨⎪⎪=+++⎩ 其中,12,,,p X X X 是已标准化的可观测的评价指标。
12,,,k F F F 出现在每个指标i X 的表达式中,称为公共因子,公共因子是不可观测的,其含义要根据具体问题来解释。
i ε是各个对应指标i X 所特有的因子,故称为特殊因子,它与公共因子之间彼此独立。
ij r 是指标i X 在公共因子j F 上的系数,称为因子载荷,因子载荷ij r 的统计含义是指标i X 在公共因子j F 上的相关系数,表示i X 与j F 线性相关程度。
用矩阵形式表示为:X AF ε=+其中12(,,,)p X X X X '=,12(,,,)k F F F F '=,12(,,,)p εεεε'=,111212122212m m p p pm r r r r r r A rr r ⎛⎫⎪⎪= ⎪ ⎪ ⎪⎝⎭,A 称为因子载荷矩阵。
其统计含义是:A 中的第i 行元素12,,,i i im r r r 说明了指标i X 依赖于各个公共因子的程度。
因子分析方法
因子分析法1.因子分析(Factor Analysis)因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。
运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。
因子分析法与其他一些多元统计方法的区别:2.主成分分析主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。
主成分分析一般很少单独使用:a,了解数据。
(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。
(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。
1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。
2、主成分分析的重点在于解释各变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。
3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。
因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。
4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。
5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。
第6章因子分析m
m
hi2 ui2j j 1
i 1,2,, n 24
• Q型因子分析模型与R型因子分析模型的差 异体现在X1,…,Xn表示的是n个样品。
• 因子分析的目的就是通过模型X=UF+ε,以 F代替X,由于一般都要求m<p,m<n,从而 达到简化变量维数的目的。
25
• 注:在因子分析中,因子载荷阵是不唯一的。 • 证明:
若T为任意一个m m阶正交矩阵,令U * UT,F * T F,
34
可看出,公因子F1与变量X1,X2,X5关系密 切,它主要代表了这些变量的信息;公因子F2与变 量X3,X4关系密切,它主要代表了这两个变量的 信息。
35
4、变量共同度hi2 ——U的行元素平方和
变量共同度也称为公共方差(公因子方差),指观
测变量方差中由公因子决定的比例,也即原始变量Xi对
公因子依赖的程度。
• 例:五个观测变量,两个公因子的模型: X1 0.9562F1 0.2012F2 1 X 2 0.8735F1 0.2896F2 2 X 3 0.1744F1 0.8972F2 3 X 4 0.5675F1 0.7586F2 4 X 5 0.8562F1 0.3315F2 5
的公共因素,每个公因子Fj (j=1, …,m)假定至少对
两个原始变量有作用(有贡献),否则它将归入特殊 因子。
29
公因子是相互独立的不可观测的理论变 量(之所以称其为因子,是因为它是不可观 测的,即不是具体的变量,与前面的聚类分 析不同)。公共因子的含义,必须结合具体 问题的实际意义而定。
30
06-第六章因子分析
第六章 因子分析一.基本原理因子分析(Factor anslysis )是用来分析隐藏在表象背后的因子作用的一类统计模型与方法。
起源于心理度量学(Phsycholometrics ),在方法上与主成分分析有密切联系。
因子分析一般有两个用途,一是通过寻求变量的基本结构,对变量进行简化;二是通过因子得分,在因子轴构成的空间中将变量或者样品进行分类。
1.正交因子模型设x 为一个p 维可观测随机向量,假定x 受到m 个不可观测的随机因子的控制,称这m 个影响x 的因子为公共因子,若m 维随机向量f 对x 的影响是线性的,则x 与f 之间的关系可用下述模型来表述:x Lf με=++其中μ为P 维常向量,表示X 的均值;L 为p m ⨯维常数阵,L 的第I 行表示公共因子f 对X 第I 个分量i x 的影响系数;ε为P 维随机变量,表示X 中与f 无关的那一部分,称为特殊因子。
其中f 和ε都是不可观测的,假定它们满足下列条件 (1)f 和ε相互独立 (2)()0,()m E f V f I ==(3)()0,()E V εε==ψ,其中ψ(psai)为对角阵。
由于()m V f I =,即各因子之间不相关,这样的模型便称为正交因子模型。
在正交因子模型中,公共因子f 对X 的各分量都起作用,而特殊因子ε的第I 个分量只对X 的第I 个分量起作用。
L 称为载荷阵(Loading Matrix )。
如果对X 进行标准化处理,则μ为0,原式化为x Af ε=+。
A 为载荷阵。
X 的方差是由载荷阵和特殊因子的方差构成的。
即()Var X AA '=+ψ。
2.因子分析与其他多元分析方法的区别与多元回归的区别:因子分析中,各个公共因子是虚拟的,本身是未知量。
与主成分分析的区别:主成分分析本质上是一种变量变换,而因子分析则是构造出一组新的因子来对原变量进行解释。
二.计算模型1.因子载荷的含义假定在因子分析模型中,对各变量及公共因子、特殊因子均进行了标准化处理。
因子分析PPT课件
3. 公共因子的方差贡献:是某公共因子对所有原变量载荷的平方和, 它
反映该公共因子对所有原始总变异的解释能力,等于因子载荷矩阵中某 一列载荷的平方和。一个因子的方差贡献越大,说明该因子就越重要。
2024/6/2
15
★ 确定公因子数目的准则
1)因素的特征值(Eigenvalues)大于或等于1;
2)因素必须符合陡阶检验(Screen Test),陡阶检
仅仅是为了化简、浓缩数据,则采用正交旋转(保持
直角90度,不允许公因子相关)。如果研究的目的是
为了得到理论上有意义的研究结果,则采用斜交旋转。
(不呈90度,允许公因子相关;有证据表明公因子之
间是相关的才用)
旋转之后,特征值发生变化,但共同度不变
2024/6/2
18
第六步:单击Scores按纽,弹出对话框
输出旋转后的 因子载荷矩阵
2024/6/2
输出载荷散点图17
★ 因子旋转
为了更好地解释因子分析解的结果,常常需要将
因子载荷转换为比较容易解释的形式(相当于相机的
调焦,使看得更清楚;一般会使各因子对应的载荷尽
可能地向0和1两极分化)。
常用的方法有正交旋转(varimax procedure)
和斜交旋转(oblique rotation),如果研究的目的
2024/6/2
1
二、因子分析思想与方法的由来
● 英国统计学家Scott 1961年对英国157个 城镇发展水平进行调查时,原始测量的变量有57 个,而通过因子分析发现,只需要用5个新的综 合变量(它们是原始变量的线性组合),就可以 解释95%的原始信息。
● 美国统计学家Stone在1947年研究国民经
第六讲 因子分析
第五讲因子分析在许多实际问题中,涉及的变量众多,各变量间还存在错综复杂的相关关系,这时最好能从中提取少数综合变量,这些综合变量彼此不相关,而且包含原变量提供的大部分信息。
因子分析就是为解决这一问题提供的统计分析方法。
以后,如无特别说明,都假定总体是一个p维变量:它的均值向量,协方差矩阵V=(ij)pp都存在。
第一节正交因子模型1.1 公共因子与特殊因子从总体中提取的综合变量:F1, F2, … , F m(m<p)称为(总体的)公共因子。
一般来说,公共因子不可能包含总体的所有信息,每个变量X i 除了可以由公共因子解释的那部分外,总还有一些公共因子解释不了的部分,称这部分为变量X i的特殊因子,记为:i。
于是,我们有:变量X i的信息=公共因子可以表达部分公共因子不可表达部分这就是所谓因子模型。
目前,公共因子可以表达的部分由公共因子的线性组合表示。
即上面的因子模型可以写成以下的形式:1.2 正交因子模型设总体,均值向量,协方差矩阵。
因子模型有形式:其中m<p,F1,F2,…,F m称为所有变量的公共因子;i称为变量X i的特殊因子。
如果引入以下向量与矩阵:则因子模型的矩阵形式为:对于正交的因子模型,还要进一步要求:z1. 。
即有:公共因子是互相不相关的。
z2. 。
即:特殊因子和公共因子不相关。
1.3 因子载荷矩阵1.矩阵A称为因子载荷矩阵(component matrix),系数a ij称为变量X i在因子F j上的载荷(loading)。
由于特别,如果总体是标准化的,则有Var(X i)=1,从而有:于是:即变量X i在公共因子F j上的载荷a ij就是X i与F j的相关系数。
2.载荷矩阵的估计:主成分法。
主成分法是估计载荷矩阵的一种方法,由于其估计结果和变量的主成分仅相差一个常数倍,因此就冠以主成分法的名称。
在学到这里的时候,不要和主成分分析混为一谈。
主成分法是SPSS系统默认的方法,在一般情况下,这是比较好的方法。
第六章因子分析
§6.1.1 因子分析的基本思想
因子分析还可用于对变量或样品的分类处理,我们在得出 因子的表达式之后,就可以把原始变量的数据代入表达式 得出因子得分值,根据因子得分在因子所构成的空间中把 变量或样品点画出来,形象直观地达到分类的目的。
因子分析不仅仅可以用来研究变量之间的相关关系, 还可以用来研究样品之间的相关关系,通常将前者称之 为R 型因子分析,后者称之为Q 型因子分析。我们下面 着重介绍R型因子分析。
第六章 因子分分析
•§6.1 因子分析的基本理论 •§6.2 因子载荷的求解 •§6.3 因子分析的步骤与逻辑框图 •§6.4 因子分析的上机实现
第六章 因子分分析
因子分析(factor analysis)模型是主成分分析的 推广。它也是利用降维的思想,由研究原始变量相关 矩阵内部的依赖关系出发,把一些具有错综复杂关系 的变量归结为少数几个综合因子的一种多变量统计分 析方法。相对于主成分分析,因子分析更倾向于描述 原始变量之间的相关关系;因此,因子分析的出发点 是原始变量的相关矩阵。因子分析的思想始于1904年 Charles Spearman对学生考试成绩的研究。
1。F1, F2 ,, Fm 是彼此独立的公共因子,都满足均值为0,方差 为1。ei为特殊因子,与每一个公共因子均不相关且均值为0。
则ai1, ai2 ,, aim为对第 i门科目考试成绩的因子载荷。对该模型,
有: var( X i ) ai21 ai22 ai2m var(ei ) 1 (6.5)
121
cov(ε)
Σ
2 22
0 ห้องสมุดไป่ตู้
0
2 pp
第6章--因子分析
第6章--因子分析第六章因子分析一、填空题1. 因子分析常用的两种类型为 ____________ 和 ___________ 。
2. 因子分析是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现______________ 与____________ 间的相互关系。
3•因子分析就是通过寻找众多变量的______________ 来简化变量中存在的复杂关系的一种方法。
4 •因子分析是把每个原始变量分解成两个部分即____________ 、。
5 •变量共同度是指因子载荷矩阵中__________________________ 。
6 •公共因子方差与特殊因子方差之和为________ 。
7.求解因子载荷矩阵常用的方法有______________________ 和________________ &常用的因子旋转方法有 ____________________ 和__________________ 。
9. Spss中因子分析采用__________________ 命令过程。
10•变量X i的方差由两部分组成,一部分为 ___________ ,另一部分为__________二、判断题1. 在因子分析中,因子载荷阵不是唯一的。
()2. 因子载荷阵经过正交旋转后,各变量的共性方差和各个因子的贡献都发生了变化。
()3. 因子分析和主成分分析的核心思想都是降维。
()4.因子分析有两大类,R型因子分析和Q型因子分析;其中R型因子分析是从变量的相似矩阵出发,而Q型因子分析是从样品的相关矩阵出发。
()5. 特殊因子与公共因子之间是相互独立的。
()6. 变量共同度是因子载荷矩阵列元素的平方和。
()7. 公共因子的方差贡献是衡量公共因子相对重要性指标。
()8. 对因子载荷阵进行旋转的目的是使结构简化。
()三、简答题1.因子分析的基本思想是什么,它与主成分分析有什么区别和联系?2 •因子模型的矩阵形式UF ,其中:F F1, ,F m 1, , P U U ij pm请解释式中F、、U的统计意义。
06因子分析
因子分析专题§8。
1 引言因子分析是主成分分析的推广,它也是一种把多个变量化为少数几个综合变量的多元分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的相关关系.例8.1.1 Linden 对二次大战以来奥林匹克十项全能比赛的得分做了分析研究,他收集了160组数据,这十个全能项目依次为:100米跑、跳远、铅球、跳高、400米跑、110米跨栏、铁饼、撑竿跳高、标枪、1500米跑.但是总的来说基本上可归结为他们的短跑速度、爆发性臂力、爆发性腿力和耐力这四个方面,每一个方面都称为一个因子。
用1021,,,x x x 分别表示十个项目的得分,它们可以表示为含有上述四个因子的线性模型:i i i i i i i f a f a f a f a x εμ+++++=44332211,10,,2,1 =i其中4321,,,f f f f 表示4个因子,称为公因子,ij a 称为第i 个变量在第j 个因子上的载荷。
i μ是总平均,i ε是第i 项得分不能被四个公因子解释的部分,称之为特殊因子.这个模型形式上与线性回归模型几乎一样,但是它们有着本质的区别:回归模型中自变量是可以被观测得到的,而上述因子模型中的4321,,,f f f f 是不可观测的隐变量,这使得该模型理解起来较为困难;再者,两个模型的参数意义也很不相同。
例8。
1.2 为了评价高中学生将来进大学时的学习能力,抽了200名高中生进行问卷调查,共50个问题。
所有这些问题可简单地归结为阅读理解、数学水平和艺术修养这三个方面。
这也是一个因子分析模型,每一方面就是一个因子。
例8.1。
3 公司老板对48名申请工作的人进行面试,并给出申请人在15个方面所得的分数,这15个方面是:(1)申请信的形式;(2)外貌;(3)专业能力;(4)讨人喜欢的能力;(5)自信心;(6)洞察力;(7)诚实;(8)推销能力;(9)经验;(10)驾驶汽车本领;(11)抱负;(12)理解能力;(13)潜力;(14)对工作要求强烈程度(15)适应性.这些问题可以归结为如下的几个方面:申请者外露的能力,讨人喜欢的程度,申请者的经验,专业能力。
因子分析因子分析
X i ai1F1 aimFm i 两边求方差
Var( X i ) a2i1Var(F1) a2imVar(Fm ) Var(i )
1
a m
2 ij
2 i
j 1
所有的公共因子和特殊因子对变量 X i
m
的贡献为1。如果
a2 ij
j 1
非常
靠近1,
利用因子分析法对全国31个地区的竞争 力水平进行综合评价。数据文件“竞争力” 3
因子分析与回归分析不同,因子分析中的因 子是一个比较抽象的概念,而回归因子有非常明 确的实际意义;
主成分分析分析与因子分析也有不同,主成 分分析仅仅是变量变换,而因子分析需要构造因 子模型。
主成分分析:原始变量的线性组合表示新的综 合变量,即主成分;
2 i
非常小,则因子分析的效果好,从原变量空间
到公共因
子空间的转化性质好。
12
3、公共因子Fj方差贡献的统计意义
因子载荷矩阵中各列元素的平方和
Sj
a p i 1
2 ij
p
r
i 1
2
(
xi
,
Fj
)
称为Fj ( j 1,, m) 对 X i 的方差贡献和。衡量Fj的相对重
要性。
13
E(F*) E(TF) 0 E(ε) 0 Var(F*) Var(TF) TVar(F)T I
Var
(ε)
diag
(12
,
2 2
,
,
2 p
)
cov(F*,ε) E(F*ε) 0
18
第三节 因子载荷矩阵的估计方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因子 分析 的统 计意
义
假定因子模型中,准化处理
因子载荷矩阵的统计意义
变量共同度的统计意义
公因子方差贡献的统计意义
因子 载荷 矩阵 的估 计方
法
方法一:主成分方法 方法二:根据定义进行
因子 旋转
含义:
因子旋转是根据因子载荷矩阵的 不唯一性,用一个正交矩阵右乘 因子载荷矩阵,实行旋转(由线 性代数,一次正交变换,对应坐 标系的一次旋转),使旋转后的 因子载荷矩阵结构简化,以便对 公共因子进行合理的解释。
(优选)第六讲因子分析
什么 叫因 子分
析
定义解释
因子分析是主成分分析的推广和发展, 它是把具有复杂关系的多个变量(或样 品)综合为少数几个因子,并给出原始 变量与综合因子之间的相关关系的多元 统计分析方法
种类
R型因子分析(对变量进行因子分析) Q型因子分析(对样品进行因子分析)
应用意义
应用范围 应用类型
基本思想 数学模型
因子 分析 的模
型
主成 分分 析与 因子 分析 的区
别
主成分分析是一种数学变换 (正交变换)不能称为一种数 学模型;而因子分析需要构造 数学模型。
主成分的个数与原始数据个数 相等,是把原始变量变换成为 相互独立的新的变量;而因子 个数一般要求小于原始数据个 数,目的在于得到一个结构简 单的因子模型。
所谓结构简化就是使得每个变量 仅在一个公共因子上有较大的载 荷,而在其他的公共因子上的载 荷比较小。
常用的方法有:
正交旋转、斜交旋转等。最常用 的是方差最大正交旋转。
方差 最大 正交 旋转
方差最大正交旋转:
是使因子载荷矩阵中,各因子 载荷值的总方差达到最大作为 因子载荷矩阵结构简化的准则。 其中。总方差最大,而不是某 个因子方差极大。即如果第个 变量在第个公共因子上的载荷 经过“方差极大”旋转后,其 值增大或减少,意味着这个变 量在另一些公共因子上的载荷 要缩小或增大。所以“方差极 大”旋转是使载荷值按照列向0, 1两极分化,同时也包含着按行 向两极分化。
因子 得分