第六章 全因子分析分析
06 第六章 R-Q型因子分析
X = nW
于是有
(6.24)
F=
nWU
∧−1 2
=
nF R
∧−1 2
即
(6.24)
FR =
1
F
∧−1 2
n
(6.25)
其中各记号同前文一致。 现在用图 4-9 中汇水盆地的样本为例说明R-Q型因子分析的计算与应用。由样本中 25
个样品 6 个变量作R型因子分析后得因子负载矩阵A于表 5-2。它就是R-Q型因子分析中要求 的R型负载AR。表 5-2 对应的R型因子得分矩阵F列表 5-3,由(6.25)式可求得R-Q型因子分 析中要求的Q型的负载AQ=FR,所得结果列于表 6-1。
三、R-Q 型因子分析的图示
矩阵AR和AQ都是p列的,这意味着m维变量空间和n维样品空间样品都可用一p维因子空
3
间代替,因为p<<min(n,m),故原始空间维数约简了许多。 由于下面的关系成立
AR ARΤ = W ΤW
AQ AQΤ = WW Τ
可见,变量间关系完全保留在ARARΤ中,样品间关系完全保留在AQAQΤ中。
一、R-Q 型因子分析的相似性矩阵
我们考虑用相关系数作为变量间相似性的度量,用欧氏距离作为样品间的相似性度量,并
以此建立起变量间相似性矩阵与样品间相似性矩阵的联系。设原始数据矩阵为如下的形式:
Xn×m=(xij)n×m 其中xij为样品i变量j的观测值;并对数据作如下变换,即类似与标准化变换:
(6.1)
n
j =1
j =1
∑ (xij − x j )2
i =1
(6.8)
∑m
=
(xkj − xLj ) 2
n
= hkk + hLL − 2hkL
第六章 因子分析
因此:因子也是综合变量;因子具有更 明确的指标意义;具有不同意义的因子 便于揭示事物变化的内在结构;提取少 量重要因子可以达到降维和简化分析的 作用。
(二)因子分析的一般模型:
令因子为 F(factor),当我们研究 m 个因子对实 际问题的影响时可以建立因子模型,即
X i ai1F1 ai 2 F2 aim Fm + i 。 其中的 F 是对所有
(三)基本思想:
基于对因子的认识,因子分析的基本思想就是通过变 量(或样品)的相关系数矩阵(或相似系数矩阵)内 部结构的研究,找出能控制所有变量(或样品)的少 数几个随机变量去描述多个变量(或样品)之间的相 关(或)相似关系。在分解原始变量的基础上,从中 归纳出潜在的“类别”,相关性较强的变量归为一类, 不同类间变量的相关性则较低。从而实现因子分析的 两个目的:一简化分析,二将原变量分类,对公因子 的意义作出合理可信的解释。
而进行因子分析的起点就是因子模型,我们通 过估计因子模型中的参数即因子负荷和方差对 各因子的重要程度进行衡量,并利用因子负荷 矩阵所体现的各变量或样品之间的相关程度提 取出具有明确意义的公因子F,赋予其有实际 背景的解释进而给以命名,从而达到降维和分 类的目的。
三、因子分析的数学原理。
因R型因子分析应用广泛,故本章的解释均是 以R型因子分析为对象。 (一)正交因子模型: 因子分析的一般模型为:
X 1 a11F1 a12 F2 a1m Fm 1 X 2 a21F1 a22 F2 a2 m Fm 2 X p a p1F1 a p 2 F2 a pm Fm p
i
可将上式写成简单的矩阵形式
6-因子分析
上式是假定了因子模型中特殊因子是不重要的,因而 从∑的分解中忽略掉特殊因子的方差 如果考虑了特殊因子以后,协差阵为:
当∑未知,可用样本协差阵S去代替,要经过标准化 处理,则S与相关阵R相同,仍然可作上面类似的表示。 一般设 则因子载荷阵的估计 即 为样本相关阵尺的特征根, 设 m < p, 相应的标准正交化特征向量为;
所以
也是公共因子,
ቤተ መጻሕፍቲ ባይዱ
也是因子载荷阵。
因子载荷这个不唯一性,从表面上看是不利的,但后面将 会看到当因子载荷阵A的结构不够简化时,可对A实行变 换以达到简化目的,使新的因子更具有鲜明的实际意义。 从因子分析的数学模型上看,它与多变量回归分析也有类 似之处,但本质的区别是因子分析模型作为“自变量”的 F是不可观测的。 2 因子模型中公共因子、因子载荷和变量共同度的 统计意义 为了便于对因子分析计算结果做解释,将因子分析数 学模型中各个量的统计意义加以说明是十分必要的, 假定因子模型中,各个变量以及公共因子、特殊因子 都已经是标准化(均值为0,方差为1)的变量。 (1)因子载荷的统计意义 已知模型:
为了说明它的统计意义,将下式两边求方差,即
由于
已标准化了,所以有
此式说明变量 的方差由两部分组成:第一部分为共 度 它刻划全部公共因子对变量 的总方差所作的贡 献, 越接近1,说明该变量的几乎全部原始信息都被 所选取的公共因子说明了,如 则说明 的 97%的信息被m个公共因子说明了,也就是说由原始变量 空间转为因子空间转化的性质越好, 保留原来信息量
A经过Tk j ,旋转(变换)后,矩阵A=A T k j ,其元素为
其中旋转角度
仍按下面公式求得:
m个因子,每次取两个全部配对进行旋转,共需旋转
第六章 温度因子分析
不同生态系统生产力
化,形成与此相应的植物发育节律,称为物候。 • 植物发芽、生长、现蕾、开花、结实、落叶、 休
眠等生长发育阶段的开始和结束称为物候期。 • 植物物候具有稳定性,可以用来指导林业生产。
影响物候的因素
• 纬度、经度和海拔 • 霍普金斯通过研究发现: • 在北美洲温带,每向北移动纬度1度,或向
东移动经度5度,或海拔上升124m,植物 在春天和初夏 物候会延迟4天。这一规律称 为霍普金斯定律。 • 南京和北京,纬度相差6度,桃、李开花 间 差19天;但到4、5月间,两地物候相差9天。
二、关于温度的一些生态概念
• (一)三基点温度 • 最适温度:生物生长发育或生理活动得以
正常进行的温度范围。 • 最低温度和最高温度:植物生长发育和生
理活动的低温和高温限度。 • 合称为三基点温度。
• (二)积温: 积温既能说明某一地区的热 量条件,又能说明生物各生长发育阶段或 整个生长期所需要的热量条件。
• *昼夜变温与种子萌发
•
有一些植物的种子在变温下萌发良好。
低温有利于增加氧在细胞中的溶解度;提
高透性。
• 昼夜变温与生长发育 • 较低的夜温和适宜的昼温对植物生长、开花、结
实和物质的贮藏有利。 • 云南松林:1000m 3/ha。 • 波密云杉林:2000m 3/ha。 • (二)物候 • 季节明显地区,植物适应于气候条件的节律性 变
第六章因子分析
第六章因子分析第六章因子分析§6.1因子分析的基本原理与模型一、因子分析的基本思想基本思想:根据相关性的大小将变量分组,使得同组内变量间的相关性较高,不同组间的相关性较低。
每组变量代表一个基本结构,并用一个不可观测的综合变量形式表示,这个基本结构成为公共因子。
此时的原始变量就可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。
目的:从一些有错综复杂的问题中找出几个主要因子,每个主要因子代表原始变量间相互依赖的一种作用。
二、因子分析的基本模型常用的因子分析模型:R型因子分析和Q 型因子分析(一)R型因子分析模型R型因子分析是对变量作因子分析。
R型因子分析中的公共因子是不可直接观测但又客观存在的共同影响因素,每一个变量都可以表示成公共因子的线性函数与特殊因子之和,即:其中:称为公共因子,称为的特殊因子矩阵表达式:且满足:(1)(2),即公共因子与特殊因子是不相关的(3),即各公共因子不相关且方差为1(4),即各个特殊因子不相关,方差不要求相等模型中称为因子载荷,是第个变量在第个因子上的负荷,如果把变量看成维空间中的一个点,则表示它在坐标轴上的投影,因此矩阵称为因子载荷矩阵。
(二)Q型因子分析Q型因子分析是对样品作因子分析。
模型同上注:主成分分析与因子分析的区别主成分分析的数学模型本质上是一种线性变换,是将原始坐标变换到变异程度大的方向上去,相当于从空间上转换观看数据的的角度,突出数据变异的方向,归纳重要信息。
因子分析与主成分分析一样都属降低变量维数的方法。
但因子分析的本质是从显在变量去“提炼”潜在因子的过程。
模型中应注意的问题:(1)变量的协方差阵的分解式为即(2)因子载荷不是唯一的。
三、因子载荷阵的统计意义(一)因子载荷的统计意义对于因子模型可知的协方差若对作标准化处理,的标准差为1,且的标准差为1则(相关系数)综上可知:对于标准化后的,是的相关系数,一方面表示的依赖程度,绝对值越大,密切程度越高;另一方面也反映了变量对公共因子的相对重要性。
第六章 全因子分析
10
任两列中,“--”、“-+”、“+-”、“++”四种搭配出现 的次数相等,两列间的乘积的和为0,即两列“正交”。 这种正交性使实验结果的分析有“均衡分散,整齐可比” 的特点,因而具有很多优良性质,而且很容易计算出相应的回 归方程。这种实验设计方法常称为“正交实验设计法”
(orthogonal experimental design)。
11
12
13
14
15
16
计算机(Design-Expert)计算:
17
23三因子二水平全因子实验
23三因子二水平全因子实验具有以下 特点: 3个因子(主效应); 3个二因子交互效应(AB,AC, BC);
1个三因子交互效应(ABC);
需要8次实验。 右图所示给出23实验设计示意图。
3
1
主效应和交互效应
4
5
(a)无交互作用
(b)有交互作用
6
7
2二水平全因子实验设计8 Nhomakorabea9
二水平全因子实验设计原理 二水平全因子实验采用正交表(orthogonal array)设计,
具有均衡性(balanced)与正交性(orthogonaiity)两个特点:
任一列中正负号出现次 数各占一半,即在实验 中,每个因子取低水平、 高水平次数相同,即均 衡性。
30
No 1 2 3
I/A 7.5 7.5 3.5
ton/μs 6 7.5 7.5
toff/μs 6.5 6.5 6.5
Ra1/μm 21.82 23.1 19.62
Ra2/μm 11.68 18.27 12.63
4
5 6 7 8
多元统计分析第六章 因子分析
第6章因子分析6.1 因子分析数学模型因子分析是很有用的统计分析工具,因子分析的实质就是找出少量不可观测的随机变量,用它们表示众多的可观测随机变量。
以下例子能说明因子分析的意义。
例6.1对一个班的学生,进行五门课程(力学、物理、代数、分析、统计)考试,其中力学和物理闭卷考试,代数、分析、统计开卷。
这5门功课的成绩是可观测的随机向量。
每个学生的成绩可以看成5维随机向量的一个观测,见表6-1。
表6-1 五门课程考试成绩经过一定计算(因子分析)后发现存在不可观测的随机变量:1f 、2f ,它们和51,...x x 间有关系 521542143213221212116377.1091469.9750.678264.162258.5364.721559.013358.6909.720269.564838.7523.721220.864570.8409.62v f f x v f f x v f f x v f f x v f f x +-+=+-+=+-+=+++=+++= (6.1) 其中1f 、2f 是不可观测的随机变量。
我们认为它们分别表示学生的学习能力和适应开闭卷能力,所以可分别称为学习因子和适应开闭卷因子。
(6.1)揭示了这两个因子如何影响5门功课的成绩,也揭示5门课成绩的实质:每门课的成绩由学习因子和适应开闭卷因子的线性组合,加上常数,再加上随机变量而得。
这是是很有意义的。
象例6.1那样,找出少量不可观测因子(例如1f 、2f ),并给出它们影响可观测随机变量(例如51,...x x )方式的统计分析,就是因子分析。
因子分析与主成分分析不同:主成分分析是寻求若干个可观测随机变量的少量线性组合,说明其含义;因子分析主要的目的是找出不一定可观测的潜在变量作为公共因子,并解释公共因子的意义,及如何用不可观测随机变量,计算可观测随机变量。
因子分析方法在心理学,经济,医学,生物学,教育学等方面有重要用途。
第六章 因子分析
9
寻找基本结构
在多元统计中,经常遇到诸多变量之间存在强相关的问题,它 会对分析带来许多困难。通过因子分析,可以找出几个较少的有实
际意义的因子,反映出原来数据的基本结构。
例如:调查汽车配件的价格中,通过因子分析从 20 个指标中概 括出原材料供应商、配件厂商、新进入者、后市场零部件厂商、整 车厂和消费者6个基本指标。从而找出对企业配件价格起决定性作用 的几个指标。
本包含了原来变量的所有信息。
12
主成分分析的数学模型
13
主成分分析与因子分析公式上的区别
y1 a11 x1 a12 x2 a1 p x p
主成分分析
y2 a21 x1 a22 x2 a2 p x p y p a p1 x1 a p 2 x2 a pp x p
由于umn为随机向量X的相关矩阵的特征值对 应的特征向量的分量,特征向量之间彼此正交, 实际上从X到F的转换关系是可逆的,即:
x1 11 F1 21 F2 p1 Fp x2 12 F1 22 F2 p 2 Fp x F F F 1p 1 2p 2 pp p p
1、因子分析的核心:用较少的、相互独立的因 子反映原有变量的绝大部分信息。 因子分析的数学模型:设有p个变量,每个变量 的均值为0,标准差为1。将每个原有变量用k个 (k<p)因子f1,f2,…,fk 的线性组合表示,即
x1 a11 f1 a12 f 2 a1k f k 1 x2 a21 f1 a22 f 2 a2 k f k 2 x p a p1 f1 a p 2 f 2 a pk f k p
因子分析
因子应用
在市场调研中,研究人员关心的是一些研究指标的集成或者组合,这些概念通常是通过等级评分问题来测量 的,如利用李克特量表取得的变量。每一个指标的集合(或一组相关联的指标)就是一个因子,指标概念等级得 分就是因子得分。
因子分析
统计学方法
01 简介
03 得到因子 05 分析描述
目录
02 隐性变量 04 验证因子 06 因子应用
因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学 生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某 些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代 表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。
简介
因子分析是简化、分析高维数据的一种统计方法。假定p维随机向量满足 是q维随机变量,,满足,它的分量称为公共因子,对X的每个分量都起作用。是p维不可观测的随机向量, 满足 且,e的分量称为特殊因子,它仅对X的分量起作用。 μ和A为参数矩阵。若X满足上式,则称随机向量X具有因子结构。这时,容易算得 矩阵A称为因子载荷,其元素是第i个分量在第j个因子上的载荷。记,则有 由此可见,反映了公共因子对的影响,称为公共因子对的“贡献”。当时,表明公共因子对的影响大于特殊 因子的影响,也可以看出反映了分量对公共因子的依赖程度。 另一方面,对一个指定的公共因子,记,称为公共因子对X的贡献。的值越大,反映了公共因子对X的影响也 越大,所以是衡量公共因子重要性的一个尺度。
第六讲 因子分析
第五讲 因子分析在许多实际问题中,涉及的变量众多,各变量间还存在错综复杂的相关关系,这时最好能从中提取少数综合变量,这些综合变量彼此不相关,而且包含原变量提供的大部分信息。
因子分析就是为解决这一问题提供的统计分析方法。
以后,如无特别说明,都假定总体是一个p 维变量:),...,,(21'=p X X X x它的均值向量μ=)(x E ,协方差矩阵V =(σij )p ⨯p 都存在。
第一节 正交因子模型1.1 公共因子与特殊因子从总体中提取的综合变量:F 1, F 2, … , F m (m <p )称为(总体的)公共因子。
一般来说,公共因子不可能包含总体的所有信息,每个变量X i 除了可以由公共因子解释的那部分外,总还有一些公共因子解释不了的部分,称这部分为变量X i 的特殊因子,记为:εi 。
于是,我们有:变量X i 的信息=公共因子可以表达部分+公共因子不可表达部分这就是所谓因子模型。
目前,公共因子可以表达的部分由公共因子的线性组合表示。
即上面的因子模型可以写成以下的形式:p i F a F a F a X i m im i i i i ,...,2,1,2211=++++=-εμ1.2 正交因子模型设总体),...,,(21'=pX X X x ,均值向量μ=)(x E ,协方差矩阵p p V x Va r ⨯=)( 。
因子模型有形式:其中m<p ,F 1,F 2,…,F m 称为所有变量的公共因子;εi 称为变量X i 的特殊因子。
如果引入以下向量与矩阵:),...,,(,),...,,(2121'='=p m F F F F εεεε⎪⎪⎪⎪⎪⎭⎫⎝⎛=pm p p m m a a a a a a a a a A212222111211则因子模型的矩阵形式为:εμ+=-F A x 对于正交的因子模型,还要进一步要求:z 1. m m I F Var F E ⨯==)(,0)(。
06 第六章 R-Q型因子分析
-.156
19
-.180
-.104
7
-.142
-.180
20
-.116
.010
8
-.150
-.220
21
-.118
-.030
9
-.054
-.138
22
-.090
.640
10
-.120
-.012
23
.056
1.290
11
-.126
-.246
24
-.110
.134
12
-.012
-.160
25
.082
.124
R-Q 型因子分析是一种广义概念,它可能包括不同的方法。例如周蒂(1985)提到用主分 析可作为一种 R-Q 式因子分析方法,但这一方法至今未被重视。另一种方法是对应分析,或称 对应因子分析,这是目前用得最多的方法。这两种方法都有一定理论基础,在效果上各有特点。 本章主要介绍这两种方法的基本思想、计算方法与应用,更详细的论述可参考专门性文献。
§2 对应分析
对应分析也称作对应因子分析,它也是一种 R-Q 型因子分析。对应分析的理论比较复 杂,在此仅简要介绍其基本原理与计算方法,并给出计算实例。
对应分析的基本思路与上述 R-Q 型因子分析类似,目的在于同时揭示样品与样品、变 量与变量、样品与变量间的相互关系,并用作图方法将这种关系表现出来,因此也将原始的 m 或 n 维空间压缩为同一 p 维(p<<min(m,n))的因子空间。
(6.4)
1
∑ ∑ hkL =
m
(xkj − x j )(xLj − x j ) = n
m
xkj xLj
− x j xkj
第6章因子分析m
m
hi2 ui2j j 1
i 1,2,, n 24
• Q型因子分析模型与R型因子分析模型的差 异体现在X1,…,Xn表示的是n个样品。
• 因子分析的目的就是通过模型X=UF+ε,以 F代替X,由于一般都要求m<p,m<n,从而 达到简化变量维数的目的。
25
• 注:在因子分析中,因子载荷阵是不唯一的。 • 证明:
若T为任意一个m m阶正交矩阵,令U * UT,F * T F,
34
可看出,公因子F1与变量X1,X2,X5关系密 切,它主要代表了这些变量的信息;公因子F2与变 量X3,X4关系密切,它主要代表了这两个变量的 信息。
35
4、变量共同度hi2 ——U的行元素平方和
变量共同度也称为公共方差(公因子方差),指观
测变量方差中由公因子决定的比例,也即原始变量Xi对
公因子依赖的程度。
• 例:五个观测变量,两个公因子的模型: X1 0.9562F1 0.2012F2 1 X 2 0.8735F1 0.2896F2 2 X 3 0.1744F1 0.8972F2 3 X 4 0.5675F1 0.7586F2 4 X 5 0.8562F1 0.3315F2 5
的公共因素,每个公因子Fj (j=1, …,m)假定至少对
两个原始变量有作用(有贡献),否则它将归入特殊 因子。
29
公因子是相互独立的不可观测的理论变 量(之所以称其为因子,是因为它是不可观 测的,即不是具体的变量,与前面的聚类分 析不同)。公共因子的含义,必须结合具体 问题的实际意义而定。
30
06-第六章因子分析
第六章 因子分析一.基本原理因子分析(Factor anslysis )是用来分析隐藏在表象背后的因子作用的一类统计模型与方法。
起源于心理度量学(Phsycholometrics ),在方法上与主成分分析有密切联系。
因子分析一般有两个用途,一是通过寻求变量的基本结构,对变量进行简化;二是通过因子得分,在因子轴构成的空间中将变量或者样品进行分类。
1.正交因子模型设x 为一个p 维可观测随机向量,假定x 受到m 个不可观测的随机因子的控制,称这m 个影响x 的因子为公共因子,若m 维随机向量f 对x 的影响是线性的,则x 与f 之间的关系可用下述模型来表述:x Lf με=++其中μ为P 维常向量,表示X 的均值;L 为p m ⨯维常数阵,L 的第I 行表示公共因子f 对X 第I 个分量i x 的影响系数;ε为P 维随机变量,表示X 中与f 无关的那一部分,称为特殊因子。
其中f 和ε都是不可观测的,假定它们满足下列条件 (1)f 和ε相互独立 (2)()0,()m E f V f I ==(3)()0,()E V εε==ψ,其中ψ(psai)为对角阵。
由于()m V f I =,即各因子之间不相关,这样的模型便称为正交因子模型。
在正交因子模型中,公共因子f 对X 的各分量都起作用,而特殊因子ε的第I 个分量只对X 的第I 个分量起作用。
L 称为载荷阵(Loading Matrix )。
如果对X 进行标准化处理,则μ为0,原式化为x Af ε=+。
A 为载荷阵。
X 的方差是由载荷阵和特殊因子的方差构成的。
即()Var X AA '=+ψ。
2.因子分析与其他多元分析方法的区别与多元回归的区别:因子分析中,各个公共因子是虚拟的,本身是未知量。
与主成分分析的区别:主成分分析本质上是一种变量变换,而因子分析则是构造出一组新的因子来对原变量进行解释。
二.计算模型1.因子载荷的含义假定在因子分析模型中,对各变量及公共因子、特殊因子均进行了标准化处理。
第六讲 因子分析
第五讲因子分析在许多实际问题中,涉及的变量众多,各变量间还存在错综复杂的相关关系,这时最好能从中提取少数综合变量,这些综合变量彼此不相关,而且包含原变量提供的大部分信息。
因子分析就是为解决这一问题提供的统计分析方法。
以后,如无特别说明,都假定总体是一个p维变量:它的均值向量,协方差矩阵V=(ij)pp都存在。
第一节正交因子模型1.1 公共因子与特殊因子从总体中提取的综合变量:F1, F2, … , F m(m<p)称为(总体的)公共因子。
一般来说,公共因子不可能包含总体的所有信息,每个变量X i 除了可以由公共因子解释的那部分外,总还有一些公共因子解释不了的部分,称这部分为变量X i的特殊因子,记为:i。
于是,我们有:变量X i的信息=公共因子可以表达部分公共因子不可表达部分这就是所谓因子模型。
目前,公共因子可以表达的部分由公共因子的线性组合表示。
即上面的因子模型可以写成以下的形式:1.2 正交因子模型设总体,均值向量,协方差矩阵。
因子模型有形式:其中m<p,F1,F2,…,F m称为所有变量的公共因子;i称为变量X i的特殊因子。
如果引入以下向量与矩阵:则因子模型的矩阵形式为:对于正交的因子模型,还要进一步要求:z1. 。
即有:公共因子是互相不相关的。
z2. 。
即:特殊因子和公共因子不相关。
1.3 因子载荷矩阵1.矩阵A称为因子载荷矩阵(component matrix),系数a ij称为变量X i在因子F j上的载荷(loading)。
由于特别,如果总体是标准化的,则有Var(X i)=1,从而有:于是:即变量X i在公共因子F j上的载荷a ij就是X i与F j的相关系数。
2.载荷矩阵的估计:主成分法。
主成分法是估计载荷矩阵的一种方法,由于其估计结果和变量的主成分仅相差一个常数倍,因此就冠以主成分法的名称。
在学到这里的时候,不要和主成分分析混为一谈。
主成分法是SPSS系统默认的方法,在一般情况下,这是比较好的方法。
第六章因子分析
§6.1.1 因子分析的基本思想
因子分析还可用于对变量或样品的分类处理,我们在得出 因子的表达式之后,就可以把原始变量的数据代入表达式 得出因子得分值,根据因子得分在因子所构成的空间中把 变量或样品点画出来,形象直观地达到分类的目的。
因子分析不仅仅可以用来研究变量之间的相关关系, 还可以用来研究样品之间的相关关系,通常将前者称之 为R 型因子分析,后者称之为Q 型因子分析。我们下面 着重介绍R型因子分析。
第六章 因子分分析
•§6.1 因子分析的基本理论 •§6.2 因子载荷的求解 •§6.3 因子分析的步骤与逻辑框图 •§6.4 因子分析的上机实现
第六章 因子分分析
因子分析(factor analysis)模型是主成分分析的 推广。它也是利用降维的思想,由研究原始变量相关 矩阵内部的依赖关系出发,把一些具有错综复杂关系 的变量归结为少数几个综合因子的一种多变量统计分 析方法。相对于主成分分析,因子分析更倾向于描述 原始变量之间的相关关系;因此,因子分析的出发点 是原始变量的相关矩阵。因子分析的思想始于1904年 Charles Spearman对学生考试成绩的研究。
1。F1, F2 ,, Fm 是彼此独立的公共因子,都满足均值为0,方差 为1。ei为特殊因子,与每一个公共因子均不相关且均值为0。
则ai1, ai2 ,, aim为对第 i门科目考试成绩的因子载荷。对该模型,
有: var( X i ) ai21 ai22 ai2m var(ei ) 1 (6.5)
121
cov(ε)
Σ
2 22
0 ห้องสมุดไป่ตู้
0
2 pp
第6章--因子分析
第6章--因子分析第六章因子分析一、填空题1. 因子分析常用的两种类型为 ____________ 和 ___________ 。
2. 因子分析是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现______________ 与____________ 间的相互关系。
3•因子分析就是通过寻找众多变量的______________ 来简化变量中存在的复杂关系的一种方法。
4 •因子分析是把每个原始变量分解成两个部分即____________ 、。
5 •变量共同度是指因子载荷矩阵中__________________________ 。
6 •公共因子方差与特殊因子方差之和为________ 。
7.求解因子载荷矩阵常用的方法有______________________ 和________________ &常用的因子旋转方法有 ____________________ 和__________________ 。
9. Spss中因子分析采用__________________ 命令过程。
10•变量X i的方差由两部分组成,一部分为 ___________ ,另一部分为__________二、判断题1. 在因子分析中,因子载荷阵不是唯一的。
()2. 因子载荷阵经过正交旋转后,各变量的共性方差和各个因子的贡献都发生了变化。
()3. 因子分析和主成分分析的核心思想都是降维。
()4.因子分析有两大类,R型因子分析和Q型因子分析;其中R型因子分析是从变量的相似矩阵出发,而Q型因子分析是从样品的相关矩阵出发。
()5. 特殊因子与公共因子之间是相互独立的。
()6. 变量共同度是因子载荷矩阵列元素的平方和。
()7. 公共因子的方差贡献是衡量公共因子相对重要性指标。
()8. 对因子载荷阵进行旋转的目的是使结构简化。
()三、简答题1.因子分析的基本思想是什么,它与主成分分析有什么区别和联系?2 •因子模型的矩阵形式UF ,其中:F F1, ,F m 1, , P U U ij pm请解释式中F、、U的统计意义。
第6章 因子分析法
数学模型
因子 分析 的模 型
为什么要旋转因子 建立了因子分析模型的目的不仅仅 要找出公共因子以及对变量进行分 组,更重要的要知道每个公共因子的 意义,以便进行进一步的分析,如果 每个公共因子的含义不清,则不便于 进行实际背景的解释。由于因子载荷 阵是不惟一的,所以应该对因子载荷 阵进行旋转。使因子载荷阵的结构简 化,使载荷矩阵中每列或行的元素平 方值向0和1两极分化。
几个重要概念:
(1). 某个因子与某个原变量的相关系数,主要反映该公共 (1).因子载荷: 因子载荷: 某个因子与某个原变量的相关系数,主要反映该公共
因子对相应原变量的贡献力大小。 因子对相应原变量的贡献力大小。
(2). 对某一个原变量来说,其在所有因子上的载荷的平 (2).变量共同度: 变量共同度: 对某一个原变量来说,其在所有因子上的载荷的平
KMO统计量 (2)
生育率的影响因素分析
生育率受社会、经济、文化、计划生育政策等很多 因素影响,但这些因素对生育率的影响并不是完全独立 的,而是交织在一起,如果直接用选定的变量对生育率 进行多元回归分析,最终结果往往只能保留两三个变量,其他变 量的信息就损失了。因此,考虑用因子分析的方法,找出变量 间的数据结构,在信息损失最少的情况下用新生成的因子对生 育率进行分析。 选择的变量有:多子率、综合节育率、初中以上文化程度比 例、城镇人口比例、人均国民收入。下表是1990年中国30个 省、自治区、直辖市的数据。
没有旋转的因子结构 Factor1 x1 x2 x3 x4 x5 -0.76062 0.56898 0.89184 0.87066 0.89076 Factor2 0.55316 -0.76662 0.25374 0.34618 0.36962