第六章 因子分析资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
数据化简
通过因子分析,可以找出少数的几个因子来代替原来的变 量做回归分析、聚类分析、判别分析等。
11
主成分分析与因子分析的区别
主成分分析:通过对一组变量的几个线性组合来解释 这组变量的方差和协方差结构,以达到数据的压缩和数据 的解释的目的。
若有一些指标 ,取综合指标即它们的线性组合F,当 然有很多,我们希望线性组合F包含很多的信息,即var(F) 最大,这样得到F记为F1 ,然后再找F2 , F1与 F2无关,以此 类推,我们找到了一组综合变量 F1 ,F2,… ,Fm,这组变量基 本包含了原来变量的所有信息。
化回归系数。
称为特殊因子,表示原有变量不能被因子
解释的部分,其均值为0,相当于多元回归分析 中的残差项。
2、因子分析的相关概念: (1)因子载荷:在因子不相关的前提下,因 子载荷 amn 是变量 xm 与因子 fn 的相关系数。它 反映了因子 fn 对解释变量 xm 的重要程度。 (2)变量共同度:即公共方差,变量 xm 的共 同度是因子载荷矩阵中第m行元素的平方和:
xp ap1 f1 ap2 f2 apm fm p
14
第2节 因子分析的基本内容
一、考察变量是否适合进行因子分析
1、因子分析的目的是从众多的原有变量中综合 出少数具有代表性的因子,因此它要求原有变量之 间应存在较强的相关关系。
2、变量相关程度的度量指标:先将变量标准化 (1)相关系数矩阵:计算简单相关系数,如果 大部分相关系数值均小于0.3(即为弱相关),那 么原则上这些变量是不适合进行因子分析的。 (2)反映像矩阵:主要包括反映像协方差矩阵 和反映像相关系数矩阵。
子重要性的关键指标。
因子分析的主要 应用
寻找基本结构 数据化简
9
寻找基本结构
在多元统计中,经常遇到诸多变量之间存在强相关的问题,它 会对分析带来许多困难。通过因子分析,可以找出几个较少的有实 际意义的因子,反映出原来数据的基本结构。
例如:调查汽车配件的价格中,通过因子分析从20个指标中概 括出原材料供应商、配件厂商、新进入者、后市场零部件厂商、整 车厂和消费者6个基本指标。从而找出对企业配件价格起决定性作用 的几个指标。
第六章 因子分析
1
第1节 因子分析概述
一、因子分析的意义
1、实际研究中,考察的多个变量可能存在一些 问题:
(1)分析的复杂性:变量较多虽然可以提供更 丰富的信息,但也会大大增加分析问题的复杂性 和难度。
(2)变量间的相关性:变量间信息的高度重叠 (高度相关)会影响分析结果。如果直接地削减 变量的个数,会导致信息丢失和不完整等问题。
反映像相关系数矩阵对角线上的元素为对应
变量的MSA(Measure of Sampling Adequacy)
统计量: MSAm
mn rm2n /(
r2
mn mn
mn pm2 n )
rmn 是变量 xm 与 xn 的简单相关系数,pmn 是变 量 xm 与 xn 在控制了剩余变量下的偏相关系数。
于给定的显著性水平 ,则拒绝零假设,认为相
关系数矩阵不大可能是单位阵,即原有变量适合
进行因子分析。
2 m
越小,说明变量
xm
的信
息丢失越小。
变量的共同度是评价变量信息丢失程度的重要
指标。
(3)因子的方差贡献:因子的方差贡献是 因子载荷矩阵第n列元素的平方和:
S
2 n
a p
2
m1 mn
因子的方差贡献反映了因子对原有变量总方
差的解释能力,该值越高,说明相应的因子越
重要。因子的方差贡献和方差贡献率是衡量因
hm2
a k 2
n1 mn
在变量 xm 标准化时,由于变量的方差可以表
示为
hm2
2 m
1 ,因此原有变量的方差可由两部
分解释:一部分为变量的共同度,是全部因子对
变量 xm 的方差解释说明的比例;另一部分为特 殊因子 m 的平方,是全部因子对变量 xm 的方差 不能解释说明的比例。
hm2 越大,或者说
12
主成分分析的数学模型
13
主成分分析与因子分析公式上的区别
wk.baidu.com主成分分析
y1 a11x1 a12x2 a1p xp y2 a21x1 a22x2 a2 p xp
yp ap1x1 ap2x2 app xp
因子分析(m<p)
x1 a11 f1 a12 f2 a1m fm 1 x2 a21 f1 a22 f2 a2m fm 2
如果反映像相关矩阵对角线上的元素(即
MSA)的绝对值接近于1,其他值均较小,说明 这些变量的相关性较强,适合进行因子分析。
(3)巴特利特球度检验(Bartlett’s Test of Sphericity):
零假设:相关系数矩阵是单位阵。
巴特利特球度检验统计量近似服从 2分布。 如果该统计量的观测值比较大,对应的P值小
2、因子分析:以最少的信息丢失为前提,将众 多的原有变量综合成较少的几个综合指标(称为 因子),从而降低变量的维数。
3、因子分析的特点: (1)因子个数大大少于原有变量的个数。 (2)因子能够反映原有变量绝大部分的信息。 (3)因子之间的线性关系不显著。 (4)因子具有命名解释性。
二、因子分析的数学模型和相关概念
1、因子分析的核心:用较少的、相互独立的因 子反映原有变量的绝大部分信息。
因子分析的数学模型:设有p个变量,每个变量 的均值为0,标准差为1。将每个原有变量用k个 (k<p)因子f1,f2,…,fk 的线性组合表示,即
x1 a11 f1 a12 f2 a1k fk 1
x2
a21
f1
a22
f2
a2k
fk
2
x p a p1 f1 a p2 f2 a pk fk p
独特因子
公共因子
也可用矩阵形式表示:X=AF+ε,其中,F 称 为因子。由于它们出现在每个原有变量的线性表
达式中,因此也称为公共因子。
因子可以理解为高维空间中相互垂直的k个坐 标轴,矩阵A称为因子载荷矩阵,载荷矩阵的元素 amn(m=1,2,…,p;n=1,2,…,k)称为因子载荷,是 第m个原有变量在第n个因子上的载荷。如果把变 量xm看作k维空间中的一个向量,则amn表示fn在坐 标轴 上的投影,它相当于多元回归分析中的标准
数据化简
通过因子分析,可以找出少数的几个因子来代替原来的变 量做回归分析、聚类分析、判别分析等。
11
主成分分析与因子分析的区别
主成分分析:通过对一组变量的几个线性组合来解释 这组变量的方差和协方差结构,以达到数据的压缩和数据 的解释的目的。
若有一些指标 ,取综合指标即它们的线性组合F,当 然有很多,我们希望线性组合F包含很多的信息,即var(F) 最大,这样得到F记为F1 ,然后再找F2 , F1与 F2无关,以此 类推,我们找到了一组综合变量 F1 ,F2,… ,Fm,这组变量基 本包含了原来变量的所有信息。
化回归系数。
称为特殊因子,表示原有变量不能被因子
解释的部分,其均值为0,相当于多元回归分析 中的残差项。
2、因子分析的相关概念: (1)因子载荷:在因子不相关的前提下,因 子载荷 amn 是变量 xm 与因子 fn 的相关系数。它 反映了因子 fn 对解释变量 xm 的重要程度。 (2)变量共同度:即公共方差,变量 xm 的共 同度是因子载荷矩阵中第m行元素的平方和:
xp ap1 f1 ap2 f2 apm fm p
14
第2节 因子分析的基本内容
一、考察变量是否适合进行因子分析
1、因子分析的目的是从众多的原有变量中综合 出少数具有代表性的因子,因此它要求原有变量之 间应存在较强的相关关系。
2、变量相关程度的度量指标:先将变量标准化 (1)相关系数矩阵:计算简单相关系数,如果 大部分相关系数值均小于0.3(即为弱相关),那 么原则上这些变量是不适合进行因子分析的。 (2)反映像矩阵:主要包括反映像协方差矩阵 和反映像相关系数矩阵。
子重要性的关键指标。
因子分析的主要 应用
寻找基本结构 数据化简
9
寻找基本结构
在多元统计中,经常遇到诸多变量之间存在强相关的问题,它 会对分析带来许多困难。通过因子分析,可以找出几个较少的有实 际意义的因子,反映出原来数据的基本结构。
例如:调查汽车配件的价格中,通过因子分析从20个指标中概 括出原材料供应商、配件厂商、新进入者、后市场零部件厂商、整 车厂和消费者6个基本指标。从而找出对企业配件价格起决定性作用 的几个指标。
第六章 因子分析
1
第1节 因子分析概述
一、因子分析的意义
1、实际研究中,考察的多个变量可能存在一些 问题:
(1)分析的复杂性:变量较多虽然可以提供更 丰富的信息,但也会大大增加分析问题的复杂性 和难度。
(2)变量间的相关性:变量间信息的高度重叠 (高度相关)会影响分析结果。如果直接地削减 变量的个数,会导致信息丢失和不完整等问题。
反映像相关系数矩阵对角线上的元素为对应
变量的MSA(Measure of Sampling Adequacy)
统计量: MSAm
mn rm2n /(
r2
mn mn
mn pm2 n )
rmn 是变量 xm 与 xn 的简单相关系数,pmn 是变 量 xm 与 xn 在控制了剩余变量下的偏相关系数。
于给定的显著性水平 ,则拒绝零假设,认为相
关系数矩阵不大可能是单位阵,即原有变量适合
进行因子分析。
2 m
越小,说明变量
xm
的信
息丢失越小。
变量的共同度是评价变量信息丢失程度的重要
指标。
(3)因子的方差贡献:因子的方差贡献是 因子载荷矩阵第n列元素的平方和:
S
2 n
a p
2
m1 mn
因子的方差贡献反映了因子对原有变量总方
差的解释能力,该值越高,说明相应的因子越
重要。因子的方差贡献和方差贡献率是衡量因
hm2
a k 2
n1 mn
在变量 xm 标准化时,由于变量的方差可以表
示为
hm2
2 m
1 ,因此原有变量的方差可由两部
分解释:一部分为变量的共同度,是全部因子对
变量 xm 的方差解释说明的比例;另一部分为特 殊因子 m 的平方,是全部因子对变量 xm 的方差 不能解释说明的比例。
hm2 越大,或者说
12
主成分分析的数学模型
13
主成分分析与因子分析公式上的区别
wk.baidu.com主成分分析
y1 a11x1 a12x2 a1p xp y2 a21x1 a22x2 a2 p xp
yp ap1x1 ap2x2 app xp
因子分析(m<p)
x1 a11 f1 a12 f2 a1m fm 1 x2 a21 f1 a22 f2 a2m fm 2
如果反映像相关矩阵对角线上的元素(即
MSA)的绝对值接近于1,其他值均较小,说明 这些变量的相关性较强,适合进行因子分析。
(3)巴特利特球度检验(Bartlett’s Test of Sphericity):
零假设:相关系数矩阵是单位阵。
巴特利特球度检验统计量近似服从 2分布。 如果该统计量的观测值比较大,对应的P值小
2、因子分析:以最少的信息丢失为前提,将众 多的原有变量综合成较少的几个综合指标(称为 因子),从而降低变量的维数。
3、因子分析的特点: (1)因子个数大大少于原有变量的个数。 (2)因子能够反映原有变量绝大部分的信息。 (3)因子之间的线性关系不显著。 (4)因子具有命名解释性。
二、因子分析的数学模型和相关概念
1、因子分析的核心:用较少的、相互独立的因 子反映原有变量的绝大部分信息。
因子分析的数学模型:设有p个变量,每个变量 的均值为0,标准差为1。将每个原有变量用k个 (k<p)因子f1,f2,…,fk 的线性组合表示,即
x1 a11 f1 a12 f2 a1k fk 1
x2
a21
f1
a22
f2
a2k
fk
2
x p a p1 f1 a p2 f2 a pk fk p
独特因子
公共因子
也可用矩阵形式表示:X=AF+ε,其中,F 称 为因子。由于它们出现在每个原有变量的线性表
达式中,因此也称为公共因子。
因子可以理解为高维空间中相互垂直的k个坐 标轴,矩阵A称为因子载荷矩阵,载荷矩阵的元素 amn(m=1,2,…,p;n=1,2,…,k)称为因子载荷,是 第m个原有变量在第n个因子上的载荷。如果把变 量xm看作k维空间中的一个向量,则amn表示fn在坐 标轴 上的投影,它相当于多元回归分析中的标准