因子分析ppt课件分解
合集下载
因子分析-PPT

小或增大。所以“方差极大” 旋转就是使载荷值按照列向0,1 两极分化,同时也包含着按行向 两极分化。
因子 得分
因子分析
什么 叫因 子分
析
定义解释
因子分析就是主成分分析得推广和发展, 她就是把具有复杂关系得多个变量(或样 品)综合为少数几个因子,并给出原始变量 与综合因子之间得相关关系得多元统计 分析方法
种类
R型因子分析(对变量进行因子分析) Q型因子分析(对样品进行因子分析)
应用意义
应用范围
表示得形式不同。
因子 分析 得统 计意
义
假定因子模型中,各个变量、 公共因子、特殊因子都已经进 行了标准化处理
因子载荷矩阵得统计意义
变量共同度得统计意义
公因子方差贡献得统计意义
因子 载荷 矩阵 得估 计方
法
方法一:流
应用类型
基本思想 数学模型
因子 分析 得模
型
主成 分分 析与 因子 分析 得区
别
主成分分析就是一种数学变换 (正交变换)不能称为一种数学 模型;而因子分析需要构造数 学模型。
主成分得个数与原始数据个数 相等,就是把原始变量变换成 为相互独立得新得变量;而因 子个数一般要求小于原始数据 个数,目得在于得到一个结构 简单得因子模型。
可以互相讨论下,但要小声点
因子 旋转
含义:
因子旋转就是根据因子载荷矩阵 得不唯一性,用一个正交矩阵右乘 因子载荷矩阵,实行旋转(由线性代 数,一次正交变换,对应坐标系得一 次旋转),使旋转后得因子载荷矩阵 结构简化,以便对公共因子进行合 理得解释。
所谓结构简化就就是使得每个变 量仅在一个公共因子上有较大得 载荷,而在其她得公共因子上得载 荷比较小。
常用得方法有:
因子 得分
因子分析
什么 叫因 子分
析
定义解释
因子分析就是主成分分析得推广和发展, 她就是把具有复杂关系得多个变量(或样 品)综合为少数几个因子,并给出原始变量 与综合因子之间得相关关系得多元统计 分析方法
种类
R型因子分析(对变量进行因子分析) Q型因子分析(对样品进行因子分析)
应用意义
应用范围
表示得形式不同。
因子 分析 得统 计意
义
假定因子模型中,各个变量、 公共因子、特殊因子都已经进 行了标准化处理
因子载荷矩阵得统计意义
变量共同度得统计意义
公因子方差贡献得统计意义
因子 载荷 矩阵 得估 计方
法
方法一:流
应用类型
基本思想 数学模型
因子 分析 得模
型
主成 分分 析与 因子 分析 得区
别
主成分分析就是一种数学变换 (正交变换)不能称为一种数学 模型;而因子分析需要构造数 学模型。
主成分得个数与原始数据个数 相等,就是把原始变量变换成 为相互独立得新得变量;而因 子个数一般要求小于原始数据 个数,目得在于得到一个结构 简单得因子模型。
可以互相讨论下,但要小声点
因子 旋转
含义:
因子旋转就是根据因子载荷矩阵 得不唯一性,用一个正交矩阵右乘 因子载荷矩阵,实行旋转(由线性代 数,一次正交变换,对应坐标系得一 次旋转),使旋转后得因子载荷矩阵 结构简化,以便对公共因子进行合 理得解释。
所谓结构简化就就是使得每个变 量仅在一个公共因子上有较大得 载荷,而在其她得公共因子上得载 荷比较小。
常用得方法有:
因子分析方法ppt课件

10
因子分析数学模型中几个相关概念
举例说明:
11
12
因子分析的五大基本步骤
第一步:因子分析的前提条件
由于因子分析的主要任务之一是对原有变量进行浓缩,即将 原有变量中的信息重叠部分提取和综合成因子,进而最终实 现减少变量个数的目的。因此它要求原有变量之间应存在较 强的相关关系。否则,如果原有变量相互独立,相关程度很 低,不存在信息重叠,它们不可能有共同因子,那么也就无 法将其综合和浓缩,也就无需进行因子分析。本步骤正是希 望通过各种方法分析原有变量是否存在相关关系,是否适合 进行因子分析。
2
因子分析的基本模型
因子分析模型中,假定每个原始变量由两部分组成: 共同因子和唯一因子。 共同因子是各个原始变量所共有的因子,解释变 量之间的相关关系。
唯一因子顾名思义是每个原始变量所特有的因子, 表示该变量不能被共同因子解释的部分。原始变量 与因子分析时抽出的共同因子的相关关系用因子负 荷表示。
18
第四步:决定因素与命名
• 转轴后,要决定因素数目,选取较少因素 层面,获得较大的解释量。在因素命名与 结果解释上,必要时可将因素计算后之分 数存储,作为其它程序分析之输入变量。
19
第五步:计算各样本的因子得分
• 因子分析的最终目标是减少变量个数,以 便在进一步的分析中用较少的因子代替原 有变量参与数据建模。本步骤正是通过各 种方法计算各样本在各因子上的得分,为 进一步的分析奠定基础。
因子分析方法
1
因子分析的基本概念
因子分析的概念 就是在尽可能不损失信息或少损失信息的情况下,将多个变量减少为 少数几个潜在的因子。也就是用少数几个因子来描述许多指标或因素之 间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方 法 主成分分析(Principal component analysis): 是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标 变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相 关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少 变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信 息。 两者关系:主成分分析(PCA)和因子分析(FA)是两种把变量维数降 低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子 分析的一个特例
6-2因子分析ppt课件

xi i1F1 i2F2 i3F3 i
i 1,,24
称 F1、F2、F3 是不可观测的潜在因子。24个变量 共享这三个因子,但是每个变量又有自己的个性, 不被包含的部分 i ,称为特殊因子。
3
注:
因子分析与回归分析不同,因子分析中的因 子是一个比较抽象的概念,而回归因子有非常明 确的实际意义;
1
a m
2 ij
2 i
j 1
统计意义: 所有的公共因子和特殊因子对变量
Xi
的贡献为1。如果
m
a2 ij
非常
j 1
靠近1,
2非常小,则因子分析的效果好,从原变量空间到公共因
i
子空间的转化性质好。
10
3、公共因子Fj方差贡献的统计意义
11
§ 3 因子旋转(正交变换)
一、为什么要旋转因子 建立了因子分析数学目的不仅仅要找出公共因子以 及对变量进行分组,更重要的要知道每个公共因子的 意义,以便进行进一步的分析,如果每个公共因子的 含义不清,则不便于进行实际背景的解释。由于因子 载荷阵是不惟一的,所以应该对因子载荷阵进行旋转。 目的是使因子载荷阵的结构简化,使载荷矩阵每列或 行的元素平方值向0和1两极分化。
1
D(F)
1
I
1
即 F1, F2,, Fm 互不相关,方差为1。
7
2 1
D(
)
2 2
2 p
即互不相关,方差不一定相等,
i
~
N
(0,
2 i
心理统计SPSS-第九章 因子分析PPT课件

第六步:点击“Options”设置因子载荷系数的显示格式:
(1) 选中“Sorted by size”,则因子载荷系数按照大小顺序排 列,并构成矩阵,使得在同一因子上具有较高载荷的变量排在一 起,便于得到结论;
(2) 选中“Suppress absolute values less than:”并在其后的方 格中输入一个0~1间的一个数,则因子载荷矩阵中就不再显示那 些小于这个数值的载荷系数了,而只显示那些比此数值大的载荷 值,从而使因子所解释的主要变量一目了然。
出发点
13 15 17 17 16 16 16 18 15 20 14 18 15 12 14 13 15 15 18 13
工作投入
18 16 14 16 16 17 20 17 19 14 14 16 17 14 15 18 16 17 15 18
发展机会
16 18 17 19 18 18 15 18 19 18 16 18 15 14 16 17 14 16 17 16
在相关基础上可计算三个用于判断因子分析适合度的指标: 巴特利特球形检验(Bartlett Test of Sphericity); KMO(Kaiser-Meyer-Olkin)检验。
巴特利特球形检验(Bartlett Test of Sphericity)
该检验首先假设变量相关矩阵为单位阵(对角线为1、非对 角线为0),然后检验实际相关矩阵与此差异性。如果差异性显 著,则拒绝单位阵假设 ,即认为原变量间的相关性显著 ,适合 于作因子分析,否则不能作因子分析。
四、因子分析的实例分析
对20名大学生进行的有关价值观的测验,包括9个项目,测试 结果如下页所示。要求根据这9项内容进行因子分析,得到维度较 少的几个因子。
《因子分析法预测》课件

因子提取
因子提取是因子分析的关键步骤,通过数学方法将多个变量提取成少数几个因子,这些因子能够反映 原始变量的主要信息。
常用的因子提取方法有主成分分析、最大似然法等。
因子解释
因子解释是对提取出的因子进行解释 ,通过旋转矩阵等方法将因子与原始 变量建立联系,明确因子的含义。
解释时需要结合专业知识,对因子的 含义进行合理的解释和命名。
感谢您的观看
THANKS
信息浓缩
通过提取公因子,可以浓缩信息,反映原始 变量之间的相关关系。
稳健性高
在处理异常值或缺失值时,因子分析法的稳 健性较高。
缺点
依赖原始变量
因子分析法的结果很大程度上依赖于原始变 量的选择和数量。
因子解释的主观性
对因子的解释可能存在主观性,不同的人可 能对同一组数据得出不同的解释。
无法处理高度相关变量
因子得分计算
因子得分计算是根据因子的权重和原始变量的值计算出每个样本的因子得分,为后续的分析和预测提供依据。
可以通过回归分析、加权平均等方法计算因子得分。
04 因子分析法的优缺点
优点
降维性
因子分析法可以将多个变量通过少数几个因 子表示,简化数据结构。
解释性强
因子分析法能够提供清晰的因子结构,有助 于理解数据背后的驱动因素。
高消费者的满意度和忠诚度。
案例四:产品组合优化
总结词
因子分析法可以帮助企业优化产品组合,提 高产品线的协同效应和市场竞争力。
详细描述
产品组合优化是企业提高市场竞争力的重要 手段。通过因子分析法,企业可以对现有产 品线进行全面分析,了解各产品之间的关联 度和差异性。在此基础上,企业可以优化产 品组合,提高产品线的协同效应和市场竞争 力。同时,企业还可以发现新的产品机会,
因子分析ppt课件

xi ai1 f1 ai2 f2 ... ui
特殊因子(unique factor)观测变量所
特有的因子,表示
公因子(common因fa子ct负or载s)(是factor load该in变gs量):不表能示被i公个因 观测变量所共有的变因量子在,第解j个释公因子上子的所负解载释,的是部因分子。
因子抽取方法的选择一般考虑因子分 析的目的和对变量方差的了解程度:
如果因子分析的目的是用最少的因子 最大程度地解释原始数据中的方差,或特 殊因子、误差带来的方差很小,则用主 成分分析法。
如果目的是确定数据结构,但不了解 变量方差的情况,则用公因子分析法。
五、解释因子(rotation)
初始因子很难解释,大多数因子都和很多变 量有关,因子的实际意义难以理解和把握。 因子旋转使因子结构更简单、更易于理解。
当公因子间不相关时,某变量 xi 的公因子方差
h2i
a2i1
a2i2
...
a
பைடு நூலகம்
2 im
即等于与该变量有关的公因子负载的平方和。
因子贡献率(contributions) 表示每个公因子对数据的解释能力, 它等于和该因子有关的因子负载的平 方和,能衡量公因子的相对重要性。
公因子个数 ≤ 观测变量数
能代表观测变量较多信息的公因子是 研究感兴趣的;求因子解时,第一个因 子代表信息最多,随后的因子代表性逐 渐衰减。
0.6以上,差; 0.5,很差;0.5以下不能接受;
KMO 用于检测变量之间的简单相关系数和偏 相关系数的相对大小,取值在0--1间,一般认 为KMO在0.9以上很适合做因子分析,0.8以上 比较适合做因子分析;
Bartlett's 球形检验虚无假设“相关矩 阵是单位矩阵”,拒绝该假设(P<.001)表明 数据适合进行因子分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6、因子分析模型中的几个重要统计量的意义: (1)因子负荷量(或称因子载荷)----是指因子结
构中原始变量与因子分析时抽取出的公共因子的相 关程度。
x* i i1F 1 i2F 2 imF m i
Cov(x , Fj ) cov( ik Fk i , Fj )
x4=三角
x5=解析几何 特征值 G
0.841
0.833 3.113 62.26%
0.444
0.434 1.479 29.58%
0.904
0.882 4.959 91.85%
0.096
0.118 0.409
方差贡献率 (变异量)
F1 体现逻辑思维和运算能力,F2 体现空间思维和推理能力
因子分析的基本理论
因子分析的基本理论
例:在企业形象或品牌形象的研究中,消费者可 以通过一个有24个指标构成的评价体系,评价百 货商场的24个方面的优劣。
但消费者主要关心的是三个方面,即商店的环境、商店的服务 和商品的价格。因子分析方法可以通过24个变量,找出反映商 店环境、商店服务水平和商品价格的三个潜在的因子,对商店 进行综合评价。而这三个公共因子可以表示为:
1 u1
2 u 2
2 2 ˆ diag ( ˆ12 , ˆ2 ˆp 其中D ,, )
2 ˆ sii aij 2 i j 1
m
上式有一个假定,模型中的特殊因子是不重要的,因 而从的分解中忽略了特殊因子的方差。
(2)基于因子分析模型的主轴因子法Principal
ˆ ˆ +D ˆ u u u u u u D ˆ Σ AA 1 1 1 2 2 2 m m m
1 u1 2 u 2 ˆ ˆ D ˆ AA ˆ m u m D pm p u m m p
直接求R*的前p个特征根和对应的正交特征向 量。得如下的矩阵:
* * * * * A 1* u1 2 u2 p up * R*特征根:1* p 0
1u1
u1 0 u 2 p u p
2 u 2
1u1 u 2 2 p u p u p p
上式给出的表达式是精确的,然而,它实际上是毫无 价值的,因为我们的目的是寻求用少数几个公共因子 解释,故略去后面的p-m项的贡献,有:
因子分析的基本理论
5、因子分析模型: 设 X i (i 1,2,, p ) p 个变量,如果表示为
X i i ai1F1 aim Fm i
X 1 1 11 X 2 2 21 或 X p p p1
(3)巴特利特球度检验(Bartlett test of sphericity )
该检验以原有变量的相关系数矩阵为出发点,其零 假设H0是:相关系数矩阵为单位矩阵,即相关系数矩 阵主对角元素均为1,非主对角元素均为0。(即原始 变量之间无相关关系)。
(4)KMO(Kaiser-Meyer-Olkin)检验
axis factoring
是对主成分方法的修正,假定我们首先对变量进 行标准化变换。则 R=AA’+D R*=AA’=R-D 2 * * h 称R 为约相关矩阵,R 对角线上的元素是 i ,而不是1。
ˆ2 r r h 1 12 1p 2 ˆ r r h 2 2p ˆ 21 R R - D ˆ2 rp1 rp 2 h p
3、因子提取和因子载荷矩阵的求解:
因子载荷矩阵求解的方法: (1)基于主成分模型的主成分分析法 (2)基于因子分析模型的主轴因子法 (3)极大似然法 (4)最小二乘法 (5)a因子提取法 (6)映象分析法
(1)基于主成分模型的主成分分析法Principal components
p 的均值为,协方差为,
即互不相关,方差不一定相等, i ~ N (0,。 i2 ) 满足以上条件的,称为正交因子模型.
如果(2)不成立,即 D( F ) I ,各公共因子之间不独立, 则因子分析模型为斜交因子模型.
因子分析案例
公因子F1 x1=代数1 x2=代数2 x3=几何 0.896 0.802 0.516 公因子F2 0.341 0.496 0.855 共同度hi 0.919 0.889 0.997 特殊因子δi 0.081 0.111 0.003
(m p)
12 22
p2
1m F1 1 2 m F2 2 F pm m p
或X μ AF
称为 F1 , F2 ,, Fm 公共因子,是不可观测的变量, 他们的系数称为因子载荷。 i 是特殊因子,是不能被 前m个公共因子包含的部分。其中:
(3)因子旋转 通过正交旋转或斜交旋转使提取出的因子具有可 解释性。 (4)计算因子得分 通过各种方法求解各样本在各因子上的得分,为 进一步分析奠定基础。
2、因子分析前提条件——相关性分析: 分析方法主要有: (1)计算相关系数矩阵(correlation coefficients matrix) 如果相关系数矩阵中的大部分相关系数值 均小于0.3,即各变量间大多为弱相关,原 则上这些变量不适合进行因子分析。 (2)计算反映象相关矩阵(Anti-image correlation matrix)
(1) cov( F , ) 0,
1 (2) D( F ) 1
F , 相互独立即不相关;
I 1
即 F1 , F2 ,, Fm 互不相关,方差为1。
( 3)
12 D ( )
2 2
2 p
(3)特征值----是第j个公共因子Fj对于X*的每一分量Xi*所提供
的方差的总和。又称第j个公共因子的方差贡献。即每个变量 与某一共同因素之因素负荷量的平方总和(因子载荷矩阵中某 一公共因子列所有因子负荷量的平方和)。 如因子分析案例中 F1的特征值 G=(0.896)平方+ (0.802)平方+(0.516)平方+(0.841)平方+(0.833)平 方=3.113
* i i 1 m
cov( ik Fk , Fj ) cov( i , Fj)
i 1
m
r ij r
cov( xi *, F j ) var( xi *) var( F j )
ij
ij(载荷矩阵 在各公共因子不相关的前提下, 中第 i 行,第 j 列的元素)是随机变量 xi* 与公共因 子 Fj的相关系数, 表示 xi* 依赖于 Fj 的程度。 反映 了第i个原始变量在第j个公共因子上的相对重要性。 因此 ij 绝对值越大,则公共因子 Fj 与原有变量 xi 的关系越强。
u1 , u2 ,, up 为对应的 1 2 p 0 为的特征根,
标准化特征向量,则
1 2 U AA + D Σ = U p
u1
u2
1 up 0
1u1u 1 2u2u2 mu mu m m1um1um1 pupup
(2)共同度----又称共性方差或公因子方差(community
或common variance)就是变量与每个公共因子之负荷量 Xi 的平方总和(一行中所有因素负荷量的平方和)。变量 的共同度是因子载荷矩阵的第i行的元素的平方和。记为
h
2 i
j 1
aij。
m
2
从共同性的大小可以判断这个原始实测变量与公共因 子间之关系程度。如因子分析案例中 共同度h12 = 0.8962 + 0.3412 = 0.919 特殊因子方差(剩余方差)----各变量的特殊因素影响大小就 是1减掉该变量共同度的值。如 i2 =1- 0.919 = 0.081
KMO检验的统计量是用于比较变量间简单相关系数矩阵 和偏相关系数的指标,数学定义为: KMO值越接近1,意味着变量间的相关性越强,原有变 量适合做因子分析;越接近0,意味变量间的相关性越 弱,越不适合作因子分析。 Kaiser给出的KMO度量标准:0.9以上非常适合;0.8表 示适合;0.7表示一般;0.6表示不太适合;0.5以下表 示极不适合。
xi i i1F1 i 2 F2 i 3 F3 i
称 F1、F2、F3 是不可观测的潜在因子,称 i 为公共因子。24个 变量共享这三个因子,但是每个变量又有自己的个性,不被包 含的部分,称为特殊因子。
因子分析的基本理论
4、主成分分析分析与因子分析的联系和差异:
(1)因子分析的前提条件鉴定 考察原始变量之间是否存在较强的相关关系,是否适 合进行因子分析。因为: 因子分析的主要任务之一就是对原有变量中信息重 叠的部分提取和综合成因子,最终实现减少变量个数 的目的。所以要求原有变量之间应存在较强的相关关 系。否则,如果原有变量相互独立,不存在信息重叠, 也就无需进行综合和因子分析。 (2)因子提取 研究如何在样本数据的基础上提取综合因子。
因子分析 Factor Analysis
因子分析的基本理论
1、什么是因子分析?
因子分析是主成分分析的推广,也是利用降维的 思想,由研究原始变量相关矩阵或协方差矩阵的内部 依赖关系出发,把一些具有错综复杂关系的多个变量 归结为少数几个综合因子的一种多元统计分析方法。
2、因子分析的基本思想:
把每个研究变量分解为几个影响因素变量,将每 个原始变量分解成两部分因素,一部分是由所有变量 共同具有的少数几个公共因子组成的,另一部分是每 个变量独自具有的因素,即特殊因子。
构中原始变量与因子分析时抽取出的公共因子的相 关程度。
x* i i1F 1 i2F 2 imF m i
Cov(x , Fj ) cov( ik Fk i , Fj )
x4=三角
x5=解析几何 特征值 G
0.841
0.833 3.113 62.26%
0.444
0.434 1.479 29.58%
0.904
0.882 4.959 91.85%
0.096
0.118 0.409
方差贡献率 (变异量)
F1 体现逻辑思维和运算能力,F2 体现空间思维和推理能力
因子分析的基本理论
因子分析的基本理论
例:在企业形象或品牌形象的研究中,消费者可 以通过一个有24个指标构成的评价体系,评价百 货商场的24个方面的优劣。
但消费者主要关心的是三个方面,即商店的环境、商店的服务 和商品的价格。因子分析方法可以通过24个变量,找出反映商 店环境、商店服务水平和商品价格的三个潜在的因子,对商店 进行综合评价。而这三个公共因子可以表示为:
1 u1
2 u 2
2 2 ˆ diag ( ˆ12 , ˆ2 ˆp 其中D ,, )
2 ˆ sii aij 2 i j 1
m
上式有一个假定,模型中的特殊因子是不重要的,因 而从的分解中忽略了特殊因子的方差。
(2)基于因子分析模型的主轴因子法Principal
ˆ ˆ +D ˆ u u u u u u D ˆ Σ AA 1 1 1 2 2 2 m m m
1 u1 2 u 2 ˆ ˆ D ˆ AA ˆ m u m D pm p u m m p
直接求R*的前p个特征根和对应的正交特征向 量。得如下的矩阵:
* * * * * A 1* u1 2 u2 p up * R*特征根:1* p 0
1u1
u1 0 u 2 p u p
2 u 2
1u1 u 2 2 p u p u p p
上式给出的表达式是精确的,然而,它实际上是毫无 价值的,因为我们的目的是寻求用少数几个公共因子 解释,故略去后面的p-m项的贡献,有:
因子分析的基本理论
5、因子分析模型: 设 X i (i 1,2,, p ) p 个变量,如果表示为
X i i ai1F1 aim Fm i
X 1 1 11 X 2 2 21 或 X p p p1
(3)巴特利特球度检验(Bartlett test of sphericity )
该检验以原有变量的相关系数矩阵为出发点,其零 假设H0是:相关系数矩阵为单位矩阵,即相关系数矩 阵主对角元素均为1,非主对角元素均为0。(即原始 变量之间无相关关系)。
(4)KMO(Kaiser-Meyer-Olkin)检验
axis factoring
是对主成分方法的修正,假定我们首先对变量进 行标准化变换。则 R=AA’+D R*=AA’=R-D 2 * * h 称R 为约相关矩阵,R 对角线上的元素是 i ,而不是1。
ˆ2 r r h 1 12 1p 2 ˆ r r h 2 2p ˆ 21 R R - D ˆ2 rp1 rp 2 h p
3、因子提取和因子载荷矩阵的求解:
因子载荷矩阵求解的方法: (1)基于主成分模型的主成分分析法 (2)基于因子分析模型的主轴因子法 (3)极大似然法 (4)最小二乘法 (5)a因子提取法 (6)映象分析法
(1)基于主成分模型的主成分分析法Principal components
p 的均值为,协方差为,
即互不相关,方差不一定相等, i ~ N (0,。 i2 ) 满足以上条件的,称为正交因子模型.
如果(2)不成立,即 D( F ) I ,各公共因子之间不独立, 则因子分析模型为斜交因子模型.
因子分析案例
公因子F1 x1=代数1 x2=代数2 x3=几何 0.896 0.802 0.516 公因子F2 0.341 0.496 0.855 共同度hi 0.919 0.889 0.997 特殊因子δi 0.081 0.111 0.003
(m p)
12 22
p2
1m F1 1 2 m F2 2 F pm m p
或X μ AF
称为 F1 , F2 ,, Fm 公共因子,是不可观测的变量, 他们的系数称为因子载荷。 i 是特殊因子,是不能被 前m个公共因子包含的部分。其中:
(3)因子旋转 通过正交旋转或斜交旋转使提取出的因子具有可 解释性。 (4)计算因子得分 通过各种方法求解各样本在各因子上的得分,为 进一步分析奠定基础。
2、因子分析前提条件——相关性分析: 分析方法主要有: (1)计算相关系数矩阵(correlation coefficients matrix) 如果相关系数矩阵中的大部分相关系数值 均小于0.3,即各变量间大多为弱相关,原 则上这些变量不适合进行因子分析。 (2)计算反映象相关矩阵(Anti-image correlation matrix)
(1) cov( F , ) 0,
1 (2) D( F ) 1
F , 相互独立即不相关;
I 1
即 F1 , F2 ,, Fm 互不相关,方差为1。
( 3)
12 D ( )
2 2
2 p
(3)特征值----是第j个公共因子Fj对于X*的每一分量Xi*所提供
的方差的总和。又称第j个公共因子的方差贡献。即每个变量 与某一共同因素之因素负荷量的平方总和(因子载荷矩阵中某 一公共因子列所有因子负荷量的平方和)。 如因子分析案例中 F1的特征值 G=(0.896)平方+ (0.802)平方+(0.516)平方+(0.841)平方+(0.833)平 方=3.113
* i i 1 m
cov( ik Fk , Fj ) cov( i , Fj)
i 1
m
r ij r
cov( xi *, F j ) var( xi *) var( F j )
ij
ij(载荷矩阵 在各公共因子不相关的前提下, 中第 i 行,第 j 列的元素)是随机变量 xi* 与公共因 子 Fj的相关系数, 表示 xi* 依赖于 Fj 的程度。 反映 了第i个原始变量在第j个公共因子上的相对重要性。 因此 ij 绝对值越大,则公共因子 Fj 与原有变量 xi 的关系越强。
u1 , u2 ,, up 为对应的 1 2 p 0 为的特征根,
标准化特征向量,则
1 2 U AA + D Σ = U p
u1
u2
1 up 0
1u1u 1 2u2u2 mu mu m m1um1um1 pupup
(2)共同度----又称共性方差或公因子方差(community
或common variance)就是变量与每个公共因子之负荷量 Xi 的平方总和(一行中所有因素负荷量的平方和)。变量 的共同度是因子载荷矩阵的第i行的元素的平方和。记为
h
2 i
j 1
aij。
m
2
从共同性的大小可以判断这个原始实测变量与公共因 子间之关系程度。如因子分析案例中 共同度h12 = 0.8962 + 0.3412 = 0.919 特殊因子方差(剩余方差)----各变量的特殊因素影响大小就 是1减掉该变量共同度的值。如 i2 =1- 0.919 = 0.081
KMO检验的统计量是用于比较变量间简单相关系数矩阵 和偏相关系数的指标,数学定义为: KMO值越接近1,意味着变量间的相关性越强,原有变 量适合做因子分析;越接近0,意味变量间的相关性越 弱,越不适合作因子分析。 Kaiser给出的KMO度量标准:0.9以上非常适合;0.8表 示适合;0.7表示一般;0.6表示不太适合;0.5以下表 示极不适合。
xi i i1F1 i 2 F2 i 3 F3 i
称 F1、F2、F3 是不可观测的潜在因子,称 i 为公共因子。24个 变量共享这三个因子,但是每个变量又有自己的个性,不被包 含的部分,称为特殊因子。
因子分析的基本理论
4、主成分分析分析与因子分析的联系和差异:
(1)因子分析的前提条件鉴定 考察原始变量之间是否存在较强的相关关系,是否适 合进行因子分析。因为: 因子分析的主要任务之一就是对原有变量中信息重 叠的部分提取和综合成因子,最终实现减少变量个数 的目的。所以要求原有变量之间应存在较强的相关关 系。否则,如果原有变量相互独立,不存在信息重叠, 也就无需进行综合和因子分析。 (2)因子提取 研究如何在样本数据的基础上提取综合因子。
因子分析 Factor Analysis
因子分析的基本理论
1、什么是因子分析?
因子分析是主成分分析的推广,也是利用降维的 思想,由研究原始变量相关矩阵或协方差矩阵的内部 依赖关系出发,把一些具有错综复杂关系的多个变量 归结为少数几个综合因子的一种多元统计分析方法。
2、因子分析的基本思想:
把每个研究变量分解为几个影响因素变量,将每 个原始变量分解成两部分因素,一部分是由所有变量 共同具有的少数几个公共因子组成的,另一部分是每 个变量独自具有的因素,即特殊因子。