探索性因子分析(课堂PPT)
探索性因子分析(课堂PPT)

确定因子个数的方法(三)
➢碎石图
碎石图是按特征值大小排列因子,横轴表 示因子序号,纵轴表示特征值大小。
公因子提取方法
➢主成分分析法
假设变量是因子的纯线性组合,第 一成分有较大的方差,后续成分其 可解释的方差逐个递减。
➢最大似然法
该方法不要求多元正态分布,给出 参数估计。
因子命名
• 因子载荷阵显示了原始变量与各主成分之 间的相关程度。根据他们的相关程度的大 小,综合出各因子的含义。如果每个因子 与原始变量相关系数没有很明显的差异, 对因子命名就比较困难。
➢公因子的累积方差贡献率
根据累计贡献率达到的百分比确定
确定因子个数的方法(二)
• 实际上累积贡献率是一个次要指标 。主要指标是特征值, 在前一指标达 到的情况下,只要累计贡献率不是 太差都可以接受。即使70%也不是 太大的问题。实际处理中,很少碰 到累计贡献率太低的情况,如果问 卷设计和数据收集没有太大问题的 前提下。
判断变量是否适合做因子分析
1. KMO(Kaiser-meyer-olkin)检验 KMO统计量是用来比较各变量间简单相关系
数和偏相关系数的大小。在0~1之间取值,越接近 1,越适合作因子分析。 2. 巴特利特球形检验
巴特利特球形检验原假设H0为:相关阵是单 位阵,既各变量各自独立。
3. 反映象相关矩阵检验
的变量间强相关问题 ➢数据化简,将具有错综复杂关系的
变量综合为少数几个因子(不可观 测的、相互独立的随机变量) ➢发展测量量表
探索性因子分析——步骤
收集观测变量
构造相关矩阵
判断是否适合作因子分析
确定因子个数 提取因子
特征值大小、因子累计贡献率、碎石图
因子旋转 解释因子结构 计算因子得分
6-2因子分析ppt课件

xi i1F1 i2F2 i3F3 i
i 1,,24
称 F1、F2、F3 是不可观测的潜在因子。24个变量 共享这三个因子,但是每个变量又有自己的个性, 不被包含的部分 i ,称为特殊因子。
3
注:
因子分析与回归分析不同,因子分析中的因 子是一个比较抽象的概念,而回归因子有非常明 确的实际意义;
1
a m
2 ij
2 i
j 1
统计意义: 所有的公共因子和特殊因子对变量
Xi
的贡献为1。如果
m
a2 ij
非常
j 1
靠近1,
2非常小,则因子分析的效果好,从原变量空间到公共因
i
子空间的转化性质好。
10
3、公共因子Fj方差贡献的统计意义
11
§ 3 因子旋转(正交变换)
一、为什么要旋转因子 建立了因子分析数学目的不仅仅要找出公共因子以 及对变量进行分组,更重要的要知道每个公共因子的 意义,以便进行进一步的分析,如果每个公共因子的 含义不清,则不便于进行实际背景的解释。由于因子 载荷阵是不惟一的,所以应该对因子载荷阵进行旋转。 目的是使因子载荷阵的结构简化,使载荷矩阵每列或 行的元素平方值向0和1两极分化。
1
D(F)
1
I
1
即 F1, F2,, Fm 互不相关,方差为1。
7
2 1
D(
)
2 2
2 p
即互不相关,方差不一定相等,
i
~
N
(0,
2 i
探索性因子分析课件

探索性因子分析的理论假设
主要包括: ①所有的公共因子都相关(或都不相关); ②所有的公共因子都直接影响所有的观测变量; ③特殊(唯一性)因子之间相互独立; ④所有观测变量只受一个特殊(唯一性)因子的影响; ⑤公共因子与特殊因子(唯一性)相互独立。
探索性因子分析
探索性因子分析基本原理
探索性因子分析模型的一般表达式为
其中,Xn表示观测变量,FM代表公因子,它 是各个观测变量所共有的因子,解释变量之间的 相关;Un代表特殊因子,它是每个观测变量所特 有的因子,只对一个原始变量起作用;WM代表因 子载荷,是每个变量在公因子上的相关系数;而 en代表了每一观测变量的随机误差。
探索性因子分析
探索性因子分析
因子得分
• 因子得分就是每个观测量的公共因子的值。根 据因子得分系数和原始变量的标准化值,可以 计算每个观测量的各因子的得分数,并可以据 此对观测量进行进一步的分析。
• 计算因子得分的基本思想是将因子变量表现为 原有变量的线性组合,即通过以下的因子得分 函数计算:
F x x x x j
探索性因子分析
确定因子个数的方法(三)
➢碎石图 碎石图是按特征值大小排列因子,横轴表示因子序号,纵轴表 示特征值大小。
探索性因子分析
公因子提取方法
➢主成分分析法
假设变量是因子的纯线性组合,第一成分 有较大的方差,后续成分其可解释的方差 逐个递减。
➢最大似然法
该方法不要求多元正态分布,给出参数估 计。
j11 j22 jຫໍສະໝຸດ 3(j=1,2···p)
jp p
探索性因子分析
估计因子得分的方法
➢回归法 因子得分的均值为0,方差等于估计因子 得分与实际得分之间的多元相关的平方
实用统计方法——第二讲 因子分析 PPT课件

Factor Analysis
回顾:主成分分析的任务
• 将彼此相关的指标变量转化为彼此不相关的指 标变量;
• 将个数较多的指标变量转化为个数较少的指标
变量。
• 将意义单一的指标变量转化为意义综合的指标
变量。
主成分分析的基本原理
寻找一个适当的线性变换: • 将彼此相关的变量转变为彼此不相关的新变量;
因子分析的基本思想
根据变量间相关性的大小把变量分组, 使得同组内的变量之间的相关性(共性) 较高,并用一个因子来代表这个组的变 量,而不同组的变量相关性较低(个 性)。
因子分析可分为两种:
探索性因子分析(exploratory factor analysis) 确定性因子分析(confirmatory factor analysis)
潜在因子之间的关系,具有有效的实际意义,
因此需要进行统计检验。
第二节 探索性因子分析的基本原理
【例1】表1给出了三个指标 之间的相关系数,其中, x 1 是孩子的数学成绩,x 2 是孩子的语文成绩,x 3 是 孩子的英语成绩。求影响 表1 指标的相关系数
或支配这三个成绩指标变
量的潜在因子。
令ξ是影响这三个成绩指标变量的潜在因子。
变量的可测性
可测变量(measured variable):可以直接观察或测
量而得到的变量。 潜在变量(latent variable):不能或不易直接观测得 到的变量。这种变量往往是根据某种理论假设的, 所以也称为理论变量(theoretical variable)。
例如,在企业形象或品牌形象的研究中,消 费者可以通过一个有24个指标构成的评价体 系,评价百货商场的24个方面的优劣。 但消费者主要关心的是三个方面,即商店的 环境、商店的服务和商品的价格。因子分析 方法可以通过24个变量,找出反映商店环境、 商店服务水平和商品价格的三个潜在的因子, 对商店进行综合评价。
《探索性因素分析及SPSS应用》PPT课件

8、多极变量,即一个变量在几个因子上的负荷都较大。
返回
2004-3-10
1.因素抽取 主成分法 主轴因子法 极大似然法
……
未旋转解 共同度 特征值
3.因素旋转 方差最大法 平均正交法 斜交旋转
……
4. 据 简 单 结构解释 或确定因 子的含义
5.报告因素 模式和因素 结构
2.据碎石图 和特征值
确定因子数
2004-3-10
6.据结果调整旋转方法重复 该过程至重复抽取过程
返回
xk lk1 f1 lk 2 f2 lkm fm k
公因子理论:
p个观测变量,相当于一份问卷中的p个题项,它是一个随机 变量;不同被试都将有p个不同的数据;m个公因子,其值 称因子值(factor score);ε代表残差,包括特殊因子和误 差,是各变量中不能用公因子解释的部分;系数lij称为因子 负荷(factor loading),表示第i个变量在第j个因子上的相对重
回避了内容和理论,而关注应用 • 聚类分析(Cluster analysis): Holzinger, Tyron, & Bailey
相信较低水平的观测(如项目)可以被整合成较高水平 的具有理论价值的构念。
2004-3-10
返回
5
第一节 因素分析原理概述
Common Factor Theory及变异分解 题项1:我对我的薪水感到满意; 题项2:我对工作中的同事感到满意; 题项3:我对工作中的上司感到满意。
数据分析-因子分析ppt课件

前m个公共因子包含的部分。并且满足:
cov(F, ) 0, F, 即不相关;
1
D(F)
1
I 1
即 F1, F2, , Fm 互不相关,方差为1。
7
2 1
D( )
2 2
2 p
即互不相关,方差不一定相等,
i
~
N
(0,
2 i
)。
8
二、因子分析模型的性质
3
而这三个公共因子可以表示为:
xi i i1F1 i2F2 i3F3 i i 1, ,24 称 F1、F2、F3 是不可观测的潜在因子。24个变量 共享这三个因子,但是每个变量又有自己的个性, 不被包含的部分 i ,称为特殊因子。
4
注:
因子分析与回归分析不同,因子分析中的因 子是一个比较抽象的概念,而回归因子有非常明 确的实际意义;
将原始变量X做变换X*=CX,这里 C=diag(c1,c2,…,cn),ci>0。
C(X - μ) = C(AF + ε)
CX Cμ + CAF + Cε X* Cμ + CAF + Cε X* μ* + A*F* + ε* F* F
10
E(F*) 0 E(ε*) 0 Var(F*) I cov(F*,ε*) E(F*ε*) 0
1、原始变量X的协 方差矩阵的分解(例8.2.1)
Q X - μ = AF + ε Var(X - μ) = AVar(F)A +Var(ε)
Σx = AA + D A是因子模型的系数
Var(ε)
D
diag
因子分析因子分析PPT课件

1/ 5 2 / 5
1
21
第21页/共96页
特征根为: 1 1.55 2 0.85 3 0.6
0.475 0.883 0
U
0.629
0.331 0.707
0.629 0.331 0.707
0.475 1.55 0.883 0.85
A 0.629 1.55 0.331 0.85
因子分析:潜在的假想变量和随机影响变量 的线性组合表示原始变量。
因子分析(探索)与结构方程模型(验证)
3
第3页/共96页
第二节 因子分析的数学模型
一、数学模型 1.R型因子分析数学模型(按列)
设 X i (i 1,2,, p) p 个变量,如果表示为
X i ai1F1 aimFm i (m p)
X1 11 12
或
X
2
21
22
X
p
p1
p2
1m F1 1
2m
F2
2
pm
Fm
p
或X AF
4
第4页/共96页
称为 F1, F2,, Fm公共因子,是不可观测的变量,
他们的系数称为因子载荷。i 是特殊因子,是不能被
前m个公共因子包含的部分。并且满足:
3、公共因子Fj方差贡献的统计意义
因子载荷矩阵中各列元素的平方和
Sj
a p i 1
2 ij
p
r
i 1
2
(
xi
,
Fj
)
称为Fj ( j 1,, m) 对 X i 的方差贡献和。衡量Fj的相对重
要性。
12
第12页/共96页
(三)因子分析模型的性质
探索性因子分析

探索性因子分析(总7页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--什么是探索性因子分析法探索性因子分析法(Exploratory Factor Analysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。
因而,EFA能够将具有错综复杂关系的变量综合为少数几个核心因子。
探索性因子分析法的起源因子分析法是两种分析形式的统一体,即验证性分析和纯粹的探索性分析。
英国的心理学家Charles Spearman在1904年的时候,提出单一化的智能因子(A Single Intellectual Factor)。
随着试验的深入,大量个体样本被分析研究,Spearman的单一智能因子理论被证明是不充分的。
同时,人们认识到有必要考虑多元因子。
20世纪30年代,瑞典心理学家Thurstone打破了流行的单因理论假设,大胆提出了多元因子分析(Multiple Factor Analysis)理论。
Thurstone在他的《心智向量》(Vectors of Mind, 1935)一书中,阐述了多元因子分析理论的数学和逻辑基础。
[编辑]探索性因子分析和验证性因子分析的异同[1]探索性因子分析和验证性因子分析相同之处两种因子分析都是以普通因子分析模型作为理论基础,其主要目的都是浓缩数据,通过对诸多变量的相关性研究,可以用假想的少数几个变量(因子、潜变量)来表示原来变量(观测变量)的主要信息。
图1所示即为最简单、也最为常见的因子模型,每个观测变量(指标)只在一个因子(潜变量)上负荷不为零,x1、x2、x3是潜变量ξ1的指标,x4、x5是潜变量ξ2的指标。
将图1所示的因子模型推广至一般意义上的因子模型后,各观测变量x_i与m个公共因子ξ1,ξ2,...,ξm之间的关系可以用数学模型表示如下:x1= λ11ξ1+ λ12ξ2+ ... + λ1mξm+ δ1......x k= λk1ξ1+ λk2ξ2+ ... + λkmξm+ δk其中:x i为各观测变量;ξi是公共因子;δi是x i,的特殊因子,有时也称误差项,包括x i的唯一性因子和误差因子两部分;λij是公共因子的负载;m是公共因子ξ1,ξ2,...,ξm的个数,k是各观测变量x1,...,x k的个数,m<k。
因子分析(探索性)_X1_X2_X3

因子分析(探索性)结果输出结果1:KMO检验和Bartlett的检验KMO检验和Bartlett的检验KMO值0.888Bartlett球形度检验近似卡方2005.769 df 253.000p 0.000***注:***、**、*分别代表1%、5%、10%的显著性水平图表说明:上表展示了KMO检验和Bartlett球形检验的结果,用来分析是否可以进行因子分析。
● 若通过KMO检验(KMO>0.6),说明了题项变量之间是存在相关性的,符合因子分析要求;● 若通过Bartlett检验:P<0.01或P<0.05, 呈显著性,则可以进行因子分析。
智能分析KMO检验的结果显示,KMO的值为0.888,同时,Bartlett球形检验的结果显示,显著性P值为0.000***,水平上呈现显著性,拒绝原假设,各变量间具有相关性,因子分析有效,程度为适合。
输出结果2:方差解释表格总方差解释成分特征根旋转后方差解释率特征根方差百分比累积特征根方差百分比累积1 10.063 43.752% 43.752% 4.921 21.395% 21.395%2 2.185 9.502% 53.254% 3.808 16.556% 37.951%3 1.552 6.749% 60.003% 2.803 12.186% 50.138%4 1.274 5.538% 65.541% 2.678 11.645% 61.783%5 1.008 4.384% 69.925% 1.873 8.142% 69.925%6 0.832 3.616% 73.541%7 0.766 3.331% 76.872%8 0.663 2.882% 79.754%9 0.569 2.474% 82.228%10 0.542 2.358% 84.587%11 0.479 2.083% 86.67%12 0.430 1.871% 88.541%13 0.403 1.754% 90.295%14 0.385 1.675% 91.97%15 0.292 1.27% 93.24%16 0.265 1.154% 94.394%17 0.264 1.149% 95.543%18 0.229 0.994% 96.537%19 0.208 0.906% 97.443%20 0.178 0.773% 98.216%21 0.157 0.683% 98.9%22 0.149 0.649% 99.549%23 0.104 0.451% 100.0%图表说明:图表说明:● 碎石图是根据各主成分对数据变异的解释程度绘制的图。
《确定性因子分析》PPT课件

.
12
确定性因子分析的基本原理
确定性因子分析的基本原理就是对一个特定的因子分 析模型进行分析,分析的过程就是用数据去证实(统计 检验)这个特定的因子分析模型是否成立,并且估计潜 在因子之间的相关系数。
.
13
第二节 确定性因子分析的数学模型
一、模型 :
例如:i=4, q=2 模型:
可测变量,潜在因子,因子载荷,度量误差
.
22
样本导出的方差协方差矩阵S是由观察数据计算得到的, 它是一个与参数ω无关的k 阶方阵,它表示了原始变量之 间的关联程度。
模型隐含的方差协方差矩阵Σ(ω)是由拟和模型的预测值计 算出来的,它是一个与参数ω有关的k 阶方阵,它表示了 预测变量之间的关联程度。
不需要估计所有的因子载荷,只需要估计特定的因子载荷,
其余的因子载荷均假定为零。
.
10
例如,孩子的数学成绩(x1),孩子的语文成绩(x2),父亲 的学历(x3)和母亲的学历(x4)这四个指标变量经过探索性 因子分析得到模型如下:
.
11
非限制性的(unrestricted)
限制性的(restricted)
.ห้องสมุดไป่ตู้
14
矩阵形式:
其中,λx 是待估计的因子载荷矩阵,ξ是潜在因子 矩阵,δ是误差项矩阵。
.
15
二、假设条件
(1) x i 是随机变量; (2) δi 是均值为 0,方差为常数的正态随机变量; (3) δi 之间相互独立; (4) δi 与所有的ξj 独立;
探索性因子分析的假设条件:(1) - (4)相同, (5) ξi 是方差为1的随机变量,且ξi 之间相互独立。
.
16
第三节 确定性因子分析模型的基本要素
探索性因子分析PPT演示课件

3
• 探索性因子分析法(Exploratory Factor Analysis, EFA)是一项用来找出多元观测变量的本质结构、 并进行处理降维的技术。
• 特点: (1)利用因子分析来确定因子个数——降维 (2)完全依赖资料数据
4
探索性因子分析的理论假设
主要包括: ①所有的公共因子都相关(或都不相关); ②所有的公共因子都直接影响所有的观测变 量; ③特殊(唯一性)因子之间相互独立; ④所有观测变量只受一个特殊(唯一性)因子 的影响; ⑤公共因子与特殊因子(唯一性)相互独立。
21
• Example
22
• 旋转后的因子表达式可以写成:
FAC1 1 0.091 pop'0.392 school'0.039 em ploy ' 0.299 services'0.403 house' FAC2 1 0.484 pop'0.096 school'0.465 em ploy ' 0.138 services'0.098 house'
19
因子得分
• 因子得分就是每个观测量的公共因子的值。根 据因子得分系数和原始变量的标准化值,可以 计算每个观测量的各因子的得分数,并可以据 此对观测量进行进一步的分析。 • 计算因子得分的基本思想是将因子变量表现为 原有变量的线性组合,即通过以下的因子得分 函数计算:
· · p) Fj j1 x1 j 2 x2 j3x3 jpxp (j=1,2·
16
• 因子分析的一个重要目的在于对原 始变量进行分门别类的综合评价。 如果因子分析结果保证了因子之间 的正交性,但对因子不易命名,可 以通过对因子模型的旋转,得到容 易解释的结果。
探索性因子分析PPT课件

1
因子分析介绍
2
探索性因子分析的基本理论
3
探索性因子分析的结构及步骤
4Hale Waihona Puke 实例演示因子分析★ 概念
用于分析影响变量、支配变量的共同因子有几 个且各因子本质为何的一种统计方法。它是一类 降维的相关分析技术,用来考察一组变量之间的 协方差或相关系数结构,并用以解释这些变量与 为数较少的因子之间的关联。
其中,Xn表示观测变量,FM代表公因子,它 是各个观测变量所共有的因子,解释变量之间的 相关;Un代表特殊因子,它是每个观测变量所特 有的因子,只对一个原始变量起作用;WM代表 因子载荷,是每个变量在公因子上的相关系数; 而en代表了每一观测变量的随机误差。
• 探索性因子分析模型
应用范围
探索性因子分析主要应用于三个方面 寻求基本结构,解决多元统计分析中
因子得分
• 因子得分就是每个观测量的公共因子的值。根 据因子得分系数和原始变量的标准化值,可以 计算每个观测量的各因子的得分数,并可以据 此对观测量进行进一步的分析。
• 计算因子得分的基本思想是将因子变量表现为
原有变量的线性组合,即通过以下的因子得分
函数计算:
F x x x x j
• 因子旋转通常分为两类:
正交旋转
Varimax方差最大旋转,它使每个因子上的具有 最高载荷的变量数最小,可简化对因子的解释。
斜交旋转
因子旋转(二)
• 正交旋转的基本假定是,因子分析中被提 取出来的因子之间是相互独立的,因子间 并不相关。它的目的是要获得因子的简单 结构,即使每个变量在尽可能少的因子上 有较高的负载;而斜交旋转中,因子间的夹 角是任意的,也就是说斜交旋转对因子间 是否相关并无限定,这种因子旋转的结果 就会使各因子所解释的变量的方差出现一 定程度的重叠。
第7讲 探索性因子分析ppt课件

29 环境质量 (Quality of the environment)
30 拥有海滩 (Availability of beaches)
31 餐馆、咖啡厅和酒吧的拥有 (Availability of restaurants, cafeterias and bars)
32 风景与自然景观 (Scenery and natural attraction)
目前探索性因子分析方法在旅游研究领域的应用 相对较广,因而这里仅讨论探索性因子分析。
• 二、基本原理
(一) 潜在变量模型与基本原则
因子分析所得到的潜在变量,就是社会科学中所 谓的抽象构念,因而因子模型又被称为潜在变量 模型(latent variable model)。
因子分析是一种潜在结构分析法,其假定每个变 量(在量表中称为题项)均由两个部分所构成, 一为公共因子(common factor),一为独特因 子(unique factor)。公共因子的数目会比指标 (原始题项)数少,而每个指标皆有一个独特因 子,如果一个量表共有n个题项数,则也会有n个 独特因子。
2 21
2 31
)
3
F2(公共因子二)
12 22 32
2 12
2 22
2 32
( 122
2 22
2 32
)
3
共同性C 特
2 21
2 22
2 31
2 32
1 C1 1C2 1 C3
• 三、因子分析的几个关键问题
一、基本概念 二、基本原理 三、EFA分析的几个关键问题 四、EFA分析的操作程序 五、实际调查案例剖析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
1
因子分析介绍
2
探索性因子分析的基本理论
3
探索性因子分析的结构及步骤
4
实例演示
2
因子分析
★ 概念 用于分析影响变量、支配变量的共同因子有几
个且各因子本质为何的一种统计方法。它是一类 降维的相关分析技术,用来考察一组变量之间的 协方差或相关系数结构,并用以解释这些变量与 为数较少的因子之间的关联。
19
因子得分
• 因子得分就是每个观测量的公共因子的值。根 据因子得分系数和原始变量的标准化值,可以 计算每个观测量的各因子的得分数,并可以据 此对观测量进行进一步的分析。
• 计算因子得分的基本思想是将因子变量表现为 原有变量的线性组合,即通过以下的因子得分 函数计算:
F j j 1 x 1 j 2 x 2 jx 3 jx p (j=1,2···p)
• 因子旋转通常分为两类:
➢ 正交旋转
Varimax方差最大旋转,它使每个因子上的具有 最高载荷的变量数最小,可简化对因子的解释。
➢ 斜交旋转
18
因子旋转(二)
• 正交旋转的基本假定是,因子分析中被提 取出来的因子之间是相互独立的,因子间 并不相关。它的目的是要获得因子的简单 结构,即使每个变量在尽可能少的因子上 有较高的负载;而斜交旋转中,因子间的夹 角是任意的,也就是说斜交旋转对因子间 是否相关并无限定,这种因子旋转的结果 就会使各因子所解释的变量的方差出现一 定程度的重叠。
➢公因子的累积方差贡献率
根据累计贡献率达到的百分比确定
12
确定因子个数的方法(二)
• 实际上累积贡献率是一个次要指标 。主要指标是特征值, 在前一指标达 到的情况下,只要累计贡献率不是 太差都可以接受。即使70%也不是 太大的问题。实际处理中,很少碰 到累计贡献率太低的情况,如果问 卷设计和数据收集没有太大问题的 前提下。
反映象相关矩阵检验是将偏相关系数矩阵的 每个元素取反得到的。如果变量中确实能够提取 出公共因子,那么偏相关系数必然很小,则反映 象相关矩阵中的有些元素的绝对值比较大,则说 明这些变量可能不适合作因子分析。
10
确定因子个数
• 主成分分析的主要统计量
11
确定因子个数的方法(一)
➢特征根
特征根可以看成是表示公因子影响力度大 小的指标,一般取特征值大于1的成分作 为主成分,特征根小于1,不引入
• Example
16
• 因子分析的一个重要目的在于对原 始变量进行分门别类的综合评价。 如果因子分析结果保证了因子之间 的正交性,但对因子不易命名,可 以通过对因子模型的旋转,得到容 易解释的结果。
17
因子旋转(一)
• 所谓旋转就是一种坐标变换。因子旋转的 目的是为了便于理解和解释因子的实际意 义,在旋转后的新坐标系中,因子载荷将 得到重新分配,使得对公因子的命名和解 释更加容易。
4
探索性因子分析的理论假设
主要包括: ①所有的公共因子都相关(或都不相关); ②所有的公共因子都直接影响所有的观测变
量; ③特殊(唯一性)因子之间相互独立; ④所有观测变量只受一个特殊(唯一性)因子
的影响; ⑤公共因子与特殊因子(唯一性)相互独立。
5
探索性因子分析基本原理
探索性因子分析模型的一般表达式为
21
• Exaபைடு நூலகம்ple
22
• 旋转后的因子表达式可以写成:
FA1C 10.091po'p0.392sch'o0o.0l39emp' l 0.299serv'ic0.4es03hou' se FA2C 10.484po'p0.096sch'o0o.4l65emp' lo 0.138serv'ic0.0es98hou' se
的变量间强相关问题 ➢数据化简,将具有错综复杂关系的
变量综合为少数几个因子(不可观 测的、相互独立的随机变量) ➢发展测量量表
8
探索性因子分析——步骤
收集观测变量
构造相关矩阵
判断是否适合作因子分析
确定因子个数 提取因子
特征值大小、因子累计贡献率、碎石图
因子旋转 解释因子结构 计算因子得分
便于对因子结构进行合理解释 做进一步的研究,如聚类分析、评价
20
估计因子得分的方法
➢回归法
因子得分的均值为0,方差等于估计因子 得分与实际得分之间的多元相关的平方
➢Bartlett法
因子得分均值为0,超出变量范围的特殊 因子平方和被最小化
➢Anderson-Rubin法
因子得分的均值为0,标准差为1,且彼此 不相关。是为了保证因子的正交性而对 Bartlett因子的调整。
9
判断变量是否适合做因子分析
1. KMO(Kaiser-meyer-olkin)检验 KMO统计量是用来比较各变量间简单相关系
数和偏相关系数的大小。在0~1之间取值,越接近 1,越适合作因子分析。 2. 巴特利特球形检验
巴特利特球形检验原假设H0为:相关阵是单 位阵,既各变量各自独立。 3. 反映象相关矩阵检验
13
确定因子个数的方法(三)
➢碎石图
碎石图是按特征值大小排列因子,横轴表 示因子序号,纵轴表示特征值大小。
14
公因子提取方法
➢主成分分析法
假设变量是因子的纯线性组合,第 一成分有较大的方差,后续成分其 可解释的方差逐个递减。
➢最大似然法
该方法不要求多元正态分布,给出 参数估计。
15
因子命名
• 因子载荷阵显示了原始变量与各主成分之 间的相关程度。根据他们的相关程度的大 小,综合出各因子的含义。如果每个因子 与原始变量相关系数没有很明显的差异, 对因子命名就比较困难。
其中,Xn表示观测变量,FM代表公因子,它 是各个观测变量所共有的因子,解释变量之间的 相关;Un代表特殊因子,它是每个观测变量所特 有的因子,只对一个原始变量起作用;WM代表 因子载荷,是每个变量在公因子上的相关系数; 而en代表了每一观测变量的随机误差。
6
• 探索性因子分析模型
7
应用范围
探索性因子分析主要应用于三个方面 ➢寻求基本结构,解决多元统计分析中
★ 基本思想 通过分析变量间的相关系数矩阵内部结构,将原
变量进行重新组合,利用数学工具将众多的原变量 组成少数的独立的新变量。
3
• 探索性因子分析法(Exploratory Factor Analysis ,EFA)是一项用来找出多元观测变量的本质结 构、并进行处理降维的技术。
• 特点: (1)利用因子分析来确定因子个数——降维 (2)完全依赖资料数据