探索性因素分析讲解
探索性因素分析的原理与步骤知识讲解

探索性因素分析的原理与步骤知识讲解探索性因素分析(Exploratory Factor Analysis,EFA)是一种多变量分析方法,旨在确定观察数据中潜在的结构或维度。
它可以帮助研究者发现数据中隐藏的模式和关联,进而减少数据的复杂性,并起到简化和理解数据的作用。
以下是探索性因素分析的原理与步骤的知识讲解。
原理:探索性因素分析基于统计原理,假设观察数据是由一组潜在变量(即因素)决定的。
每个因素代表一组具有内在关联的观察变量,它们共同解释了数据中的方差。
因此,探索性因素分析的目标是找出这些潜在因素的数量和结构,并确定它们与观察变量之间的关系。
步骤:1.确定分析目标:在进行探索性因素分析之前,需要明确分析的目标和研究问题。
明确问题有助于选择适当的分析方法和解释结果。
2.数据准备与预处理:将需要分析的数据整理为适合因素分析的格式。
常见的预处理包括数据标准化、缺失值处理和异常值处理等。
4.因素提取:在这一步骤中,通过计算特征值、特征向量或因子载荷来确定潜在因素的数量和结构。
特征值表示一个因素解释的方差比例,而特征向量是表示潜在因素之间关系的向量。
因子载荷是观察变量与潜在因素之间的相关系数。
5. 因子旋转:在因子提取之后,因子结构可能并不是直观和可解释的。
因此,需要进行因子旋转以改善因子解释性和解释因素的意义。
常见的因子旋转方法包括正交旋转(如Varimax)和斜交旋转(如Promax)等。
6.因子解释和命名:根据提取的因子载荷和因子旋转结果,解释每个因素所代表的观察变量的意义。
通过命名每个因素,以增加对潜在因素结构的理解和解释。
7.评估因子模型:对于确定的因子结构,需要进行信度和效度分析来评估模型的质量和适用性。
信度分析衡量因子和观察变量之间的内部一致性,而效度分析衡量因子与其他变量之间的关系。
8.结果解释与报告:根据分析结果进行解释和报告。
包括提取的因子数目、每个因子的载荷、因子间的关系、因子的解释以及模型的信度和效度指标。
【已修改】讲稿-探索性因素分析的操作-20190228

断问卷是否适合进行因素分析,这里主要看 KMO 值和显著值,当 KMO 值大于等于 0.6 且显著值小于 0.05,说明该问卷适合进行探索 性因素分析;第二,确定问卷维度的个数,问卷维度个数对应因子的 固定数量;第三,把题项间的差异可视化,所谓差异可视化就是统一 对数据进行平方处理,使数据间的差异更加明显,以此方便研究者辨 析,这里一般用最大方差法进行处理;第四,探索增删题项,主要是 根据规定的删题原则把不适合的题项进行删除, 直至得到与理论假设 最接近的题目维度;第五,确定最佳问卷维度,由于我们在删题的过 程中依据的删题原则的顺序不同,删除题项的顺序也会有所不同,这 会导致最终删除的题项不同,并且因子结构也可能不同,因此要尝试 不同的删题顺序, 来找出能解释问卷蕴含信息比例最大的问卷维度和 题项。在这里需要跟大家说明的是,探索性因素分析的统计方法较为 复杂, 即便大家不知道其中的具体原理, 只要大家记住了上述的操作, 就可以比较轻松地完成这项任务。大家只要动手操作起来,就会发现 这个过程并不难。 以上就是本节课的全部内容, 下节课我们将继续为大家讲解信度检验 结束语 的原理和具体操作,大家千万不要错过哦!我们下节课再会!
《探索性因素分析的操作》微课制作讲稿
微课名称 内容 探索性因素分析的操作 讲稿 大家好,前面我们已经学习了探索性因素分析的基本原理,今天我们 一起来学习探索性因素分析的实践操作。 探索性因素分析的目的是检 测问卷的建构效度, 即要用较少的题项来反映原始问卷中蕴含的大部 分信息,其具体实现方法是,通过因子分析这种统计分析方法来删除 问卷中某些不合适的题项。在前面的学习中,借助文献和实际经验, 回顾 我们建立起了中学生数字化学习能力的六个维度, 并且根据假设的六 个维度编制了中学生数字化学习能力的预试问卷, 并通过先前的项目 分析删除了预试问卷中数字化学习能力现状的第六题, 并将后续题目 重新编号,目前各个维度的具体题项如表中所示,但是我们如何确定 假设的维度真的存在呢?这就需要用到探索性因素分析来对问卷的 维度进行检验啦! 探索性因素分析的基本流程有以下五步:第一,判断问卷是否适合进 行因素分析;第二,确定问卷维度的个数;第三,把题项间的差异可 视化,所谓差异的可视化就是统一对数据进行平方处理,使数据间的 基本流程 差异更加明显,以此方便我们进行辨析;第四,探索增删题项,主要 是根据规定的删题原则把不适合的题项删除, 直至得到与理论假设最 接近的题目维度;第五,确定最佳问卷维度,即通过探索性因素分析 找出能够最大程度反映原始问卷信息的问卷维度与题项。 具体操作 好啦,话不多说,现在我们进入 SPSS,一起动手操作起来吧!上节
使用SPSS进行探索式因素分析的教程

使用SPSS进行探索式因素分析的教程探索性因素分析是一种统计方法,用于确定一组变量之间的潜在结构。
SPSS是一种常用于数据分析的软件工具,它提供了强大的因素分析功能。
以下是一个使用SPSS进行探索性因素分析的简单教程,该教程可以帮助您了解如何使用SPSS来执行因素分析并对结果进行解释。
步骤1:导入数据步骤2:准备数据确保您的数据符合因素分析的前提条件。
确定您要进行因素分析的变量是否具有线性关系,并进行必要的数据转换(例如,对数转换)以满足这个条件。
步骤3:执行因素分析在SPSS的“分析”菜单下,选择“数据准备”和“因子”。
在弹出的对话框中,选择您要进行因素分析的变量并将其移动到“因子”框中。
选择“萃取方法”(如主成分分析或最大似然估计)并指定要提取的因素的数量。
您还可以选择执行因子旋转以获得更简单和解释性更强的因子结构。
步骤4:解读结果SPSS将生成一个因素分析的输出报告,其中包含多个表格和图形。
以下是一些常见的解读步骤:-总体解释:观察“总体解释”表,了解因子数量和提取方法的解释力度。
查看“因素”的特征值,了解提取的因子解释的总方差比例。
-因子负荷:查看“因子负荷”表,该表显示了原始变量与提取的因子之间的相关性。
较高的因子负荷表示原始变量与特定因子之间的较强关联。
-因子旋转:如果您选择了因子旋转,则查看“旋转因子载荷矩阵”表,该表显示了旋转后的因子负荷。
查看这些旋转后的因子负荷以确定是否存在更简单的因子结构。
-因子得分:根据选定的因子分析方法,可以生成每个观测值的因子得分。
这些得分表示了每个观测值在每个因子上的得分情况,可以用于后续的分析和解释。
步骤5:解释因子根据因子负荷和因子名称,解释每个因子代表的潜在结构。
结合领域知识和因子负荷,您可以确定每个因子是否与特定概念或潜在维度相关联。
步骤6:结果报告根据您的研究目的和需要,将因子分析的结果写入报告中。
确保清楚地描述因子数量、命名以及每个因子代表的结构或概念。
因素分析法

因素分析法因素分析法(factor analysis)是一种经典的多变量统计分析方法,旨在识别多个变量之间的潜在结构,从而简化数据分析的过程,减少数据维度。
因素分析法在社会科学、生物统计学、管理学等领域被广泛应用。
一、因素分析法的基本原理因素分析法的基本原理是将多个变量(如特征、指标等)转化为少数几个共同因素(factors)所解释。
这些共同因素可以解释原始数据的大部分方差。
在原始数据中,每个变量可以被看作是多个因素的线性组合。
共同因素是数据的潜在结构,可以更好地解释原始数据的本质。
因素分析法主要分为探索性因素分析(exploratory factor analysis)和确认性因素分析(confirmatory factor analysis)两种。
探索性因素分析是一种无监督学习的方法,可以帮助用户发现数据中的共同因素。
而确认性因素分析则需要进行假设检验来验证事先设定的共同因素是否合理。
探索性因素分析的具体步骤如下:1. 确定因子数。
通常可以通过选择每个因子所解释的方差百分比来确定因子数。
例如,当前三个因子可以解释总方差的60%时,我们可以选择三个因子来解释原始数据。
2. 确定因素旋转方法。
旋转方法可以保证因素间彼此独立,且每个因子更容易解释。
在因素旋转方法方面,比较经典的有正交旋转和斜交旋转。
正交旋转(例如varimax旋转)可以保证因子之间没有相关性,因此它更适合解释要素之间明确不相关的情况。
而斜交旋转(例如promax旋转)允许因子之间有相关性,因此对于与解释有关联的要素,它可能是更好的选择。
3. 计算因子得分。
因子得分是根据原始变量计算出的每个因子的数值。
得分可以通过因子负荷(factor loadings)计算得出,即每个变量与每个因子之间的关系。
因子负荷可以理解为一个指标表征变量与共同因素之间的相关性,即指标越高,变量与共同因素之间的相关性越大,这个指标越能代表这个共同因素。
二、因素分析法的应用因素分析法的应用非常广泛,在统计分析中占据很重要的地位。
探索性因素分析

km
Q
bij2 Max
i1 j1
②方差最大法(VARIMAX)
四次方最大法的不同是它从简化因子负荷 矩阵的每一列出发,使和每个因子有关 的负荷平方的方差最大。方差最大法通 过使下式达到最大求得因子解:
mk
k
V (k bij4( bij2)2)/k2
j1 i1
i1
③等量最大法(EQUIMAX)
求因素得分涉及到用观测变量来描述因 素,第p个因子在第i个个案上的值可以 表示为:
k
f pi wpjZ ji j1
其w值中p系j,是数z第ji。是p个第因j个子变和量第在j个第变i 个量个之体间上的的因值子,
因素得分及其应用
这一模型确切地说应称为截分量模型(truncated component model),但经常被称作主成分分析模 型。误差项ajej表示被忽略的几项因素之和。
公共因素模型
指所有观测变量中每个观测变量均可被表示为m个公共 因素和一个唯一性因素的线性加权之和:
Z j a j 1 F 1 a j 2 F 2 a jF m m d j u j
唯一性方差(uniqueness)
归因于唯一性因素的那部分方差称 为唯一性方差,唯一性方差表示m 个公共因素对观测变量的方差不能 作出解释的部分,一部分归因于所 选变量的特殊性,称为特殊性方差; 剩余部分归因于测量的不完备性。
特征值
特征值: 对于一个n阶矩阵A,如果 存在一个n维向量v和一个常数,满足 条件
z i是j 第i个体在第j观测变量上的得分,( j k)是因素对观
测变量的加权系数,(Fik)是个体i在因素F k上的得分, Uij为特殊因素,dj为特殊因素对观测变量的加权系数;N 为样本容量,n为观测变量的个数,m为共因素的个数。 因素分析的模型主要有全分量模型和公因子模型两个。
探索性因素分析

4. 根据以上三方面的信息将可能的因素个数压 缩到一个比较小的范围内
5. 根据4 分别抽取不同个数的因素比较旋转后 因素负荷的可解释性以作出最终决定
这是一个相对比较全面的程序。研究者可以 批判性地采用总之因素个数的确定并不存在 着唯一 正确 客观的答案
最大似然法的模型拟合度
由因素个数从多到少考察最大似然法的 模型拟合度
当拟合度由不显著变为显著时,此时的 因素数目即合适的因素抽取个数
因素所能解释方差的百分比
所有因素所能解释方差的累计百分比应 超过40%。
Browne 提出了以下的程序
1. 考虑研究者在理论中是否事先假设了因素个 数
2. 考虑一些简单方法如Kaiser 法,Scree Test 所提供的信息
最大似然法 (maximum-likelihood method)
–相关系数经变项的残差 (uniqueness)加权后,利用参数 估计(paratemer estimation)原 理,估计出最可能出现的相关矩阵 的方法 。
主成分分析 (PCA) 与 主因素分析 (PFA) 的适用条件
目的方面:PCA用于分类; PFA用于探讨结构 PCA
PCA 特征值 > 1 的规则抽取 直交旋转 因素负载只显示>.40的,整齐结构
1.因素的抽取 2. 因素个数的确定 3. PCA结构矩阵所包含的信息 4. 因素的命名 5. 因素转轴 6. 因素分析的统计假定 7. 主成分分析和因素分析 8. 探索性因素分析和验证性因素分析
1.因素的抽取 (factor extraction)
解释一组变量的总方差 (独特方差+共同方差 ) 可用于对一组变量进行分类 是最常用的因素分析选择。
探索性因素分析详解

选择需要因素分析的变量(题目)
•Descriptive描述按钮: initial solution方差累计百分比 KMO抽样适当性检验
Extraction萃取按钮: Principal components主成分分析法 Correlation matrix相关矩阵 Screet plot陡坡图 Eigenvalues over(选1)或number of factors(自己指定)
这次我们把因素数目选为6,同时 删掉题58
KMO值降低了一点哦 为什么?
解释变异量升高了! 为什么?
因素负荷:各因素下题目数适当、题目聚合在假设的同 一因素下,因素数目也与假设一致; 但,有些题目在其他因素下有较高负荷,说明它语义可 能有歧义,要删掉它们吗?
删掉“不干净”的题20、47、32、31、37、56、 19、39,因素负荷现在是:
探索因素分析验证的这个测验的结构效度(这是 我能做到的最好结果)是:
下一步:因素命名
根据每个因素下面所有题目所代表的意 义,结合所测的心理特质的操作性定义, 给各个因素命名来代表这些因素。
补充:高阶因素分析
也称二阶因素分析,本质上是把因素当 成题目来处理。
方法:先计算各因素的均分,并把它作 为一个变量来做因素分析
结构是指用来解释行为的理论框架或心理特质
“我们假设的结构是不是真的存在”? ——结构效度的验证
如何验证结构效度?
根据文献、前人的研究结果、实际经验建立假
设的结构(定义特质、确定维度) 根据假设的结构编制测验(编题目) 选取适当的对象进行测试(预测)
用统计方法考查测验是否能有效解释假设的理
Rotation旋转按钮 因素独立:varimax最大变异法 因素相关: direct oblimin直接斜交旋转法 Display:报告旋转后的相关信息
《探索性因素分析及SPSS应用》PPT课件

8、多极变量,即一个变量在几个因子上的负荷都较大。
返回
2004-3-10
1.因素抽取 主成分法 主轴因子法 极大似然法
……
未旋转解 共同度 特征值
3.因素旋转 方差最大法 平均正交法 斜交旋转
……
4. 据 简 单 结构解释 或确定因 子的含义
5.报告因素 模式和因素 结构
2.据碎石图 和特征值
确定因子数
2004-3-10
6.据结果调整旋转方法重复 该过程至重复抽取过程
返回
xk lk1 f1 lk 2 f2 lkm fm k
公因子理论:
p个观测变量,相当于一份问卷中的p个题项,它是一个随机 变量;不同被试都将有p个不同的数据;m个公因子,其值 称因子值(factor score);ε代表残差,包括特殊因子和误 差,是各变量中不能用公因子解释的部分;系数lij称为因子 负荷(factor loading),表示第i个变量在第j个因子上的相对重
回避了内容和理论,而关注应用 • 聚类分析(Cluster analysis): Holzinger, Tyron, & Bailey
相信较低水平的观测(如项目)可以被整合成较高水平 的具有理论价值的构念。
2004-3-10
返回
5
第一节 因素分析原理概述
Common Factor Theory及变异分解 题项1:我对我的薪水感到满意; 题项2:我对工作中的同事感到满意; 题项3:我对工作中的上司感到满意。
探索性因素分析

10一、主ຫໍສະໝຸດ 份分析的基本概念(2/2) 主成份分析除了用來簡化變數間之關係外,可用 來縮減某一組欲進行多變量分析之變數的數目。
主成份分析也可將各變數的原始分數轉為主成份 分數,以供進一步的統計分析。
主成份分析還可用來建構多種具有不同衡量單位 變數之綜合指標。
假設有p個數字變數,則可計算出p個主成份。
共同性會等於1,亦即沒有誤差項,故此公式 不寫出誤差項。
主成份分析重視的是「變異數」,因素分析 重視的則是「共變異數」。
主成份分析使觀察值在這些主成份乃顯示出 最大的個別差異。因素分析的目的是找出共 同性。
13
主成份萃取的運算原理
使組合
3、只取同一個主成份時,所能解釋各變數的共同性總和為 i p
h
2 ji
h
2 j1
h
2 j2
........
h
2 jp
h
2 j
j
i 1
28
6
進行因素分析前資料的檢視
1. 檢視資料的相關係數矩陣,相關係數須顯著的大於0.3。
2. Bartlett的球型檢定(Bartlett test of sphericity),此種統 計檢定主要是用來檢定變數間的相關係數是否顯著,核定 結果若p值小於0.05即代表顯著。
3. 取樣適切性量數(KMO),其值介於0到1之間,若KMO等於 1表示每一變數均可被其他變數完全的預測,若KMO≧0.9, 表示資料非常適合做因素分析;0.9>KMO≧0.8,表示很適 合;0.8>KMO≧0.7,表示還不錯;0.6>KMO≧0.5,表示不 太適合;KMO<0.5,表示資料不適合做因素分析。
探索性因素分析的原理与步骤

(五)、因子的解释
经验性&主观色彩 合理即可接受
分析 过程
1
操作 演示
结果 展示
2 3
目录
*
数据
数据符合相应假设 从数据得到的信息 进行EFA的必要性
SPSS操作演示
基于EFA对量表进行初步修订
判断:判断该数据是否适合采用因子分析 删除:删除那些负载小和重复负载的变量 提取:根据新的旋转成份矩阵和碎石图 方案:提出量表进一步修订的建议和方案
(三)、因子提取
三种方法:
1. 以特征跟是否>1为标准 2. 参考特征跟的碎石图 3. 方差贡献率
(三)、因子提取
唯一 正确 客观
综合判断
(四)、因素的旋转
目的:更易解释的负荷结构 方法:正交旋转VS斜交旋转
(四)、因素旋转
因素间可以相关 事实上的相关被强制限制 导致较差的拟合度 斜交旋转能提供更多的信息
分析 过程
1
操作 演示
结果 展示
2 3
目录
*
分析 过程
1
操作 演示
结果 展示
2 3
目录
*
探索性因素分析的基本过程
(一)、确定变量及样本
1. 高质量的数据产生高质量的信息 2.否则就是garbage in,garbage out
(二)、判断是否适合做EFA
1. 观察相关矩阵 2.KMO值检验和球形检验的结果
因子累计方差贡献率为55.866%,各个项目在相应因素上 具有较大的负荷,处于.553-.821之间。各因子内部一致性 系数在.803-.826, 问卷总的内部一致性系为.875。
。结果表示如下:
(四)、最终结果呈现
05.探索性因素分析

• 理解性
– 因素的可解释性和实际意义
• 强制抽取不同个数以综合比较
2015-2016学年第二学期 高级心理统计 14
因素旋转 (1/3)
• 旋转前后,各个因素的特征值以及观测变量的因 素载荷发生变化
• 特征值总和不变,即公因子所能够解释的总方差 比例不变 • 实际应用中多采用正交中的方差最大旋转(varimax), 即直交旋转 • 旋转使得因素分析的结果更清晰,但也更容易受 到研究者主观倾向的影响
hi ai1 ai 2 aim
2
2
2
2
2015-2016学年第二学期
高级心理统计
9
基本原理 (4/5)
• 特征值 (eigenvalue)
– 被某因素所解释的所有变量的方差,可以用所有变量在该因 素上载荷的平方和来计算
k
V p aip
i 1
2
– 如果一个因素的特征值较低,说明它对于变量方差解释的贡 献很小,可以忽略
xi ai1 f1 ai 2 f 2 aim f m ui
– 总体方差不变,f1抽取方差最大 (即主成分1),依次递减,直 到方差解释完。
• 主轴分析法 (Principal Axis Factor Analysis, PFA)
– 采用与PCA类似的策略,但目标是解释公因子方差 (所有方 差-独特方差)
05. 探索性因素分析
(Exploratory Factor Analysis)
胡天翊 tianyihutt@ 上海师范大学教育学院心理系
2015-2016学年第二学期 高级心理统计 1
基本思想
• 将一系列 变量归结为较少变量,以揭示其潜在结 构(维度) • 考察被试对哪些变量的反应具有相近的反应模式
第十章探索性因素分析

• Correlation Matrix框几种检验变量是否适宜做因素分析 Matrix框几种检验变量是否适宜做因素分析 的方法: 的方法 • Coefficients 计算相关系数矩阵 • Significance levels 显著性水平 • Determinant 相关系数的行列式 • Inverse 相关系数矩阵的逆矩阵 • Reproduced 再生相关矩阵 • Anti-image 反映像相关矩阵检验 • KMO and Bartlett’s test of sphericity检验变量的偏相关是 否很小,相关矩阵是否单位阵。
四、解释因子
• 因子旋转 因子旋转是实现因子解释的方法,其目的是通过改变坐标 轴的位置,重新分配各个因子所解释的方差比例,是因子 结构更简单更易于解释。 • 因子旋转的方法 因子旋转的方法: • 正交旋转(因子轴的夹角为90度)和斜交旋转(因子轴之 间的夹角小于90度)。 • 旋转方法选择的原则:依据研究问题的需要。如果只关心 旋转方法选择的原则 是几个因子则用正交旋转;如果要得到几个有理论和实际 意义的因子需采用斜交旋转。
• 因子分析有两个核心问题:构造因子变量;对因子变量进 行命名解释。 • 有四个步骤: • (1)确定原始变量是否适于因素分析 • (2)构造因子变量 • (3)利用旋转使得因子变量具有可解释性 • (4)计算因子变量得分
• 确定原始变量是否适于因素分析 • (1)计算相关系数矩阵,如果大部分相关系数均小于0.3, 说明不适合做因素分析; • (2)Bartlett test of sphericity(巴特利特球形检验),如果 P值小于0.05表明适合做因子分析 • (3)Anti-image correlation matrix(反映像相关矩阵检验), 如果反映像相关矩阵中有些元素的绝对值较大,说明这些 变量不适合做因子分析。 • (4)KMO(Kaiser-Meyer-Olkin)检验 • KMO取值范围在0—1之间,越接近于1越适合做因素分析。 • 其标准为: • 0.9<KMO非常适合; • 0.8<KMO<0.9适合; • 0.7<KMO<0.8一般;
高级心理统计7-探索性因素分析

4.3 因素旋转
正交 斜交
4.3 因素旋转
4.4 解释因素
因子矩阵解释步骤
1.检查载荷矩阵
2.找到每个变量在所 有因子中最高的载荷
3.评估变量的共同度
4.是否需要重设 模型
5.因子命名
因子载荷多大才算显著: • 至少大于0.30 • 一般应该大于0.40
在预设检验力水平下,样本量会影响统计显著性 • 样本量增大,判断载荷显著的临界值水平降低(更小的载荷就有可能显著)
3. 因子旋转的类型: 正交旋转:旋转轴保持90度 斜交旋转:旋转轴不保持90度
4.3 因素旋转
• 正交旋转
• 默认各因子之间不存在相关
• 正交旋转使用最为广泛 • 目的为数据简化时使用正交旋转
4.3 因素旋转
• 斜交旋转
• 允许因子之间存在相关 • 比正交旋转更加灵活
• 目的为得到有理论意义的因子 和结构时使用斜交旋转
理论问题
所选的一组变量中,确实存在某种潜在结构 样本是同质的,有相同的潜在结构
例如:
X1 X2 X3 X4 X5 X6
F
F
1
2
男性
X1 X2 X3 X4 X5 X6
F
F
1
2
女性
3.3 检验假设
实践问题
不要求正态性、方差齐性、线性 识别变量的内部相关 → 某种程度的共线性
相关
KMO值
3.3 检验假设
3.3 检验假设
Stage 1 Stage 2
研究问题
验证性
• 探索性/验证性? • 因子分析目的:
• 数据汇总&识别结构 • 数据简化
结构方程模 型
探索性
探索性因素分析最近10年的评述

探索性因素分析最近10年的评述一、本文概述探索性因素分析(Exploratory Factor Analysis, EFA)是一种广泛应用于社会科学、心理学、生物医学等多个领域的统计技术。
它通过提取和识别数据中的潜在结构,帮助研究者理解和解释复杂的多变量数据。
近年来,随着大数据时代的来临和统计方法的不断创新,探索性因素分析在理论和实践层面都取得了显著的进展。
本文旨在评述最近十年探索性因素分析的研究现状和发展趋势,包括其方法论的创新、应用领域的拓展以及面临的挑战和争议。
通过对这些内容的梳理和评价,本文旨在为研究者提供一个全面而深入的视角,以更好地理解和应用探索性因素分析这一重要的统计工具。
二、EFA的理论基础与核心方法探索性因素分析(Exploratory Factor Analysis,EFA)是一种在社会科学、心理学、市场研究等领域广泛应用的统计方法,旨在从一组变量中识别和提取潜在的、未知的结构或因素。
EFA的理论基础主要建立在因素分析理论之上,该理论假设观察到的多个变量之间存在一定的相关性,这些相关性可能源于某些潜在的、未观察到的变量或因素。
数据准备与检验:需要对数据进行预处理,包括缺失值处理、异常值检测等。
接着,进行数据的适用性检验,如KMO检验和Bartlett 球形检验,以确定数据是否适合进行因素分析。
因素提取:在数据通过适用性检验后,通过特定的算法(如主成分分析、主轴因子分析等)提取出潜在的因素。
这些因素是原始变量的线性组合,能够最大程度地解释原始变量之间的方差。
因素旋转:为了使得提取出的因素更具解释性,通常会对因素载荷矩阵进行旋转。
旋转后的矩阵使得每个因素在尽可能少的变量上有高载荷,而在其他变量上载荷较低。
这有助于识别每个因素所代表的具体含义。
因素解释与命名:根据旋转后的因素载荷矩阵,对每个因素进行解释和命名。
这通常依赖于研究者的专业知识和对研究领域的理解。
因素得分计算:可以计算每个观察值在各个因素上的得分,这些得分可以用于后续的统计分析或作为新的变量进行进一步的研究。
05.探索性因素分析

2015-2016学年第二学期
高级心理统计
6
基本原理 (2/5)
• 因子载荷 (factor loading)
– 反映了观测变量是如何由公因子线性表示的 – 也反映了因子和变量之间的相关程度。
• 变量相关
– 任何两个观测变量之间的相关系数等于对应因子载荷 乘积之和
用数目较少且更有意义的潜在构念来解释一组观测变量在一组变量中选择少数几个最有代表性即与所有其他因素相关最高的变量建立少数几个独立的因素代替多数变量进行多元回归以解决多元共线性的问题量表的结构效度分析高级心理统计20152016学年第二学期基本目标考察被试在各个条目上的反应具有多大程度的变异并试图用较少的因子结构来解释这些变异即每个条目变量在多大程度上能用几个相同的因子来解释类似回归分析高级心理统计20152016学年第二学期基本原理15是公因子commonfactors是特殊因子uniquefactorsij是第i个观测变量在第j个公因子上的载荷因素分析模型假定k个特殊因子之间彼此独立特殊因子和公因子之间也彼此独立
rij ai1a j1 ai 2 a j 2 aim a jm
• 公因子模型是从解释变量相关关系的角度出发的
2015-2016学年第二学期 高级心理统计 7
2015-2016学年第二学期
高级心理统计
8
基本原理 (3/5)
• 共同度 (communality)
– 即公因子方差,观测变量方差由公因子解释的比例。 当公因子彼此独立 (正交)时,等于该变量有关的因子载 荷的平方和
高级心理统计
3
基本目标
• 考察被试在各个条目上的反应具有多大程度的变 异,并试图用较少的因子结构来解释这些变异
探索性因素分析

探索性因素分析探索性因素分析(ExploratoryFactorAnalysis)是一种常用的数据分析方法,用于研究大量数据背后隐藏的关系和模式。
它是一种运用统计技术,对大量的观测数据进行凝练和分析的过程,帮助研究者理解数据背后的结构和模式。
探索性因素分析的目的是通过提取可以从原始观测数据中获取的未知因素,识别数据中的结构特征。
它利用这些因素构建一个模型,以更好地解释数据背后的模式,以解释被考虑变量间的差异。
与其他统计方法相比,探索性因素分析有着独特的优势:它可以从未经处理的原始数据中提取出潜在的因素,并以更加简洁的方式解释数据。
探索性因素分析的主要步骤包括:(1)数据收集;(2)特征抽取;(3)因素析出;(4)因素解释。
第一步是数据收集,探索性因素分析是建立在有充分数据的基础上的,因此,研究者必须准备充分的数据,以便有效地进行分析。
为了收集有价值的数据,研究者可以使用诸如问卷调查、实验测量、数据库档案等数据收集方式。
第二步是特征抽取,研究者可以通过使用诸如旋转、标准化等技术,从观测数据中提取出可以表达其表征的特征,以便进一步的分析。
第三步是因素析出,研究者可以通过使用像主成分分析、因子分解等因素析出技术,从观测数据中提取出潜在的因素。
最后一步是因素解释,研究者可以将提取出的因素用于解释观测数据中的变量,通过观察每个因素的因素负荷度,以便理解原始数据背后的模式。
探索性因素分析在很多诸如心理学、市场营销、社会学、经济学等领域都得到了广泛的应用,它在这些研究领域中都有着重要的作用。
它提供了一种简便易行的方法,帮助研究者从大量观测数据中提取出模式以及更有意义的结果。
总之,探索性因素分析是一种有用的数据分析方法,它可以帮助研究者从数据中获取有价值的信息,为后续的研究和应用提供支持和依据。
探索性因素分析.

1
相關矩陣
Observed correlation matrix 由觀察變項計算得到的相關係數矩陣 Reproduced correlation matrix 由因素導出的相關係數矩陣 Residual correlation matrix
因素分析的目的與問題
因素分析的主要目的在將繁多的變項縮減為少
數的因素,找出變項背後的結構,涉及下列問 題的探討
因素數目的決定 因素的內容與性質 因素的重要性 理論的檢驗 因素分數的估計
4
因素分析的限制
理論層次的問題
因素的抽取必須具有相當的理論與邏輯基礎。重要的因素必須被涵蓋,無關的 測量應該被排除 因素背後應有特定且穩定的測量變項, 稱為marker variable,是用來定義因素 的重要變項 因素內的複雜性需被仔細的評估。反應在與多個因素有關係的觀察變項 樣本的選取需能涵蓋測量變項的變異性 樣本間的比較亦能反應因素的特性
因素分析受到相關係數的特性所影響,任何影響相關係數的原因都可能干擾因 素分析 樣本數、遺漏值、常態性、線性關係、偏離值 多元共線性(multicollinearity)與單一性(singularity),極端的共線性與單一性對於 因素分析具有影響 相關係數的大小:如果觀察矩陣中相關係數均小於.3,抽取因素能力低,可能 需放棄使用因素分析 因素分析的偏離值:當某測量變項不被因素所解釋時。當僅有兩個變項所決定 的因素,可能是一種不穩定的因素。
PCA:
以最少的直交成分來解釋最大的變項變異量 具有單一的數學解
FA:
以最少的直交因素來反應相關矩陣 具有不同的最佳解
探索性因素分析的原理与应用

(4)Equamax:平方最大正交旋转。
(5)Promax:在方差极大正交旋转的基础上进
行斜交旋转。
33
根据旋转后的因素载荷矩阵可以清晰
地确定因素中的变量:将对同一因素
上不同载荷的变量进行大小排序,因
素载荷小的变量将从该因素中删除。 一般是以载荷量=0.3为临界值标准。
34
含义:指确定不同公共因素在对某一原始变
29
Scree Plot
4
3
Eigenvalue
2
1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
C omponent Number
30
统计学含义:指对初始抽取的因素载荷矩 阵实施旋转变换,使得因素载荷矩阵中的 相关系数更加显著,相关系数向0和1两极 转化,从而使各个因素的意义更加明显。 旋转的目的:当初始载荷不易解释时,常 对载荷做旋转,以使各变量在各因素上的 载荷或者变大或者变小,以便得到一个更 简单而易于解释的结构。
累积贡献率:是所有主要因素贡献率的和。
21
计算
相关
矩阵
因素
因素
计算
解释
提取
旋转
因素
分数
因素
含义
22
作用:检验因素分析的适用性。若大部分变 量之间的相关很小,表明它们之间共享因素
的可能性很小;变量之间应该有较大的相关,
且绝对值较大并显著时,才可进行因素分析。
方法:计算所有变量之间的相关系数,涉及
9
要提取几个因素?
每个因素包含哪些变量? 为确定的因素命名并解释其含义。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、探索性因素分析的原理
1、因素分析模型 K个观测变量,分别为x1,x2,…,xk, xi为具有零均值, 单位方差的标准化变量。 因子模型的一般表达式为:
因子负载(Factor loadings) 特殊因子 (Ufacotor)
xi ai1 f 1 ai 2 f 2 ... aimfm ui (i 1, 2,..., k )
因子之间彼此独立 特殊因子和公因子之间彼此独立
二、探索性因素分析的原理
a11 .
二、探索性因素分析的原理
2、因素分析中的有关概念 (1)因子负载(loading):当公因子之 间完全不相关时,aij等于第i个变量和第j个 因子之间的相关系数。 反映了因子和变量之间的相关程度 大多数情况下,人们往往假设公因子之间 时彼此正交的(Orthogonal),即不相关。
三、探索性因素分析的步骤
判断是否适合做因素分析的方法:
(2)巴特利特球体检验(Bartlett test of sphericity) 差异显著——适合做因素分析
三、探索性因素分析的步骤
(3)KMO(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)测度 比较观测变量之间的简单相关系数和偏相 关系数的相对大小出发,其值的变化范围 从0到1 KMO<0.5肯定不适合做因素分析,最好大 于0.8
四、求解初始因子
2、公因子分析法 公因子方差的估计
用主成分分析的结果作为公因子方差的初始估计值 把每个变量和其余变量的相关系数中绝对值最大的, 作为该变量的公因子方差的初始估计值 用每个变量和剩下的其他变量的复相关系数的平方, 即R2作为该变量的公因子方差的初始估计值。
变量数量越少,不同方法之间的差异越大
三、探索性因素分析的步骤
3、确定因子个数。 有具体的假设,它决定了因子的个数; 没有假设,仅仅希望最后的到的模型能用尽可能 少的因子解释尽可能多的方差。 如果有k个变量,最多只能提取k个因子。通过检 验数据来确定最优因子个数的方法有很多。 Kaiser准则要求因子个数与相关系数矩阵的特征 根个数相等;而Screen检验要求把相关系数矩阵 的的特征根按从小到大的顺序排列,绘制成图, 然后来确定因子的个数。 究竟采用哪种方法来确定因子个数,具体操作时 可以视情况而定。
探索性因素分析
中国人民大学 心理学系 董妍 副教授
一、因素分析的概念
因素分析是多元统计分析技术的一个分支。 主要目的:浓缩数据 通过研究众多变量之间的内部依赖关系,探求观测 数据中的基本结构,并用少数几个假想变量来表示 基本的数据结构。这些假想变量能够反映原来众多 的观测变量所代表的主要信息,并解释这些观测变 量之间的相互依存关系。 这些假想变量称为基础变量,即因子(Factors)。 因素分析就是研究如何以最少的信息丢失把众多的 观测变量浓缩为少数几个因子。
二、探索性因素分析的原理
x1 0.9562 f 1 0.2012 f 2 0.2126u1 x 2 0.8735 f 1 0.2896 f 2 0.3913u 2 x3 0.1744 f 1 0.8972 f 2 0.4057u 3 x 4 0.5675 f 1 0.7586 f 2 0.3202u 4 x5 0.8562 f 1 0.3315 f 2 0.3962u 5
四、求解初始因子
1、主成分分析 (1)主成分的几何意义
空间分布
(2)主成分的求解
特征方程 主成分之间是不相关的,且fp的方差等于λ p。 ∑ λ p=K,即特征值的和等于变量数 每个主成分所解释的方差等于所有变量在该主 成分上负载的平方和
四、求解初始因子
1、主成分分析 (3)因子个数的确定 特征值准则
二、探索性因素分析的原理
(3)因子的贡献 x1 0.9562 f 1 0.2012 f 2 0.2126u1 每个公因子对数据的解 释能力,可以用该因子 x 2 0.8735 f 1 0.2896 f 2 0.3913u 2 所解释的总方差来衡量, x3 0.1744 f 1 0.8972 f 2 0.4057u 3 通常称为该因子的贡献 x 4 0.5675 f 1 0.7586 f 2 0.3202u 4 (Contributions),记 x5 0.8562 f 1 0.3315 f 2 0.3962u 5 为Vp。它等于和该因子 有关的因子负载的平方 相对指标:每个因子所 和。公因子的总贡献等 解释的方差占所有变量 于各个因子贡献的和。 总方差的比例。
二、探索性因素分析的原理
(2)公因子方差 (Communality) 也叫共同度,又称公共方 差,指观测变量方差中由 公因子决定的比例,Hi2。 当公因子之间正交时,公 因子方差等于和该变量有 关的因子负载的平方和。 公因子方差表示了变量方 差中能被公因子所解释的 部分。
x1 0.9562 f 1 0.2012 f 2 0.2126u1 x2 0.8735 f 1 0.2896 f 2 0.3913u 2 x3 0.1744 f 1 0.8972 f 2 0.4057u 3 x4 0.5675 f 1 0.7586 f 2 0.3202u 4 x5 0.8562 f 1 0.3315 f 2 0.3962u5
二、探索性因素分析的原理
将彼此高度相关而又与别的变量相对独立 的一组变量聚合成群,称之为“因素” (又称潜变量)。 基本思想是,根据相关性大小把变量分组, 使得同组内的变量间相关较高,不同组变 量间的相关较低;每组变量代表一个基本 结构,即因素。 其目的是识别少数几个因子,以之表示并 解释多个相关变量之间的关系,从而减少 变量数目,简化复杂的数据结构。
大于1 应用最普遍
碎石检验准则(Scree test criterion)
曲线变平开始前一个点认为是提取的最大因子数
事先确定因子数 结合几个准则
四、求解初始因子
2、公因子分析法 主成分分析从解释变量的方差出发,假设变量的 方差能完全被主成分所解释,而公因子模型是从 解释变量之间的相关关系出发的,假设观测变量 之间的相关能完全被公因子解释,变量的方差不 一定能完全被公因子解释,这样每个变量被公因 子所解释的方差不再是1,而是公因子方差。所以 公因子模型在求因子解的时候子。 因子的提取方法也有多种,主要有主成分 方法、不加权最小平方法、极大似然法等, 我们可以根据需要选择合适的因子提取方 法。其中主成分方法一种比较常用的提取 因子的方法。
三、探索性因素分析的步骤
5、因子旋转。由于因子载荷阵的不唯一 性,可以对因子进行旋转,而正是由于这 一特征,使得因子结构可以朝我们可以合 理解释的方向趋近。我们用一个正交阵右 乘已经得到的因子载荷阵(由线性代数可 知,一次正交变化对应坐标系的一次旋 转),使旋转后的因子载荷阵结构简化。 旋转的方法也有多种,如正交旋转、斜交 旋转等,最常用的是方差最大化正交旋转。
两个观测变量之间的相关 ri j= a11a21+a21a22+….aimajm
二、探索性因素分析的原理
由因子模型导出的变量之间的相关系数可 以用来判断因子解是否合适,如果从观测 数据计算出的相关系数和从模型导出的变 量的相关系数差别很小,那么我们可以说 模型很好地拟合了观测数据,因子解是合 适的。
一、因素分析的概念
因素分析的历史
1904年斯皮尔曼(Charles Spearman)
应用领域
心理学、社会学、经济学、医学、地质学、气 象学和市场营销等
一、因素分析的概念
作用
寻求基本结构(Summarization)
• 高度相关的变量
化简数据(Data reduction)
• 用因子代替原来的观测变量进行其他统计分析 • 利用因子值对样本进行分类和综合评价
三、探索性因素分析的步骤
7、因子得分。因素分析的数学模型是将 变量表示为公共因子的线性组合,由于公 共因子能反映原始变量的相关关系,用公 共因子代表原始变量时,有时更利于描述 研究对象的特征,因而往往需要反过来将 公共因子表示为变量的线性组合,即因子 得分。
三、探索性因素分析的步骤
如果变量之间的相关程度很小,即大部分 相关系数都小于0.3,则不适合做因素分析。 判断是否适合做因素分析的方法: (1)反映象相关矩阵(Anti-image correlation matrix)。其元素等于负的偏 相关系数 很多元素的值比较大,考虑不适合做因素 分析
公因子(common factors)
f 1, f 2,..., fm
二、探索性因素分析的原理
1.因素分析模型 公因子:各个观测变量所共有的因子,解释了 变量之间的相关 特殊因子:每个观测变量所特有的因子,相当 于多元回归中的残差项,表示该变量不能被公 因子所解释的部分。 因子负载:第i个变量在第j个公因子上的负载, 相当于多元回归分析中的标准化回归系数。 i 1,..., k ; j 1,..., m
一、因素分析的概念
因素分析主要有两种基本形式:探索性因 素分析(Exploratory Factor Analysis) 和验证性因素分析(Confirmatory Factor Analysis)。
探索性因素分析(EFA)致力于找出事物内在 的本质结构; 验证性因素分析(CFA)是用来检验已知的特 定结构是否按照预期的方式产生作用。
三、探索性因素分析的步骤
1、收集观测变量。由于总体的复杂性和统计基 本原理的保证,为了达到研究目的,我们通常采 用抽样的方法收集数据。所以我们必须按照实际 情况收集观测变量,并对其进行观测,获得观测 值。 2、获得协方差阵(或相关系数矩阵)。我们所 有的分析都是从原始数据的协方差阵(或相关系 数矩阵)出发的,这样使我们分析得到的数据具 有可比性,所以首先要根据资料数据获得变量协 方差阵(或相关系数矩阵)。