探索性因素分析
探索性因素分析的原理与步骤知识讲解
探索性因素分析的原理与步骤知识讲解探索性因素分析(Exploratory Factor Analysis,EFA)是一种多变量分析方法,旨在确定观察数据中潜在的结构或维度。
它可以帮助研究者发现数据中隐藏的模式和关联,进而减少数据的复杂性,并起到简化和理解数据的作用。
以下是探索性因素分析的原理与步骤的知识讲解。
原理:探索性因素分析基于统计原理,假设观察数据是由一组潜在变量(即因素)决定的。
每个因素代表一组具有内在关联的观察变量,它们共同解释了数据中的方差。
因此,探索性因素分析的目标是找出这些潜在因素的数量和结构,并确定它们与观察变量之间的关系。
步骤:1.确定分析目标:在进行探索性因素分析之前,需要明确分析的目标和研究问题。
明确问题有助于选择适当的分析方法和解释结果。
2.数据准备与预处理:将需要分析的数据整理为适合因素分析的格式。
常见的预处理包括数据标准化、缺失值处理和异常值处理等。
4.因素提取:在这一步骤中,通过计算特征值、特征向量或因子载荷来确定潜在因素的数量和结构。
特征值表示一个因素解释的方差比例,而特征向量是表示潜在因素之间关系的向量。
因子载荷是观察变量与潜在因素之间的相关系数。
5. 因子旋转:在因子提取之后,因子结构可能并不是直观和可解释的。
因此,需要进行因子旋转以改善因子解释性和解释因素的意义。
常见的因子旋转方法包括正交旋转(如Varimax)和斜交旋转(如Promax)等。
6.因子解释和命名:根据提取的因子载荷和因子旋转结果,解释每个因素所代表的观察变量的意义。
通过命名每个因素,以增加对潜在因素结构的理解和解释。
7.评估因子模型:对于确定的因子结构,需要进行信度和效度分析来评估模型的质量和适用性。
信度分析衡量因子和观察变量之间的内部一致性,而效度分析衡量因子与其他变量之间的关系。
8.结果解释与报告:根据分析结果进行解释和报告。
包括提取的因子数目、每个因子的载荷、因子间的关系、因子的解释以及模型的信度和效度指标。
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](多变量统计分析简介)
第13章多变量统计分析简介1.探索性因素分析与验证性因素分析有什么区别?答:(1)探索性因素分析(exploratory factor analysis,简写为EFA)就是指传统的因素分析。
这种因素分析方法对于观察变量因子结构的寻找,并未有任何事前的预设假定。
对于因子的抽取、因子的数目、因子的内容以及变量的分类,研究者也没有事前的预期,而是由因素分析的程序去决定。
在典型的EFA中,研究者通过共变关系的分解,找出最低限度的主要成分(principal component)或共同因子(common factor),然后进一步探讨这些主成分或共同因子与个别变量的关系,找出观察变量与其相对应因子之间的强度,也就是因子负荷值(factor loading),以说明因子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。
由于传统的因素分析企图找出最少的因子来代表所有的观察变量,因此研究者必须在因子数目与可解释变异量(explained variance)两者间寻找平衡点。
因为因素分析至多可以抽取出相等于观察变量总数的因子数目,这样,虽然可以解释全部百分之百的变异,但失去因素分析找寻因子结构的目的,但如果研究者企图以少数几个较明显的因子来代表所有的项目,势必然将损失部分可解释变异来作为代价。
因而在EFA中,研究者相当一部分工作是在决定因子数目与提高因子解释的变异(即R square)。
(2)验证性因素分析(confirmatory factor analysis,简写为CFA)是在研究人员积极改善传统因素分析的限制,扩大其应用范围的基础上产生的。
这类因素分析要求,研究者对于潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观察变量的组成模式,进行因素分析的目的是为了检验这一先期提出的因子结构的适合性。
这种因素分析方法也可用于理论架构的检验,它在结构方程模型中占有相当重要的地位,有着重要的应用价值,也是近年来心理测量与测验发展中相当重视的内容。
探索性因素分析
4. 根据以上三方面的信息将可能的因素个数压 缩到一个比较小的范围内
5. 根据4 分别抽取不同个数的因素比较旋转后 因素负荷的可解释性以作出最终决定
这是一个相对比较全面的程序。研究者可以 批判性地采用总之因素个数的确定并不存在 着唯一 正确 客观的答案
最大似然法的模型拟合度
由因素个数从多到少考察最大似然法的 模型拟合度
当拟合度由不显著变为显著时,此时的 因素数目即合适的因素抽取个数
因素所能解释方差的百分比
所有因素所能解释方差的累计百分比应 超过40%。
Browne 提出了以下的程序
1. 考虑研究者在理论中是否事先假设了因素个 数
2. 考虑一些简单方法如Kaiser 法,Scree Test 所提供的信息
最大似然法 (maximum-likelihood method)
–相关系数经变项的残差 (uniqueness)加权后,利用参数 估计(paratemer estimation)原 理,估计出最可能出现的相关矩阵 的方法 。
主成分分析 (PCA) 与 主因素分析 (PFA) 的适用条件
目的方面:PCA用于分类; PFA用于探讨结构 PCA
PCA 特征值 > 1 的规则抽取 直交旋转 因素负载只显示>.40的,整齐结构
1.因素的抽取 2. 因素个数的确定 3. PCA结构矩阵所包含的信息 4. 因素的命名 5. 因素转轴 6. 因素分析的统计假定 7. 主成分分析和因素分析 8. 探索性因素分析和验证性因素分析
1.因素的抽取 (factor extraction)
解释一组变量的总方差 (独特方差+共同方差 ) 可用于对一组变量进行分类 是最常用的因素分析选择。
探索性因素分析主成分分析与因素分析
一般加權最小平方法(generalized weighted least squares factoring) 在無加權平方法下,增加權數的考量(以共同性加權) 有較大的共同變異的變項被較大的加權
萃取結果
PCA:
以最少的直交成分來解釋最大的變項變異量
具有單一的數學解
FA:
以最少的直交因素來反應相關矩陣
具有不同的最佳解
6
不同的萃取方法一
主成分法(Principal components) 目的在使每一個成分能夠代表最大的觀察變異量 第一個主成分為觀察變項的線性整合,能夠反應最大的變異量, 依序發展各主成分 可以得到最大的解釋變異量
FA:尋找測量題目背後的結構與理論意涵,並利用這些潛在結構進行分析應用(得到因素 factors )
萃取過程
差異在於兩者對於觀察相關矩陣的處理方式
也就是處理變異數上的差異
PCA analyzes variance: 觀察變項的所有變異量均被分析(觀察相關係數矩陣中對角線總和)
FA analyzes covariance: 僅有共同變異量(shared variance)被分析(觀察相關係數矩陣中對 角線以共同性來取代)
5
因素分析的類型
不同萃取方法皆產生直交的成分或因素來反應觀察相關矩陣R
不同點在於抽取的標準不同,例如最大變異、最小殘差等
當樣本數大、觀察變項數目多或共同性估計相近時,各方法差異不大
因素分析結果是否穩定不是決定於萃取的方法而是變項間的關係
探索性因素分析讲解
二、探索性因素分析的原理
1、因素分析模型 K个观测变量,分别为x1,x2,…,xk, xi为具有零均值, 单位方差的标准化变量。 因子模型的一般表达式为:
因子负载(Factor loadings) 特殊因子 (Ufacotor)
xi ai1 f 1 ai 2 f 2 ... aimfm ui (i 1, 2,..., k )
因子之间彼此独立 特殊因子和公因子之间彼此独立
二、探索性因素分析的原理
a11 .
二、探索性因素分析的原理
2、因素分析中的有关概念 (1)因子负载(loading):当公因子之 间完全不相关时,aij等于第i个变量和第j个 因子之间的相关系数。 反映了因子和变量之间的相关程度 大多数情况下,人们往往假设公因子之间 时彼此正交的(Orthogonal),即不相关。
三、探索性因素分析的步骤
判断是否适合做因素分析的方法:
(2)巴特利特球体检验(Bartlett test of sphericity) 差异显著——适合做因素分析
三、探索性因素分析的步骤
(3)KMO(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)测度 比较观测变量之间的简单相关系数和偏相 关系数的相对大小出发,其值的变化范围 从0到1 KMO<0.5肯定不适合做因素分析,最好大 于0.8
四、求解初始因子
2、公因子分析法 公因子方差的估计
用主成分分析的结果作为公因子方差的初始估计值 把每个变量和其余变量的相关系数中绝对值最大的, 作为该变量的公因子方差的初始估计值 用每个变量和剩下的其他变量的复相关系数的平方, 即R2作为该变量的公因子方差的初始估计值。
探索性因素分析-淡江大学
13
理論架構1 --數學模式
Zjn=aj1F1n+aj2F2n+…+ajqFqn+djUjn, j=1,2,…,p, n=1,2,…,N
其中
Zjn:第n個樣本單位在第j個觀察變數的分數 Fin:第n個樣本單位在第i個共同因素之分數 Ujn:第n單位在第j個觀察變數的獨特因素之分數 aji:為因素權重(factor weight) ,用以表示第i個共同因 素對第j個觀察變數之權重,又稱為組型(or因素)負荷量 (pattern loading) dj:第j個觀察變數之獨特因素的權重 且假設 Z、F、U均為已標準化之分數 ~N(0,1)
驗証性因素分析(Confirmatory factor analysis)
8
探索性因素分析 v.s.驗証性因素分析
由三個變數x1, x2, x3找到2個共同因素f1, f2,則其路徑圖如下
其中表可觀測的, 表不可觀測的。 Note: 在驗證性因素分析路徑圖中並非每個因素 fi 皆與變數 xi 間有連線(即路徑) 一般使用LISREL分析方法
正面肯定
負面評價
9.我常會覺得自己是一個失敗者
6
潛伏結構
自尊因素 組型負荷量 自尊變數
我覺得自己和別人一樣有價值,I57
獨特性 0.368 0.395 0.429 0.501 0.467 0.582 0.266 0.364 0.555 0.45
獨特因素 e1 e2 e3 e4 e5 e6 e7 e8 e9 e10
27
未轉軸因素分析報表範例
19
(二) 共同因素之萃取方法
主軸法(method of principal) 是以共同因素對總共同性之貢獻極大化為萃取原則 重心法(centroid method of factoring) 在電腦普及以前,常以重心法估計組型負荷量 重心法是根據觀察變數之相關係數矩陣計算組型負 荷量 最大概似法(maximum likelihood analysis) 需先假設共同因素之個數及服從常態分配,然後依 此假定推導因素及共同性 缺點計算過程相當繁複且不一定得到收斂的結果 較適用於驗證性因素分析
第十章探索性因素分析
• Correlation Matrix框几种检验变量是否适宜做因素分析 Matrix框几种检验变量是否适宜做因素分析 的方法: 的方法 • Coefficients 计算相关系数矩阵 • Significance levels 显著性水平 • Determinant 相关系数的行列式 • Inverse 相关系数矩阵的逆矩阵 • Reproduced 再生相关矩阵 • Anti-image 反映像相关矩阵检验 • KMO and Bartlett’s test of sphericity检验变量的偏相关是 否很小,相关矩阵是否单位阵。
四、解释因子
• 因子旋转 因子旋转是实现因子解释的方法,其目的是通过改变坐标 轴的位置,重新分配各个因子所解释的方差比例,是因子 结构更简单更易于解释。 • 因子旋转的方法 因子旋转的方法: • 正交旋转(因子轴的夹角为90度)和斜交旋转(因子轴之 间的夹角小于90度)。 • 旋转方法选择的原则:依据研究问题的需要。如果只关心 旋转方法选择的原则 是几个因子则用正交旋转;如果要得到几个有理论和实际 意义的因子需采用斜交旋转。
• 因子分析有两个核心问题:构造因子变量;对因子变量进 行命名解释。 • 有四个步骤: • (1)确定原始变量是否适于因素分析 • (2)构造因子变量 • (3)利用旋转使得因子变量具有可解释性 • (4)计算因子变量得分
• 确定原始变量是否适于因素分析 • (1)计算相关系数矩阵,如果大部分相关系数均小于0.3, 说明不适合做因素分析; • (2)Bartlett test of sphericity(巴特利特球形检验),如果 P值小于0.05表明适合做因子分析 • (3)Anti-image correlation matrix(反映像相关矩阵检验), 如果反映像相关矩阵中有些元素的绝对值较大,说明这些 变量不适合做因子分析。 • (4)KMO(Kaiser-Meyer-Olkin)检验 • KMO取值范围在0—1之间,越接近于1越适合做因素分析。 • 其标准为: • 0.9<KMO非常适合; • 0.8<KMO<0.9适合; • 0.7<KMO<0.8一般;
05.探索性因素分析
2015-2016学年第二学期
高级心理统计
6
基本原理 (2/5)
• 因子载荷 (factor loading)
– 反映了观测变量是如何由公因子线性表示的 – 也反映了因子和变量之间的相关程度。
• 变量相关
– 任何两个观测变量之间的相关系数等于对应因子载荷 乘积之和
用数目较少且更有意义的潜在构念来解释一组观测变量在一组变量中选择少数几个最有代表性即与所有其他因素相关最高的变量建立少数几个独立的因素代替多数变量进行多元回归以解决多元共线性的问题量表的结构效度分析高级心理统计20152016学年第二学期基本目标考察被试在各个条目上的反应具有多大程度的变异并试图用较少的因子结构来解释这些变异即每个条目变量在多大程度上能用几个相同的因子来解释类似回归分析高级心理统计20152016学年第二学期基本原理15是公因子commonfactors是特殊因子uniquefactorsij是第i个观测变量在第j个公因子上的载荷因素分析模型假定k个特殊因子之间彼此独立特殊因子和公因子之间也彼此独立
rij ai1a j1 ai 2 a j 2 aim a jm
• 公因子模型是从解释变量相关关系的角度出发的
2015-2016学年第二学期 高级心理统计 7
2015-2016学年第二学期
高级心理统计
8
基本原理 (3/5)
• 共同度 (communality)
– 即公因子方差,观测变量方差由公因子解释的比例。 当公因子彼此独立 (正交)时,等于该变量有关的因子载 荷的平方和
高级心理统计
3
基本目标
• 考察被试在各个条目上的反应具有多大程度的变 异,并试图用较少的因子结构来解释这些变异
探索性因素分析
探索性因素分析探索性因素分析(ExploratoryFactorAnalysis)是一种常用的数据分析方法,用于研究大量数据背后隐藏的关系和模式。
它是一种运用统计技术,对大量的观测数据进行凝练和分析的过程,帮助研究者理解数据背后的结构和模式。
探索性因素分析的目的是通过提取可以从原始观测数据中获取的未知因素,识别数据中的结构特征。
它利用这些因素构建一个模型,以更好地解释数据背后的模式,以解释被考虑变量间的差异。
与其他统计方法相比,探索性因素分析有着独特的优势:它可以从未经处理的原始数据中提取出潜在的因素,并以更加简洁的方式解释数据。
探索性因素分析的主要步骤包括:(1)数据收集;(2)特征抽取;(3)因素析出;(4)因素解释。
第一步是数据收集,探索性因素分析是建立在有充分数据的基础上的,因此,研究者必须准备充分的数据,以便有效地进行分析。
为了收集有价值的数据,研究者可以使用诸如问卷调查、实验测量、数据库档案等数据收集方式。
第二步是特征抽取,研究者可以通过使用诸如旋转、标准化等技术,从观测数据中提取出可以表达其表征的特征,以便进一步的分析。
第三步是因素析出,研究者可以通过使用像主成分分析、因子分解等因素析出技术,从观测数据中提取出潜在的因素。
最后一步是因素解释,研究者可以将提取出的因素用于解释观测数据中的变量,通过观察每个因素的因素负荷度,以便理解原始数据背后的模式。
探索性因素分析在很多诸如心理学、市场营销、社会学、经济学等领域都得到了广泛的应用,它在这些研究领域中都有着重要的作用。
它提供了一种简便易行的方法,帮助研究者从大量观测数据中提取出模式以及更有意义的结果。
总之,探索性因素分析是一种有用的数据分析方法,它可以帮助研究者从数据中获取有价值的信息,为后续的研究和应用提供支持和依据。
探索性因素分析的原理与应用
(4)Equamax:平方最大正交旋转。
(5)Promax:在方差极大正交旋转的基础上进
行斜交旋转。
33
根据旋转后的因素载荷矩阵可以清晰
地确定因素中的变量:将对同一因素
上不同载荷的变量进行大小排序,因
素载荷小的变量将从该因素中删除。 一般是以载荷量=0.3为临界值标准。
34
含义:指确定不同公共因素在对某一原始变
29
Scree Plot
4
3
Eigenvalue
2
1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
C omponent Number
30
统计学含义:指对初始抽取的因素载荷矩 阵实施旋转变换,使得因素载荷矩阵中的 相关系数更加显著,相关系数向0和1两极 转化,从而使各个因素的意义更加明显。 旋转的目的:当初始载荷不易解释时,常 对载荷做旋转,以使各变量在各因素上的 载荷或者变大或者变小,以便得到一个更 简单而易于解释的结构。
累积贡献率:是所有主要因素贡献率的和。
21
计算
相关
矩阵
因素
因素
计算
解释
提取
旋转
因素
分数
因素
含义
22
作用:检验因素分析的适用性。若大部分变 量之间的相关很小,表明它们之间共享因素
的可能性很小;变量之间应该有较大的相关,
且绝对值较大并显著时,才可进行因素分析。
方法:计算所有变量之间的相关系数,涉及
9
要提取几个因素?
每个因素包含哪些变量? 为确定的因素命名并解释其含义。
16【已修改】讲稿-探索性因素分析的原理-20181122
问卷效度
素分析。在因素分析这个大家庭中,探索性因素分析是一个非常重要
的成员,它能够有效检验各量表的建构效度。探索性因素分析中的“探
索”表示使用者在因素分析过程中可能要经由多次的因素分析程序,
才能得出最佳的问卷结构。
说到这里,大家肯定会觉得探索性因素分析非常神奇,明明通过专家
法都不一定能够解决的问题,为什么它就能够完成呢?它又是怎么样
判断问卷维度划分合不合理的呢?
这里我们就来了解下探索性因素分析的基本原理。
导入
大家都知道,在设计问卷时,需要先参考相关文献资料或理论假设出
问卷的基本维度,并根据维度编制相应的题目。比如这里,每一种图
形代表一种题目维度,正方形是第一个维度的题项,三角形是第二个
维度的题项,圆形是第三个维度的题项,那探索性因素分析是怎么样
验证这些维度划分合不合理的呢?
基本过程
基本原理 结束语
探索性因素分析首先模糊问卷的维度这个概念,认为问卷的各个题项 是彼此独立而毫无关联的。 探索性因素分析的过程其实是先对问卷初稿收集到的数据进行分析, 根据每一个题项数据的相似性和差异性对它们重新进行分门别类,从 而形成了一份新的问卷。形成的新问卷一个明显的特征就是题项变少 了。例如正方形这个维度里,六个题项变成了五个题项;三角形这里, 四个题项变成了三个题项;但是也有可能像圆这个维度,没有要删除 的题项。而那些被删除的题项往往都是那些解释度不高,不能够说明 问题的题项。通过对比分析新旧问卷,如果分析之前和分析之后它的 维度划分基本是一致的,就可以说原来的这个维度划分就是合理的。 讲到这里相信大家差不多明白探索性因素分析的原理了吧。 那么探索性因素分析到底是什么呢?它是因为题项不一定能纳入因 素解释的范围,因而要不断增删题项进行分析,要进行多次的因素分 析,不断探索最合理的因素效度,建构最优的因素结构。可见,之所 以叫作探索性因素分析不仅仅是因为它的目的是探索新的理论,更重 要的是,它的过程没有既定的程序,需要不断地探寻和摸索。 当然,在进行探索性因素分析时,我们首先需要建立一个假设性的理 论框架,然后根据理论框架编制出量表或者问卷,选择对象进行调查, 根据对收集到的数据进行一个分析统计从而判断这个问卷的建构效 度。 以上就是探索性因素分析基本原理的全部内容了,下节课即将学习具 体操作,大家敬请期待。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
f 1, f 2,..., fm
二、探索性因素分析的原理
1.因素分析模型 公因子:各个观测变量所共有的因子,解释了 变量之间的相关 特殊因子:每个观测变量所特有的因子,相当 于多元回归中的残差项,表示该变量不能被公 因子所解释的部分。 因子负载:第i个变量在第j个公因子上的负载, 相当于多元回归分析中的标准化回归系数。 i 1,..., k ; j 1,..., m
三、探索性因素分析的步骤
判断是否适合做因素分析的方法:
(2)巴特利特球体检验(Bartlett test of sphericity) 差异显著——适合做因素分析
三、探索性因素分析的步骤
(3)KMO(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)测度 比较观测变量之间的简单相关系数和偏相 关系数的相对大小出发,其值的变化范围 从0到1 KMO<0.5肯定不适合做因素分析,最好大 于0.8
三、探索性因素分析的步骤
7、因子得分。因素分析的数学模型是将 变量表示为公共因子的线性组合,由于公 共因子能反映原始变量的相关关系,用公 共因子代表原始变量时,有时更利于描述 研究对象的特征,因而往往需要反过来将 公共因子表示为变量的线性组合,即因子 得分。
三、探索性因素分析的步骤
如果变量之间的相关程度很小,即大部分 相关系数都小于0.3,则不适合做因素分析。 判断是否适合做因素分析的方法: (1)反映象相关矩阵(Anti-image correlation matrix)。其元素等于负的偏 相关系数 很多元素的值比较大,考虑不适合做因素 分析
三、探索性因素分析的步骤
4、提取因子。 因子的提取方法也有多种,主要有主成分 方法、不加权最小平方法、极大似然法等, 我们可以根据需要选择合适的因子提取方 法。其中主成分方法一种比较常用的提取 因子的方法。
三、探索性因素分析的步骤
5、因子旋转。由于因子载荷阵的不唯一 性,可以对因子进行旋转,而正是由于这 一特征,使得因子结构可以朝我们可以合 理解释的方向趋近。我们用一个正交阵右 乘已经得到的因子载荷阵(由线性代数可 知,一次正交变化对应坐标系的一次旋 转),使旋转后的因子载荷阵结构简化。 旋转的方法也有多种,如正交旋转、斜交 旋转等,最常用的是方差最大化正交旋转。
四、求解初始因子
2、公因子分析法 公因子方差的估计
用主成分分析的结果作为公因子方差的初始估计值 把每个变量和其余变量的相关系数中绝对值最大的, 作为该变量的公因子方差的初始估计值 用每个变量和剩下的其他变量的复相关系数的平方, 即R2作为该变量的公因子方差的初始估计值。
变量数量越少,不同方法之间的差异越大
四、求解初始因子
目的:确定能够解释观测变量之间相关系 数的最小因子个数 方法: 基于主成分分析模型的主成分分析法 基于公因子模型的公因素分析法,包括主 轴因子法、极大似然法、最小二乘法、 alpha法
四、求解初始因子
1、主成分分析法 主成分(Principal components)分析是一种数 学变换的方法,它把给定的一组(比如K个)相 关变量通过线性变换转换成另一组不相关的变量, 这些新的变量按照方差依次递减的顺序排列。在 数学变换中保持变量的总方差不变,使第一个变 量具有最大的方差,称为第一主成分,第二个变 量的方差次大,并且和第一个变量不相关,称为 第二主成分,依次类推,K个变量就有K个主成分, 最后一个主成分具有的方差最小,并且和前面的 主成分都不相关。
探索性因素分析
中国人民大学 心理学系 董妍 副教授
一、因素分析的概念
因素分析是多元统计分析技术的一个分支。 主要目的:浓缩数据 通过研究众多变量之间的内部依赖关系,探求观测 数据中的基本结构,并用少数几个假想变量来表示 基本的数据结构。这些假想变量能够反映原来众多 的观测变量所代表的主要信息,并解释这些观测变 量之间的相互依存关系。 这些假想变量称为基础变量,即因子(Factors)。 因素分析就是研究如何以最少的信息丢失把众多的 观测变量浓缩为少数几个因子。
大于1 应用最普遍
碎石检验准则(Scree test criterion)
曲线变平开始前一个点认为是提取的最大因子数
事因子分析法 主成分分析从解释变量的方差出发,假设变量的 方差能完全被主成分所解释,而公因子模型是从 解释变量之间的相关关系出发的,假设观测变量 之间的相关能完全被公因子解释,变量的方差不 一定能完全被公因子解释,这样每个变量被公因 子所解释的方差不再是1,而是公因子方差。所以 公因子模型在求因子解的时候,只考虑公因子方 差。
两个观测变量之间的相关 ri j= a11a21+a21a22+….aimajm
二、探索性因素分析的原理
由因子模型导出的变量之间的相关系数可 以用来判断因子解是否合适,如果从观测 数据计算出的相关系数和从模型导出的变 量的相关系数差别很小,那么我们可以说 模型很好地拟合了观测数据,因子解是合 适的。
二、探索性因素分析的原理
1、因素分析模型 K个观测变量,分别为x1,x2,…,xk, xi为具有零均值, 单位方差的标准化变量。 因子模型的一般表达式为:
因子负载(Factor loadings) 特殊因子 (Ufacotor)
xi ai1 f 1 ai 2 f 2 ... aimfm ui (i 1, 2,..., k )
三、探索性因素分析的步骤
3、确定因子个数。 有具体的假设,它决定了因子的个数; 没有假设,仅仅希望最后的到的模型能用尽可能 少的因子解释尽可能多的方差。 如果有k个变量,最多只能提取k个因子。通过检 验数据来确定最优因子个数的方法有很多。 Kaiser准则要求因子个数与相关系数矩阵的特征 根个数相等;而Screen检验要求把相关系数矩阵 的的特征根按从小到大的顺序排列,绘制成图, 然后来确定因子的个数。 究竟采用哪种方法来确定因子个数,具体操作时 可以视情况而定。
二、探索性因素分析的原理
将彼此高度相关而又与别的变量相对独立 的一组变量聚合成群,称之为“因素” (又称潜变量)。 基本思想是,根据相关性大小把变量分组, 使得同组内的变量间相关较高,不同组变 量间的相关较低;每组变量代表一个基本 结构,即因素。 其目的是识别少数几个因子,以之表示并 解释多个相关变量之间的关系,从而减少 变量数目,简化复杂的数据结构。
四、求解初始因子
1、主成分分析 (1)主成分的几何意义
空间分布
(2)主成分的求解
特征方程 主成分之间是不相关的,且fp的方差等于λ p。 ∑ λ p=K,即特征值的和等于变量数 每个主成分所解释的方差等于所有变量在该主 成分上负载的平方和
四、求解初始因子
1、主成分分析 (3)因子个数的确定 特征值准则
二、探索性因素分析的原理
x1 0.9562 f 1 0.2012 f 2 0.2126u1 x 2 0.8735 f 1 0.2896 f 2 0.3913u 2 x3 0.1744 f 1 0.8972 f 2 0.4057u 3 x 4 0.5675 f 1 0.7586 f 2 0.3202u 4 x5 0.8562 f 1 0.3315 f 2 0.3962u 5
四、求解初始因子
2、公因子分析法 (1)主轴因子法(Principal axis factoring) (2)最小二乘法(Least squares) (3)最大似然法(Maximum likelihood) (4)α因子提取法(Alpha factoring) (5)映象分析法(Image analysis)
一、因素分析的概念
因素分析主要有两种基本形式:探索性因 素分析(Exploratory Factor Analysis) 和验证性因素分析(Confirmatory Factor Analysis)。
探索性因素分析(EFA)致力于找出事物内在 的本质结构; 验证性因素分析(CFA)是用来检验已知的特 定结构是否按照预期的方式产生作用。
三、探索性因素分析的步骤
1、收集观测变量。由于总体的复杂性和统计基 本原理的保证,为了达到研究目的,我们通常采 用抽样的方法收集数据。所以我们必须按照实际 情况收集观测变量,并对其进行观测,获得观测 值。 2、获得协方差阵(或相关系数矩阵)。我们所 有的分析都是从原始数据的协方差阵(或相关系 数矩阵)出发的,这样使我们分析得到的数据具 有可比性,所以首先要根据资料数据获得变量协 方差阵(或相关系数矩阵)。
三、探索性因素分析的步骤
6、解释因子结构 我们最后得到的简化的因子结构是使每个 变量仅在一个公共因子上有较大载荷,而 在其余公共因子上的载荷比较小,至多是 中等大小。这样我们就能知道所研究的这 些变量到底是由哪些潜在因素(也就是公 共因子)影响的,哪些因素是起主要作用 的,而哪些因素的作用较小,甚至可以不 用考虑。
二、探索性因素分析的原理
(3)因子的贡献 x1 0.9562 f 1 0.2012 f 2 0.2126 u1 每个公因子对数据的解 释能力,可以用该因子 x 2 0.8735 f 1 0.2896 f 2 0.3913u 2 所解释的总方差来衡量, x3 0.1744 f 1 0.8972 f 2 0.4057 u 3 通常称为该因子的贡献 x 4 0.5675 f 1 0.7586 f 2 0.3202 u 4 (Contributions),记 x5 0.8562 f 1 0.3315 f 2 0.3962 u 5 为Vp。它等于和该因子 有关的因子负载的平方 相对指标:每个因子所 和。公因子的总贡献等 解释的方差占所有变量 于各个因子贡献的和。 总方差的比例。