探索性因素分析
探索性因素分析的原理与步骤知识讲解
探索性因素分析的原理与步骤知识讲解探索性因素分析(Exploratory Factor Analysis,EFA)是一种多变量分析方法,旨在确定观察数据中潜在的结构或维度。
它可以帮助研究者发现数据中隐藏的模式和关联,进而减少数据的复杂性,并起到简化和理解数据的作用。
以下是探索性因素分析的原理与步骤的知识讲解。
原理:探索性因素分析基于统计原理,假设观察数据是由一组潜在变量(即因素)决定的。
每个因素代表一组具有内在关联的观察变量,它们共同解释了数据中的方差。
因此,探索性因素分析的目标是找出这些潜在因素的数量和结构,并确定它们与观察变量之间的关系。
步骤:1.确定分析目标:在进行探索性因素分析之前,需要明确分析的目标和研究问题。
明确问题有助于选择适当的分析方法和解释结果。
2.数据准备与预处理:将需要分析的数据整理为适合因素分析的格式。
常见的预处理包括数据标准化、缺失值处理和异常值处理等。
4.因素提取:在这一步骤中,通过计算特征值、特征向量或因子载荷来确定潜在因素的数量和结构。
特征值表示一个因素解释的方差比例,而特征向量是表示潜在因素之间关系的向量。
因子载荷是观察变量与潜在因素之间的相关系数。
5. 因子旋转:在因子提取之后,因子结构可能并不是直观和可解释的。
因此,需要进行因子旋转以改善因子解释性和解释因素的意义。
常见的因子旋转方法包括正交旋转(如Varimax)和斜交旋转(如Promax)等。
6.因子解释和命名:根据提取的因子载荷和因子旋转结果,解释每个因素所代表的观察变量的意义。
通过命名每个因素,以增加对潜在因素结构的理解和解释。
7.评估因子模型:对于确定的因子结构,需要进行信度和效度分析来评估模型的质量和适用性。
信度分析衡量因子和观察变量之间的内部一致性,而效度分析衡量因子与其他变量之间的关系。
8.结果解释与报告:根据分析结果进行解释和报告。
包括提取的因子数目、每个因子的载荷、因子间的关系、因子的解释以及模型的信度和效度指标。
使用SPSS进行探索式因素分析的教程
使用SPSS进行探索式因素分析的教程探索性因素分析是一种统计方法,用于确定一组变量之间的潜在结构。
SPSS是一种常用于数据分析的软件工具,它提供了强大的因素分析功能。
以下是一个使用SPSS进行探索性因素分析的简单教程,该教程可以帮助您了解如何使用SPSS来执行因素分析并对结果进行解释。
步骤1:导入数据步骤2:准备数据确保您的数据符合因素分析的前提条件。
确定您要进行因素分析的变量是否具有线性关系,并进行必要的数据转换(例如,对数转换)以满足这个条件。
步骤3:执行因素分析在SPSS的“分析”菜单下,选择“数据准备”和“因子”。
在弹出的对话框中,选择您要进行因素分析的变量并将其移动到“因子”框中。
选择“萃取方法”(如主成分分析或最大似然估计)并指定要提取的因素的数量。
您还可以选择执行因子旋转以获得更简单和解释性更强的因子结构。
步骤4:解读结果SPSS将生成一个因素分析的输出报告,其中包含多个表格和图形。
以下是一些常见的解读步骤:-总体解释:观察“总体解释”表,了解因子数量和提取方法的解释力度。
查看“因素”的特征值,了解提取的因子解释的总方差比例。
-因子负荷:查看“因子负荷”表,该表显示了原始变量与提取的因子之间的相关性。
较高的因子负荷表示原始变量与特定因子之间的较强关联。
-因子旋转:如果您选择了因子旋转,则查看“旋转因子载荷矩阵”表,该表显示了旋转后的因子负荷。
查看这些旋转后的因子负荷以确定是否存在更简单的因子结构。
-因子得分:根据选定的因子分析方法,可以生成每个观测值的因子得分。
这些得分表示了每个观测值在每个因子上的得分情况,可以用于后续的分析和解释。
步骤5:解释因子根据因子负荷和因子名称,解释每个因子代表的潜在结构。
结合领域知识和因子负荷,您可以确定每个因子是否与特定概念或潜在维度相关联。
步骤6:结果报告根据您的研究目的和需要,将因子分析的结果写入报告中。
确保清楚地描述因子数量、命名以及每个因子代表的结构或概念。
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](多变量统计分析简介)
第13章多变量统计分析简介1.探索性因素分析与验证性因素分析有什么区别?答:(1)探索性因素分析(exploratory factor analysis,简写为EFA)就是指传统的因素分析。
这种因素分析方法对于观察变量因子结构的寻找,并未有任何事前的预设假定。
对于因子的抽取、因子的数目、因子的内容以及变量的分类,研究者也没有事前的预期,而是由因素分析的程序去决定。
在典型的EFA中,研究者通过共变关系的分解,找出最低限度的主要成分(principal component)或共同因子(common factor),然后进一步探讨这些主成分或共同因子与个别变量的关系,找出观察变量与其相对应因子之间的强度,也就是因子负荷值(factor loading),以说明因子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。
由于传统的因素分析企图找出最少的因子来代表所有的观察变量,因此研究者必须在因子数目与可解释变异量(explained variance)两者间寻找平衡点。
因为因素分析至多可以抽取出相等于观察变量总数的因子数目,这样,虽然可以解释全部百分之百的变异,但失去因素分析找寻因子结构的目的,但如果研究者企图以少数几个较明显的因子来代表所有的项目,势必然将损失部分可解释变异来作为代价。
因而在EFA中,研究者相当一部分工作是在决定因子数目与提高因子解释的变异(即R square)。
(2)验证性因素分析(confirmatory factor analysis,简写为CFA)是在研究人员积极改善传统因素分析的限制,扩大其应用范围的基础上产生的。
这类因素分析要求,研究者对于潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观察变量的组成模式,进行因素分析的目的是为了检验这一先期提出的因子结构的适合性。
这种因素分析方法也可用于理论架构的检验,它在结构方程模型中占有相当重要的地位,有着重要的应用价值,也是近年来心理测量与测验发展中相当重视的内容。
探索性因素分析
4. 根据以上三方面的信息将可能的因素个数压 缩到一个比较小的范围内
5. 根据4 分别抽取不同个数的因素比较旋转后 因素负荷的可解释性以作出最终决定
这是一个相对比较全面的程序。研究者可以 批判性地采用总之因素个数的确定并不存在 着唯一 正确 客观的答案
最大似然法的模型拟合度
由因素个数从多到少考察最大似然法的 模型拟合度
当拟合度由不显著变为显著时,此时的 因素数目即合适的因素抽取个数
因素所能解释方差的百分比
所有因素所能解释方差的累计百分比应 超过40%。
Browne 提出了以下的程序
1. 考虑研究者在理论中是否事先假设了因素个 数
2. 考虑一些简单方法如Kaiser 法,Scree Test 所提供的信息
最大似然法 (maximum-likelihood method)
–相关系数经变项的残差 (uniqueness)加权后,利用参数 估计(paratemer estimation)原 理,估计出最可能出现的相关矩阵 的方法 。
主成分分析 (PCA) 与 主因素分析 (PFA) 的适用条件
目的方面:PCA用于分类; PFA用于探讨结构 PCA
PCA 特征值 > 1 的规则抽取 直交旋转 因素负载只显示>.40的,整齐结构
1.因素的抽取 2. 因素个数的确定 3. PCA结构矩阵所包含的信息 4. 因素的命名 5. 因素转轴 6. 因素分析的统计假定 7. 主成分分析和因素分析 8. 探索性因素分析和验证性因素分析
1.因素的抽取 (factor extraction)
解释一组变量的总方差 (独特方差+共同方差 ) 可用于对一组变量进行分类 是最常用的因素分析选择。
体育科学研究方法——第五章资料的整理与分析方法
体育科学研究方法——第五章资料的整理与分析方法尊敬的各位领导、专家、同事们:大家好!我今天将为大家讲解体育科学研究方法的第五章,资料的整理与分析方法。
资料的整理与分析是体育科学研究中非常重要的一环。
合理地整理和分析数据,可以为研究者提供有力的支持和论证,进而推动科学研究的发展。
一、资料的整理方法1.数据清洗数据清洗是整理数据的第一步,它的目的是删除、修正不完整、错误或不适用的数据。
数据清洗时,我们要注意遵循科学原则,确保数据的真实性、准确性和可靠性。
2.数据归类数据归类是将数据按照一定的规则分类,使得整理后的数据具有明确的结构和体系。
数据归类可以根据不同的研究目的和主题进行,例如按照运动员的年龄、性别、水平等进行分类。
3.数据标记数据标记是对整理后的数据进行标识和注释,以便后续的分析和处理。
数据标记可以通过添加注释、编号、符号等方式进行,使得数据在后续的分析过程中有更好的辨识度和可读性。
二、资料的分析方法1.描述性统计描述性统计是通过计算数据的均值、标准差、频数等指标来描述数据的主要特征和分布情况。
常用的描述性统计方法包括原始数据的整理和绘制直方图、散点图、饼图等,以及计算数据的总体均值、中位数、众数等。
2.探索性因素分析探索性因素分析是通过对数据进行降维处理,找出变量之间的相关性,提取出数据中的主要因素,并给出各因素的权重。
探索性因素分析在体育科学研究中常用于提取运动员身体素质测试中的主要影响因素。
3.相关性分析相关性分析是通过计算数据间的相关系数,研究两个或多个变量之间的相关关系。
常见的相关性分析方法包括皮尔逊相关系数、斯皮尔曼等级相关系数等。
相关性分析可以帮助研究者了解变量之间的关系,对研究结果进行解释和预测。
4.归因分析归因分析是研究数据中各因素对结果的影响程度和贡献度。
归因分析可以通过单因素方差分析、多因素方差分析等方法进行。
归因分析有助于确定哪些因素对结果具有显著影响,为研究者提供筛选和优化变量的依据。
探索性因素分析主成分分析与因素分析
一般加權最小平方法(generalized weighted least squares factoring) 在無加權平方法下,增加權數的考量(以共同性加權) 有較大的共同變異的變項被較大的加權
萃取結果
PCA:
以最少的直交成分來解釋最大的變項變異量
具有單一的數學解
FA:
以最少的直交因素來反應相關矩陣
具有不同的最佳解
6
不同的萃取方法一
主成分法(Principal components) 目的在使每一個成分能夠代表最大的觀察變異量 第一個主成分為觀察變項的線性整合,能夠反應最大的變異量, 依序發展各主成分 可以得到最大的解釋變異量
FA:尋找測量題目背後的結構與理論意涵,並利用這些潛在結構進行分析應用(得到因素 factors )
萃取過程
差異在於兩者對於觀察相關矩陣的處理方式
也就是處理變異數上的差異
PCA analyzes variance: 觀察變項的所有變異量均被分析(觀察相關係數矩陣中對角線總和)
FA analyzes covariance: 僅有共同變異量(shared variance)被分析(觀察相關係數矩陣中對 角線以共同性來取代)
5
因素分析的類型
不同萃取方法皆產生直交的成分或因素來反應觀察相關矩陣R
不同點在於抽取的標準不同,例如最大變異、最小殘差等
當樣本數大、觀察變項數目多或共同性估計相近時,各方法差異不大
因素分析結果是否穩定不是決定於萃取的方法而是變項間的關係
探索性因素分析讲解
二、探索性因素分析的原理
1、因素分析模型 K个观测变量,分别为x1,x2,…,xk, xi为具有零均值, 单位方差的标准化变量。 因子模型的一般表达式为:
因子负载(Factor loadings) 特殊因子 (Ufacotor)
xi ai1 f 1 ai 2 f 2 ... aimfm ui (i 1, 2,..., k )
因子之间彼此独立 特殊因子和公因子之间彼此独立
二、探索性因素分析的原理
a11 .
二、探索性因素分析的原理
2、因素分析中的有关概念 (1)因子负载(loading):当公因子之 间完全不相关时,aij等于第i个变量和第j个 因子之间的相关系数。 反映了因子和变量之间的相关程度 大多数情况下,人们往往假设公因子之间 时彼此正交的(Orthogonal),即不相关。
三、探索性因素分析的步骤
判断是否适合做因素分析的方法:
(2)巴特利特球体检验(Bartlett test of sphericity) 差异显著——适合做因素分析
三、探索性因素分析的步骤
(3)KMO(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)测度 比较观测变量之间的简单相关系数和偏相 关系数的相对大小出发,其值的变化范围 从0到1 KMO<0.5肯定不适合做因素分析,最好大 于0.8
四、求解初始因子
2、公因子分析法 公因子方差的估计
用主成分分析的结果作为公因子方差的初始估计值 把每个变量和其余变量的相关系数中绝对值最大的, 作为该变量的公因子方差的初始估计值 用每个变量和剩下的其他变量的复相关系数的平方, 即R2作为该变量的公因子方差的初始估计值。
探索性因素分析的原理与步骤
(五)、因子的解释
经验性&主观色彩 合理即可接受
分析 过程
1
操作 演示
结果 展示
2 3
目录
*
数据
数据符合相应假设 从数据得到的信息 进行EFA的必要性
SPSS操作演示
基于EFA对量表进行初步修订
判断:判断该数据是否适合采用因子分析 删除:删除那些负载小和重复负载的变量 提取:根据新的旋转成份矩阵和碎石图 方案:提出量表进一步修订的建议和方案
(三)、因子提取
三种方法:
1. 以特征跟是否>1为标准 2. 参考特征跟的碎石图 3. 方差贡献率
(三)、因子提取
唯一 正确 客观
综合判断
(四)、因素的旋转
目的:更易解释的负荷结构 方法:正交旋转VS斜交旋转
(四)、因素旋转
因素间可以相关 事实上的相关被强制限制 导致较差的拟合度 斜交旋转能提供更多的信息
分析 过程
1
操作 演示
结果 展示
2 3
目录
*
分析 过程
1
操作 演示
结果 展示
2 3
目录
*
探索性因素分析的基本过程
(一)、确定变量及样本
1. 高质量的数据产生高质量的信息 2.否则就是garbage in,garbage out
(二)、判断是否适合做EFA
1. 观察相关矩阵 2.KMO值检验和球形检验的结果
因子累计方差贡献率为55.866%,各个项目在相应因素上 具有较大的负荷,处于.553-.821之间。各因子内部一致性 系数在.803-.826, 问卷总的内部一致性系为.875。
。结果表示如下:
(四)、最终结果呈现
探索性因素分析-淡江大学
13
理論架構1 --數學模式
Zjn=aj1F1n+aj2F2n+…+ajqFqn+djUjn, j=1,2,…,p, n=1,2,…,N
其中
Zjn:第n個樣本單位在第j個觀察變數的分數 Fin:第n個樣本單位在第i個共同因素之分數 Ujn:第n單位在第j個觀察變數的獨特因素之分數 aji:為因素權重(factor weight) ,用以表示第i個共同因 素對第j個觀察變數之權重,又稱為組型(or因素)負荷量 (pattern loading) dj:第j個觀察變數之獨特因素的權重 且假設 Z、F、U均為已標準化之分數 ~N(0,1)
驗証性因素分析(Confirmatory factor analysis)
8
探索性因素分析 v.s.驗証性因素分析
由三個變數x1, x2, x3找到2個共同因素f1, f2,則其路徑圖如下
其中表可觀測的, 表不可觀測的。 Note: 在驗證性因素分析路徑圖中並非每個因素 fi 皆與變數 xi 間有連線(即路徑) 一般使用LISREL分析方法
正面肯定
負面評價
9.我常會覺得自己是一個失敗者
6
潛伏結構
自尊因素 組型負荷量 自尊變數
我覺得自己和別人一樣有價值,I57
獨特性 0.368 0.395 0.429 0.501 0.467 0.582 0.266 0.364 0.555 0.45
獨特因素 e1 e2 e3 e4 e5 e6 e7 e8 e9 e10
27
未轉軸因素分析報表範例
19
(二) 共同因素之萃取方法
主軸法(method of principal) 是以共同因素對總共同性之貢獻極大化為萃取原則 重心法(centroid method of factoring) 在電腦普及以前,常以重心法估計組型負荷量 重心法是根據觀察變數之相關係數矩陣計算組型負 荷量 最大概似法(maximum likelihood analysis) 需先假設共同因素之個數及服從常態分配,然後依 此假定推導因素及共同性 缺點計算過程相當繁複且不一定得到收斂的結果 較適用於驗證性因素分析
探索性因素分析
PFA
解释一组变量的共同方差(独特方差被设定为0) 可用于确定一组变量的维度 如量表中的一组题目 特别是用于检验一个 因素 能否解释一组变量的共同方差 缺点是有时会得到负的特征值, 是无意义的.
3. 考虑由最大似然法所产生的模型拟合度的信 息
4. 根据以上三方面的信息将可能的因素个数压 缩到一个比较小的范围内
5. 根据4 分别抽取不同个数的因素比较旋转后 因素负荷的可解释性以作出最终决定
这是一个相对比较全面的程序。研究者可以 批判性地采用总之因素个数的确定并不存在 着唯一 正确 客观的答案
• 主成份分析法适用状况于单纯为简化大量变 项为较少数的成份时,以及作为因素分析的 预备工作。
主轴因素法 (principal axis factors)
• 分析变项间的共同变异量而非全体变异量。 • 将相关矩阵中的对角线,由原来的1.0改用
共同性(communalities)来取代。 • 目的在抽出一系列互相独立的因素。第一
因素分析中的共同方差,独特方差和误差方差
2.因素个数的确定
因素个数的确定是探索性因素分析中的 一个非常重要的决定,因为一旦因素个 数确定模型的拟合度也就确定了,不随 以后因素的旋转而改变 。
Kaiser 法
特征值代某一因素可解释的总变异量,特征 值越大,代表该因素的解释力越强。
特征值以1为标准。低于1的特征值,代表该 因素的变异数少于单一一个变项的变异数1, 无法以因素的形式存在。
PC1
PC2
.49
.20
Depression
.49
.23
Anger
第十章探索性因素分析
• Correlation Matrix框几种检验变量是否适宜做因素分析 Matrix框几种检验变量是否适宜做因素分析 的方法: 的方法 • Coefficients 计算相关系数矩阵 • Significance levels 显著性水平 • Determinant 相关系数的行列式 • Inverse 相关系数矩阵的逆矩阵 • Reproduced 再生相关矩阵 • Anti-image 反映像相关矩阵检验 • KMO and Bartlett’s test of sphericity检验变量的偏相关是 否很小,相关矩阵是否单位阵。
四、解释因子
• 因子旋转 因子旋转是实现因子解释的方法,其目的是通过改变坐标 轴的位置,重新分配各个因子所解释的方差比例,是因子 结构更简单更易于解释。 • 因子旋转的方法 因子旋转的方法: • 正交旋转(因子轴的夹角为90度)和斜交旋转(因子轴之 间的夹角小于90度)。 • 旋转方法选择的原则:依据研究问题的需要。如果只关心 旋转方法选择的原则 是几个因子则用正交旋转;如果要得到几个有理论和实际 意义的因子需采用斜交旋转。
• 因子分析有两个核心问题:构造因子变量;对因子变量进 行命名解释。 • 有四个步骤: • (1)确定原始变量是否适于因素分析 • (2)构造因子变量 • (3)利用旋转使得因子变量具有可解释性 • (4)计算因子变量得分
• 确定原始变量是否适于因素分析 • (1)计算相关系数矩阵,如果大部分相关系数均小于0.3, 说明不适合做因素分析; • (2)Bartlett test of sphericity(巴特利特球形检验),如果 P值小于0.05表明适合做因子分析 • (3)Anti-image correlation matrix(反映像相关矩阵检验), 如果反映像相关矩阵中有些元素的绝对值较大,说明这些 变量不适合做因子分析。 • (4)KMO(Kaiser-Meyer-Olkin)检验 • KMO取值范围在0—1之间,越接近于1越适合做因素分析。 • 其标准为: • 0.9<KMO非常适合; • 0.8<KMO<0.9适合; • 0.7<KMO<0.8一般;
05.探索性因素分析
2015-2016学年第二学期
高级心理统计
6
基本原理 (2/5)
• 因子载荷 (factor loading)
– 反映了观测变量是如何由公因子线性表示的 – 也反映了因子和变量之间的相关程度。
• 变量相关
– 任何两个观测变量之间的相关系数等于对应因子载荷 乘积之和
用数目较少且更有意义的潜在构念来解释一组观测变量在一组变量中选择少数几个最有代表性即与所有其他因素相关最高的变量建立少数几个独立的因素代替多数变量进行多元回归以解决多元共线性的问题量表的结构效度分析高级心理统计20152016学年第二学期基本目标考察被试在各个条目上的反应具有多大程度的变异并试图用较少的因子结构来解释这些变异即每个条目变量在多大程度上能用几个相同的因子来解释类似回归分析高级心理统计20152016学年第二学期基本原理15是公因子commonfactors是特殊因子uniquefactorsij是第i个观测变量在第j个公因子上的载荷因素分析模型假定k个特殊因子之间彼此独立特殊因子和公因子之间也彼此独立
rij ai1a j1 ai 2 a j 2 aim a jm
• 公因子模型是从解释变量相关关系的角度出发的
2015-2016学年第二学期 高级心理统计 7
2015-2016学年第二学期
高级心理统计
8
基本原理 (3/5)
• 共同度 (communality)
– 即公因子方差,观测变量方差由公因子解释的比例。 当公因子彼此独立 (正交)时,等于该变量有关的因子载 荷的平方和
高级心理统计
3
基本目标
• 考察被试在各个条目上的反应具有多大程度的变 异,并试图用较少的因子结构来解释这些变异
探索性因素分析
探索性因素分析探索性因素分析(ExploratoryFactorAnalysis)是一种常用的数据分析方法,用于研究大量数据背后隐藏的关系和模式。
它是一种运用统计技术,对大量的观测数据进行凝练和分析的过程,帮助研究者理解数据背后的结构和模式。
探索性因素分析的目的是通过提取可以从原始观测数据中获取的未知因素,识别数据中的结构特征。
它利用这些因素构建一个模型,以更好地解释数据背后的模式,以解释被考虑变量间的差异。
与其他统计方法相比,探索性因素分析有着独特的优势:它可以从未经处理的原始数据中提取出潜在的因素,并以更加简洁的方式解释数据。
探索性因素分析的主要步骤包括:(1)数据收集;(2)特征抽取;(3)因素析出;(4)因素解释。
第一步是数据收集,探索性因素分析是建立在有充分数据的基础上的,因此,研究者必须准备充分的数据,以便有效地进行分析。
为了收集有价值的数据,研究者可以使用诸如问卷调查、实验测量、数据库档案等数据收集方式。
第二步是特征抽取,研究者可以通过使用诸如旋转、标准化等技术,从观测数据中提取出可以表达其表征的特征,以便进一步的分析。
第三步是因素析出,研究者可以通过使用像主成分分析、因子分解等因素析出技术,从观测数据中提取出潜在的因素。
最后一步是因素解释,研究者可以将提取出的因素用于解释观测数据中的变量,通过观察每个因素的因素负荷度,以便理解原始数据背后的模式。
探索性因素分析在很多诸如心理学、市场营销、社会学、经济学等领域都得到了广泛的应用,它在这些研究领域中都有着重要的作用。
它提供了一种简便易行的方法,帮助研究者从大量观测数据中提取出模式以及更有意义的结果。
总之,探索性因素分析是一种有用的数据分析方法,它可以帮助研究者从数据中获取有价值的信息,为后续的研究和应用提供支持和依据。
探索性因素分析的原理与应用
(4)Equamax:平方最大正交旋转。
(5)Promax:在方差极大正交旋转的基础上进
行斜交旋转。
33
根据旋转后的因素载荷矩阵可以清晰
地确定因素中的变量:将对同一因素
上不同载荷的变量进行大小排序,因
素载荷小的变量将从该因素中删除。 一般是以载荷量=0.3为临界值标准。
34
含义:指确定不同公共因素在对某一原始变
29
Scree Plot
4
3
Eigenvalue
2
1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
C omponent Number
30
统计学含义:指对初始抽取的因素载荷矩 阵实施旋转变换,使得因素载荷矩阵中的 相关系数更加显著,相关系数向0和1两极 转化,从而使各个因素的意义更加明显。 旋转的目的:当初始载荷不易解释时,常 对载荷做旋转,以使各变量在各因素上的 载荷或者变大或者变小,以便得到一个更 简单而易于解释的结构。
累积贡献率:是所有主要因素贡献率的和。
21
计算
相关
矩阵
因素
因素
计算
解释
提取
旋转
因素
分数
因素
含义
22
作用:检验因素分析的适用性。若大部分变 量之间的相关很小,表明它们之间共享因素
的可能性很小;变量之间应该有较大的相关,
且绝对值较大并显著时,才可进行因素分析。
方法:计算所有变量之间的相关系数,涉及
9
要提取几个因素?
每个因素包含哪些变量? 为确定的因素命名并解释其含义。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Rotation旋转按钮 因素独立:varimax最大变异法 因素相关: direct oblimin直接斜交旋转法 Display:报告旋转后的相关信息
Scores分数按钮 Save as variables作为变量保存因素 Regression 回归法计算因素分数
Options(选择)按钮 Sort by size按因素负荷量大小排列 Supress absolute values less than因素负荷量小于某值 不显示
做因素分析像雕刻玉器,除了基本的方 法外,更需要想象力、耐心和观察力, 甚至还要有点运气 。
因素分析后为何后悔?
影响效度的因素:
理论正确,操作定义明确 题目语义清晰无歧义 维度要精,每个维度下题目要多,同一维度 下题目相关要高,不同维度下题目相关要低 样本要有代表性,量足,各组人数尽量接近 施测标准化
探索性因素分析
——检验问卷的结构效度
现在我用一个测验来测自己某种心理特征,我会关心: 现在我用一个测验来测自己某种心理特征,我会关心:
这个测验能测到我想测的东西吗? ——效度 这种心理特征都包含了哪些心理成分? ——结构 它在多大程度上能测到我想测的特质 ——结构效度
探索性因素分析用来做什么?
它用于检验问卷的结构效度 什么是结构效度?
加大样本量:做因素分析时,题目数与预试样本量 的比例为1:5~1:10(或n>300) 减少维度和题目(此法不推荐使用!)
Extraction萃取按钮: Principal components主成分分析法 Correlation matrix相关矩阵 Screet plot陡坡图 Eigenvalues over(选1)或number of factors(自己指定)
新的因素分析结果出来了!
看看是不是按我们所希望变化的, 也看看有没有出现新问题
没变!
因素解释的变异量:减小了,不是我们希望的变化 原因:因素数目越少,解释变异量必然减小
陡阶碎石图:没变!
因素负荷:变了,因素3、4、5下题目均匀且符 合假设。但,1因素下的题项太多,2因素下的题 58不属于这个因素下
这个结果好吗?
这个结果留下的隐患
当你把现在剩下的题目作为正式问卷施 测被试时,获得了新的数据,你再做一 次因素分析,结果和你现在大不相同。 最糟糕的情况是:因素数目对不上假设, 题目也对不上假设的因素,因素负荷表 还不干净 为什么会变?
因素分析结果会随取样而改变
如何减少因素分析结果的变化程度?
试测样本要有代表性 预测样本量不能太小 预测问卷要有足够多的题目 删掉题目要谨慎,不能“数据驱动”, 而应该“逻辑导向”
谢谢大家!
请提出宝贵意见!
因素负荷
•Descriptive描述按钮: initial solution方差累计百分比 KMO抽样适当性检验
KMO抽样适当性检验
KMO:是否适合做因素分析的指标
0.5及以下,不能做因素分析 0.6以上,勉强可以进行因素分析 0.7以上,尚可进行因素分析 0.8以上,适合进行因素分析
如何提高KMO值?
不变哟!
Scores分数按钮 Save as variables作为变量保存因素 Regression 回归法计算因素分数 不变哟!
Options(选择)按钮 Sort by size按因素负荷量大小排列 Supress absolute values less than因素负荷量小于某值 不变哟! 不显示
因素分析的结果报告
因素分析适当性指标
因素解释的变异量
陡阶碎石图
因素负荷表
因素分析做完了!
……结果如何呢?
检验结构效度——解读结果报告
理论假设 因素分析结果 因素数目 6个 8个 54.488% 解释的变异量 100%
哪些题目聚在同一个因素下了!
理论假设 因素分析结果
维度1 37、43、45、 37、43、45、 47、51、54、 47、51、54、 57 57、32 维度6 15、28、31、 15、28、38 38、41 … 维度8
陡阶碎石图用于选取合适的因素数目 此图5、6、7个都行
上次我们选的是Eigenvalues over:1 这次我们根据陡阶碎石图指定因素数目number of factors:
Rotation旋转按钮 因素独立:varimax最大变异法 因素相关: direct oblimin直接斜交旋转法 Display:报告旋转后的相关信息
补充:高阶因素分析
也称二阶因素分析,本质上是把因素当 成题目来处理。 方法:先计算各因素的均分,并把它作 为一个变量来做因素分析 作用:可与验证性因素配合
因素分析的难点
低水平的难点:KMO值低,解释变异量小 中水平的难点:确定因素数目 高水平的难点:各因素下题目不均衡,题 目聚合在假设的同一个因素下
文献整理中…… 测验编制中…… 测验施测中…… 测验数据输入中…… 项目分析(筛除不合格题目)中……
如何操作探索性因素分析?
先来完整过一遍… 注意力放在操作步骤上
六、因素分析(探索性)
【analyze】→【data reduction】→【factor】
进入因素分析的界面
选择需要因素分析的变量(题目)
•Descriptive描述按钮: initial solution方差累计百分比 KMO抽样适当性检验
Extraction萃取按钮: Principal components主成分分析法 Correlation matrix相关矩阵 Screet plot陡坡图 Eigenvalues over(选1)或number of factors(自己指定)
解决上述困难的方法
选择不同的因素数目
理论假设 根据陡坡碎石图 根据因素负荷表:3个题目以上的因素才能 保留
删减题目
“失去组织的” “另起炉灶但题目少于三个的” “叛变的”和“投诚的”语义上不和 删减题目的方法
删一个题做一次因素分析,如何因素负荷表 变得更糟,表明不应该删此题
剩下的方法就是经验和创造力
投诚的 叛变的
…
… 2、1
另起炉灶的
没有组织的
结果出来了,你对这个问卷的 结构效度满意吗?
不满意? 没关系!这不是最终结果。
重新 “探索”问卷的理论假设结构 目标:找到与理论假设最接近的维度题 目构成(结构) 行动:修改参数,删减题目重新做因素 分析
重复做一次因素分析……
这次注意力放在参数和题目上
因素分析在何时停止
因素结构最接近假设的理论结构
因素数目接近 每个因素下的题目不少于3题 题目聚合在假设的同一因素下 KMO值适宜 解释变异量较高(应不低于40%?)
探索因素分析验证的这个测验的结构效度(这是 我能做到的最好结果)是:
下一步:因素命名
根据每个因素下面所有题目所代表的意 义,结合所测的心理特质的操作性定义, 给各个因素命名来代表这些因素。
测验能够测到某种心理结构和特质的程度。
结构是指用来解释行为的理论框架或心理特质
“我们假设的结构是ห้องสมุดไป่ตู้是真的存在”? ——结构效度的验证
如何验证结构效度?
根据文献、前人的研究结果、实际经验建立假 设的结构(定义特质、确定维度) 定义特质、 根据假设的结构编制测验(编题目) 选取适当的对象进行测试(预测) 用统计方法考查测验是否能有效解释假设的理 论结构(探索性因素分析)
再做一次因素分析
这次我们把因素数目选为6,同时 删掉题58
为什么?
KMO值降低了一点哦
解释变异量升高了!
为什么?
因素负荷:各因素下题目数适当、题目聚合在假设的同 一因素下,因素数目也与假设一致; 但,有些题目在其他因素下有较高负荷,说明它语义可 能有歧义,要删掉它们吗?
删掉“不干净”的题20、47、32、31、37、56、 19、39,因素负荷现在是: