探索性因素分析 PPT

合集下载

大学优品PPT《高级心理统计》7. CFA

大学优品PPT《高级心理统计》7. CFA

嵌套模型
• 如果乙模型所有自由参数只是甲模型中自由 参数的一部分,则称乙模型嵌套于甲模型内
嵌套模型的2比较
• 例:例2-工作倦怠的CFA
• 3因素模型显著地好于所有2因素模型和一因素模型吗?
可否应用相关矩阵作分析?
• SEM建立在方差和协方差分析上 • 用相关矩阵,大多数情况下正确 • 在某些况下并不正确(见Cudeck, 1989 ):
总变量数
模型设定-两个不相关因素
DA NI=6 NO=200 LA 指标变量的标签 X1 X2 X3 X4 X5 X6 相关矩阵,最好用 KM 协方差矩阵 1.0 .502 1.0 .622 .551 1.0 .008 .072 .028 1.0 .027 .030 指标变量 .049 .442 1.0 -.029 模型 潜变量 因素间不 的个数 设定 -.059 .018 .537 .413 的个数 1.0 相关 MO NX=6 NK=2 PH=DI FR LX 1 1 LX 2 1 LX 3 1 LX 4 2 LX 5 2 LX 6 2 潜变量的标签 LK ACADEMIC SOCIAL 输出路径图 输出标准化系数, PD 修正指标 OU SS MI
模型设定
• 量表的前三个项目是学业成就自尊的indicators, 后三个项目是社交自尊的indicators • 两个因素之间有相关
LISREL简介(1)
• 例:6个外显变外源内隐变量---- KSI ( ξ ) 外显变量---- X KSI 在X 上的效应系数(载荷)--- LAMDA(λ) X 的误差 ---- delta (δ) LX 5 2 是载荷矩阵的元素:外显变量X5在 ξ2上的载荷 PHI(Φ)3 2是因素的相关矩阵的元素:ξ3与ξ2的相关 TD(θ)4 3 是误差的协方差 矩阵的元素: X 4与X 3的误差的相 关

探索性因子分析(课堂PPT)

探索性因子分析(课堂PPT)

确定因子个数的方法(三)
➢碎石图
碎石图是按特征值大小排列因子,横轴表 示因子序号,纵轴表示特征值大小。
公因子提取方法
➢主成分分析法
假设变量是因子的纯线性组合,第 一成分有较大的方差,后续成分其 可解释的方差逐个递减。
➢最大似然法
该方法不要求多元正态分布,给出 参数估计。
因子命名
• 因子载荷阵显示了原始变量与各主成分之 间的相关程度。根据他们的相关程度的大 小,综合出各因子的含义。如果每个因子 与原始变量相关系数没有很明显的差异, 对因子命名就比较困难。
➢公因子的累积方差贡献率
根据累计贡献率达到的百分比确定
确定因子个数的方法(二)
• 实际上累积贡献率是一个次要指标 。主要指标是特征值, 在前一指标达 到的情况下,只要累计贡献率不是 太差都可以接受。即使70%也不是 太大的问题。实际处理中,很少碰 到累计贡献率太低的情况,如果问 卷设计和数据收集没有太大问题的 前提下。
判断变量是否适合做因子分析
1. KMO(Kaiser-meyer-olkin)检验 KMO统计量是用来比较各变量间简单相关系
数和偏相关系数的大小。在0~1之间取值,越接近 1,越适合作因子分析。 2. 巴特利特球形检验
巴特利特球形检验原假设H0为:相关阵是单 位阵,既各变量各自独立。
3. 反映象相关矩阵检验
的变量间强相关问题 ➢数据化简,将具有错综复杂关系的
变量综合为少数几个因子(不可观 测的、相互独立的随机变量) ➢发展测量量表
探索性因子分析——步骤
收集观测变量
构造相关矩阵
判断是否适合作因子分析
确定因子个数 提取因子
特征值大小、因子累计贡献率、碎石图
因子旋转 解释因子结构 计算因子得分

探索性因素分析

探索性因素分析
3. 考虑由最大似然法所产生的模型拟合度的信 息
4. 根据以上三方面的信息将可能的因素个数压 缩到一个比较小的范围内
5. 根据4 分别抽取不同个数的因素比较旋转后 因素负荷的可解释性以作出最终决定
这是一个相对比较全面的程序。研究者可以 批判性地采用总之因素个数的确定并不存在 着唯一 正确 客观的答案
最大似然法的模型拟合度
由因素个数从多到少考察最大似然法的 模型拟合度
当拟合度由不显著变为显著时,此时的 因素数目即合适的因素抽取个数
因素所能解释方差的百分比
所有因素所能解释方差的累计百分比应 超过40%。
Browne 提出了以下的程序
1. 考虑研究者在理论中是否事先假设了因素个 数
2. 考虑一些简单方法如Kaiser 法,Scree Test 所提供的信息
最大似然法 (maximum-likelihood method)
–相关系数经变项的残差 (uniqueness)加权后,利用参数 估计(paratemer estimation)原 理,估计出最可能出现的相关矩阵 的方法 。
主成分分析 (PCA) 与 主因素分析 (PFA) 的适用条件
目的方面:PCA用于分类; PFA用于探讨结构 PCA
PCA 特征值 > 1 的规则抽取 直交旋转 因素负载只显示>.40的,整齐结构
1.因素的抽取 2. 因素个数的确定 3. PCA结构矩阵所包含的信息 4. 因素的命名 5. 因素转轴 6. 因素分析的统计假定 7. 主成分分析和因素分析 8. 探索性因素分析和验证性因素分析
1.因素的抽取 (factor extraction)
解释一组变量的总方差 (独特方差+共同方差 ) 可用于对一组变量进行分类 是最常用的因素分析选择。

探索性因素分析主成分分析与因素分析

探索性因素分析主成分分析与因素分析
無加權最小平方法(unweighted least squares factoring) 求取觀察與重製矩陣的殘差的最小平方值 只有非對角線上的數據被納入分析 共同性是分析完成之後才進行計算
一般加權最小平方法(generalized weighted least squares factoring) 在無加權平方法下,增加權數的考量(以共同性加權) 有較大的共同變異的變項被較大的加權
萃取結果
PCA:
以最少的直交成分來解釋最大的變項變異量
具有單一的數學解
FA:
以最少的直交因素來反應相關矩陣
具有不同的最佳解
6
不同的萃取方法一
主成分法(Principal components) 目的在使每一個成分能夠代表最大的觀察變異量 第一個主成分為觀察變項的線性整合,能夠反應最大的變異量, 依序發展各主成分 可以得到最大的解釋變異量
FA:尋找測量題目背後的結構與理論意涵,並利用這些潛在結構進行分析應用(得到因素 factors )
萃取過程
差異在於兩者對於觀察相關矩陣的處理方式
也就是處理變異數上的差異
PCA analyzes variance: 觀察變項的所有變異量均被分析(觀察相關係數矩陣中對角線總和)
FA analyzes covariance: 僅有共同變異量(shared variance)被分析(觀察相關係數矩陣中對 角線以共同性來取代)
5
因素分析的類型
不同萃取方法皆產生直交的成分或因素來反應觀察相關矩陣R
不同點在於抽取的標準不同,例如最大變異、最小殘差等
當樣本數大、觀察變項數目多或共同性估計相近時,各方法差異不大
因素分析結果是否穩定不是決定於萃取的方法而是變項間的關係

《探索性因素分析及SPSS应用》PPT课件

《探索性因素分析及SPSS应用》PPT课件
3、最大负荷值lij小(建议0.4); 4、共同度hi2小(建议0.16); 5、最大负荷值lij与共同度hi2之比小(建议0.5); 6、最大两个负荷值lij与共同度hi2之比小(建议0.25); 7、取样适当性系数(MSA)过小;
8、多极变量,即一个变量在几个因子上的负荷都较大。
返回
2004-3-10
1.因素抽取 主成分法 主轴因子法 极大似然法
……
未旋转解 共同度 特征值
3.因素旋转 方差最大法 平均正交法 斜交旋转
……
4. 据 简 单 结构解释 或确定因 子的含义
5.报告因素 模式和因素 结构
2.据碎石图 和特征值
确定因子数
2004-3-10
6.据结果调整旋转方法重复 该过程至重复抽取过程
返回
xk lk1 f1 lk 2 f2 lkm fm k
公因子理论:
p个观测变量,相当于一份问卷中的p个题项,它是一个随机 变量;不同被试都将有p个不同的数据;m个公因子,其值 称因子值(factor score);ε代表残差,包括特殊因子和误 差,是各变量中不能用公因子解释的部分;系数lij称为因子 负荷(factor loading),表示第i个变量在第j个因子上的相对重
回避了内容和理论,而关注应用 • 聚类分析(Cluster analysis): Holzinger, Tyron, & Bailey
相信较低水平的观测(如项目)可以被整合成较高水平 的具有理论价值的构念。
2004-3-10
返回
5
第一节 因素分析原理概述
Common Factor Theory及变异分解 题项1:我对我的薪水感到满意; 题项2:我对工作中的同事感到满意; 题项3:我对工作中的上司感到满意。

探索性因素分析

探索性因素分析
使經由線性組合而得到的成份之變異數為最大,使觀 測值在這些成份上顯示出最大的個別差異來。
10一、主ຫໍສະໝຸດ 份分析的基本概念(2/2) 主成份分析除了用來簡化變數間之關係外,可用 來縮減某一組欲進行多變量分析之變數的數目。
主成份分析也可將各變數的原始分數轉為主成份 分數,以供進一步的統計分析。
主成份分析還可用來建構多種具有不同衡量單位 變數之綜合指標。
假設有p個數字變數,則可計算出p個主成份。
共同性會等於1,亦即沒有誤差項,故此公式 不寫出誤差項。
主成份分析重視的是「變異數」,因素分析 重視的則是「共變異數」。
主成份分析使觀察值在這些主成份乃顯示出 最大的個別差異。因素分析的目的是找出共 同性。
13
主成份萃取的運算原理
使組合
3、只取同一個主成份時,所能解釋各變數的共同性總和為 i p
h
2 ji

h
2 j1

h
2 j2
........

h
2 jp

h
2 j
j
i 1
28
6
進行因素分析前資料的檢視
1. 檢視資料的相關係數矩陣,相關係數須顯著的大於0.3。
2. Bartlett的球型檢定(Bartlett test of sphericity),此種統 計檢定主要是用來檢定變數間的相關係數是否顯著,核定 結果若p值小於0.05即代表顯著。
3. 取樣適切性量數(KMO),其值介於0到1之間,若KMO等於 1表示每一變數均可被其他變數完全的預測,若KMO≧0.9, 表示資料非常適合做因素分析;0.9>KMO≧0.8,表示很適 合;0.8>KMO≧0.7,表示還不錯;0.6>KMO≧0.5,表示不 太適合;KMO<0.5,表示資料不適合做因素分析。

探索性因素分析讲解

探索性因素分析讲解

二、探索性因素分析的原理
1、因素分析模型 K个观测变量,分别为x1,x2,…,xk, xi为具有零均值, 单位方差的标准化变量。 因子模型的一般表达式为:
因子负载(Factor loadings) 特殊因子 (Ufacotor)
xi ai1 f 1 ai 2 f 2 ... aimfm ui (i 1, 2,..., k )
因子之间彼此独立 特殊因子和公因子之间彼此独立
二、探索性因素分析的原理
a11 .
二、探索性因素分析的原理
2、因素分析中的有关概念 (1)因子负载(loading):当公因子之 间完全不相关时,aij等于第i个变量和第j个 因子之间的相关系数。 反映了因子和变量之间的相关程度 大多数情况下,人们往往假设公因子之间 时彼此正交的(Orthogonal),即不相关。
三、探索性因素分析的步骤
判断是否适合做因素分析的方法:
(2)巴特利特球体检验(Bartlett test of sphericity) 差异显著——适合做因素分析
三、探索性因素分析的步骤
(3)KMO(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)测度 比较观测变量之间的简单相关系数和偏相 关系数的相对大小出发,其值的变化范围 从0到1 KMO<0.5肯定不适合做因素分析,最好大 于0.8
四、求解初始因子
2、公因子分析法 公因子方差的估计
用主成分分析的结果作为公因子方差的初始估计值 把每个变量和其余变量的相关系数中绝对值最大的, 作为该变量的公因子方差的初始估计值 用每个变量和剩下的其他变量的复相关系数的平方, 即R2作为该变量的公因子方差的初始估计值。

探索性因素分析-淡江大学

探索性因素分析-淡江大学

13
理論架構1 --數學模式
Zjn=aj1F1n+aj2F2n+…+ajqFqn+djUjn, j=1,2,…,p, n=1,2,…,N
其中
Zjn:第n個樣本單位在第j個觀察變數的分數 Fin:第n個樣本單位在第i個共同因素之分數 Ujn:第n單位在第j個觀察變數的獨特因素之分數 aji:為因素權重(factor weight) ,用以表示第i個共同因 素對第j個觀察變數之權重,又稱為組型(or因素)負荷量 (pattern loading) dj:第j個觀察變數之獨特因素的權重 且假設 Z、F、U均為已標準化之分數 ~N(0,1)

驗証性因素分析(Confirmatory factor analysis)

8
探索性因素分析 v.s.驗証性因素分析
由三個變數x1, x2, x3找到2個共同因素f1, f2,則其路徑圖如下
其中表可觀測的, 表不可觀測的。 Note: 在驗證性因素分析路徑圖中並非每個因素 fi 皆與變數 xi 間有連線(即路徑) 一般使用LISREL分析方法
正面肯定
負面評價
9.我常會覺得自己是一個失敗者
6
潛伏結構
自尊因素 組型負荷量 自尊變數
我覺得自己和別人一樣有價值,I57
獨特性 0.368 0.395 0.429 0.501 0.467 0.582 0.266 0.364 0.555 0.45
獨特因素 e1 e2 e3 e4 e5 e6 e7 e8 e9 e10
27
未轉軸因素分析報表範例
19
(二) 共同因素之萃取方法



主軸法(method of principal) 是以共同因素對總共同性之貢獻極大化為萃取原則 重心法(centroid method of factoring) 在電腦普及以前,常以重心法估計組型負荷量 重心法是根據觀察變數之相關係數矩陣計算組型負 荷量 最大概似法(maximum likelihood analysis) 需先假設共同因素之個數及服從常態分配,然後依 此假定推導因素及共同性 缺點計算過程相當繁複且不一定得到收斂的結果 較適用於驗證性因素分析
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Rotation旋转按钮 因素独立:varimax最大变异法 因素相关: direct oblimin直接斜交旋转法 Display:报告旋转后的相关信息
Scores分数按钮 Save as variables作为变量保存因素 Regression 回归法计算因素分数
Options(选择)按钮 Sort by size按因素负荷量大小排列 Supress absolute values less than因素负荷量小于某值
行动:修改参数,删减题目重新做因素 分析
重复做一次因素分析……
这次注意力放在参数和题目上
•Descriptive描述按钮: initial solution方差累计百分比 KMO抽样适当性检验
KMO抽样适当性检验
KMO:是否适合做因素分析的指标
0.5及以下,不能做因素分析 0.6以上,勉强可以进行因素分析 0.7以上,尚可进行因素分析 0.8以上,适合进行因)
•Descriptive描述按钮: initial solution方差累计百分比 KMO抽样适当性检验
Extraction萃取按钮: Principal components主成分分析法 Correlation matrix相关矩阵 Screet plot陡坡图 Eigenvalues over(选1)或number of factors(自己指定)
这个结果好吗?
这个结果留下的隐患
当你把现在剩下的题目作为正式问卷施 测被试时,获得了新的数据,你再做一 次因素分析,结果和你现在大不相同。
最糟糕的情况是:因素数目对不上假设, 题目也对不上假设的因素,因素负荷表 还不干净
为什么会变?
因素分析结果会随取样而改变
如何减少因素分析结果的变化程度?
这次我们把因素数目选为6,同时 删掉题58
为什么?
KMO值降低了一点哦
为什么?
解释变异量升高了!
因素负荷:各因素下题目数适当、题目聚合在假设的同 一因素下,因素数目也与假设一致; 但,有些题目在其他因素下有较高负荷,说明它语义可 能有歧义,要删掉它们吗?
删掉“不干净”的题20、47、32、31、37、56、 19、39,因素负荷现在是:
试测样本要有代表性 预测样本量不能太小 预测问卷要有足够多的题目 删掉题目要谨慎,不能“数据驱动”,
看看是不是按我们所希望变化的, 也看看有没有出现新问题
没变!
因素解释的变异量:减小了,不是我们希望的变化 原因:因素数目越少,解释变异量必然减小
陡阶碎石图:没变!
因素负荷:变了,因素3、4、5下题目均匀且符 合假设。但,1因素下的题项太多,2因素下的题 58不属于这个因素下
再做一次因素分析
用统计方法考查测验是否能有效解释假设的理
论结构(探索性因素分析)
文献整理中…… 测验编制中…… 测验施测中…… 测验数据输入中…… 项目分析(筛除不合格题目)中……
如何操作探索性因素分析?
先来完整过一遍… 注意力放在操作步骤上
六、因素分析(探索性)
【analyze】→【data reduction】→【factor】
测验能够测到某种心理结构和特质的程度。
结构是指用来解释行为的理论框架或心理特质
“我们假设的结构是不是真的存在”? ——结构效度的验证
如何验证结构效度?
根据文献、前人的研究结果、实际经验建立假
设的结构(定义特质、确定维度)
根据假设的结构编制测验(编题目)
选取适当的对象进行测试(预测)
不显示
因素分析的结果报告
因素分析适当性指标
因素解释的变异量
陡阶碎石图
因素负荷表
因素分析做完了!
……结果如何呢?
检验结构效度——解读结果报告
理论假设 因素分析结果
因素数目
6个
8个
解释的变异量 100% 54.488%
哪些题目聚在同一个因素下了!
理论假设
因素分析结果
维度1 37、43、45、 37、43、45、
不变哟!
Scores分数按钮
Save as variables作为变量保存因素
Regression 回归法计算因素分数
不变哟!
Options(选择)按钮
Sort by size按因素负荷量大小排列
Supress 不显示
absolute
values
less
than因素负荷量不小变于哟某!值
新的因素分析结果出来了!
47、51、54、 47、51、54、
57
57、32
维度6 15、28、31、 15、28、38 38、41
……

维度8
2、1
投诚的
叛变的 另起炉灶的 没有组织的
结果出来了,你对这个问卷的 结构效度满意吗?
不满意? 没关系!这不是最终结果。
重新 “探索”问卷的理论假设结构
目标:找到与理论假设最接近的维度题 目构成(结构)
探索性因素分析
——检验问卷的结构效度
现在我用一个测验来测自己某种心理特征,我会关心:
这个测验能测到我想测的东西吗? ——效度
这种心理特征都包含了哪些心理成分? ——结构
它在多大程度上能测到我想测的特质 ——结构效度
探索性因素分析用来做什么?
它用于检验问卷的结构效度 什么是结构效度?
陡阶碎石图用于选取合适的因素数目 此图5、6、7个都行
上次我们选的是Eigenvalues over:1 这次我们根据陡阶碎石图指定因素数目number of factors:
Rotation旋转按钮 因素独立:varimax最大变异法 因素相关: direct oblimin直接斜交旋转法 Display:报告旋转后的相关信息
如何提高KMO值?
加大样本量:做因素分析时,题目数与预试样本量 的比例为1:5~1:10(或n>300)
减少维度和题目(此法不推荐使用!)
Extraction萃取按钮: Principal components主成分分析法 Correlation matrix相关矩阵 Screet plot陡坡图 Eigenvalues over(选1)或number of factors(自己指定)
相关文档
最新文档