探索性因素分析
探索性因素分析的原理与步骤知识讲解
探索性因素分析的原理与步骤知识讲解探索性因素分析(Exploratory Factor Analysis,EFA)是一种多变量分析方法,旨在确定观察数据中潜在的结构或维度。
它可以帮助研究者发现数据中隐藏的模式和关联,进而减少数据的复杂性,并起到简化和理解数据的作用。
以下是探索性因素分析的原理与步骤的知识讲解。
原理:探索性因素分析基于统计原理,假设观察数据是由一组潜在变量(即因素)决定的。
每个因素代表一组具有内在关联的观察变量,它们共同解释了数据中的方差。
因此,探索性因素分析的目标是找出这些潜在因素的数量和结构,并确定它们与观察变量之间的关系。
步骤:1.确定分析目标:在进行探索性因素分析之前,需要明确分析的目标和研究问题。
明确问题有助于选择适当的分析方法和解释结果。
2.数据准备与预处理:将需要分析的数据整理为适合因素分析的格式。
常见的预处理包括数据标准化、缺失值处理和异常值处理等。
4.因素提取:在这一步骤中,通过计算特征值、特征向量或因子载荷来确定潜在因素的数量和结构。
特征值表示一个因素解释的方差比例,而特征向量是表示潜在因素之间关系的向量。
因子载荷是观察变量与潜在因素之间的相关系数。
5. 因子旋转:在因子提取之后,因子结构可能并不是直观和可解释的。
因此,需要进行因子旋转以改善因子解释性和解释因素的意义。
常见的因子旋转方法包括正交旋转(如Varimax)和斜交旋转(如Promax)等。
6.因子解释和命名:根据提取的因子载荷和因子旋转结果,解释每个因素所代表的观察变量的意义。
通过命名每个因素,以增加对潜在因素结构的理解和解释。
7.评估因子模型:对于确定的因子结构,需要进行信度和效度分析来评估模型的质量和适用性。
信度分析衡量因子和观察变量之间的内部一致性,而效度分析衡量因子与其他变量之间的关系。
8.结果解释与报告:根据分析结果进行解释和报告。
包括提取的因子数目、每个因子的载荷、因子间的关系、因子的解释以及模型的信度和效度指标。
使用SPSS进行探索式因素分析的教程
使用SPSS进行探索式因素分析的教程探索性因素分析是一种统计方法,用于确定一组变量之间的潜在结构。
SPSS是一种常用于数据分析的软件工具,它提供了强大的因素分析功能。
以下是一个使用SPSS进行探索性因素分析的简单教程,该教程可以帮助您了解如何使用SPSS来执行因素分析并对结果进行解释。
步骤1:导入数据步骤2:准备数据确保您的数据符合因素分析的前提条件。
确定您要进行因素分析的变量是否具有线性关系,并进行必要的数据转换(例如,对数转换)以满足这个条件。
步骤3:执行因素分析在SPSS的“分析”菜单下,选择“数据准备”和“因子”。
在弹出的对话框中,选择您要进行因素分析的变量并将其移动到“因子”框中。
选择“萃取方法”(如主成分分析或最大似然估计)并指定要提取的因素的数量。
您还可以选择执行因子旋转以获得更简单和解释性更强的因子结构。
步骤4:解读结果SPSS将生成一个因素分析的输出报告,其中包含多个表格和图形。
以下是一些常见的解读步骤:-总体解释:观察“总体解释”表,了解因子数量和提取方法的解释力度。
查看“因素”的特征值,了解提取的因子解释的总方差比例。
-因子负荷:查看“因子负荷”表,该表显示了原始变量与提取的因子之间的相关性。
较高的因子负荷表示原始变量与特定因子之间的较强关联。
-因子旋转:如果您选择了因子旋转,则查看“旋转因子载荷矩阵”表,该表显示了旋转后的因子负荷。
查看这些旋转后的因子负荷以确定是否存在更简单的因子结构。
-因子得分:根据选定的因子分析方法,可以生成每个观测值的因子得分。
这些得分表示了每个观测值在每个因子上的得分情况,可以用于后续的分析和解释。
步骤5:解释因子根据因子负荷和因子名称,解释每个因子代表的潜在结构。
结合领域知识和因子负荷,您可以确定每个因子是否与特定概念或潜在维度相关联。
步骤6:结果报告根据您的研究目的和需要,将因子分析的结果写入报告中。
确保清楚地描述因子数量、命名以及每个因子代表的结构或概念。
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](多变量统计分析简介)
第13章多变量统计分析简介1.探索性因素分析与验证性因素分析有什么区别?答:(1)探索性因素分析(exploratory factor analysis,简写为EFA)就是指传统的因素分析。
这种因素分析方法对于观察变量因子结构的寻找,并未有任何事前的预设假定。
对于因子的抽取、因子的数目、因子的内容以及变量的分类,研究者也没有事前的预期,而是由因素分析的程序去决定。
在典型的EFA中,研究者通过共变关系的分解,找出最低限度的主要成分(principal component)或共同因子(common factor),然后进一步探讨这些主成分或共同因子与个别变量的关系,找出观察变量与其相对应因子之间的强度,也就是因子负荷值(factor loading),以说明因子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。
由于传统的因素分析企图找出最少的因子来代表所有的观察变量,因此研究者必须在因子数目与可解释变异量(explained variance)两者间寻找平衡点。
因为因素分析至多可以抽取出相等于观察变量总数的因子数目,这样,虽然可以解释全部百分之百的变异,但失去因素分析找寻因子结构的目的,但如果研究者企图以少数几个较明显的因子来代表所有的项目,势必然将损失部分可解释变异来作为代价。
因而在EFA中,研究者相当一部分工作是在决定因子数目与提高因子解释的变异(即R square)。
(2)验证性因素分析(confirmatory factor analysis,简写为CFA)是在研究人员积极改善传统因素分析的限制,扩大其应用范围的基础上产生的。
这类因素分析要求,研究者对于潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观察变量的组成模式,进行因素分析的目的是为了检验这一先期提出的因子结构的适合性。
这种因素分析方法也可用于理论架构的检验,它在结构方程模型中占有相当重要的地位,有着重要的应用价值,也是近年来心理测量与测验发展中相当重视的内容。
探索性因素分析
4. 根据以上三方面的信息将可能的因素个数压 缩到一个比较小的范围内
5. 根据4 分别抽取不同个数的因素比较旋转后 因素负荷的可解释性以作出最终决定
这是一个相对比较全面的程序。研究者可以 批判性地采用总之因素个数的确定并不存在 着唯一 正确 客观的答案
最大似然法的模型拟合度
由因素个数从多到少考察最大似然法的 模型拟合度
当拟合度由不显著变为显著时,此时的 因素数目即合适的因素抽取个数
因素所能解释方差的百分比
所有因素所能解释方差的累计百分比应 超过40%。
Browne 提出了以下的程序
1. 考虑研究者在理论中是否事先假设了因素个 数
2. 考虑一些简单方法如Kaiser 法,Scree Test 所提供的信息
最大似然法 (maximum-likelihood method)
–相关系数经变项的残差 (uniqueness)加权后,利用参数 估计(paratemer estimation)原 理,估计出最可能出现的相关矩阵 的方法 。
主成分分析 (PCA) 与 主因素分析 (PFA) 的适用条件
目的方面:PCA用于分类; PFA用于探讨结构 PCA
PCA 特征值 > 1 的规则抽取 直交旋转 因素负载只显示>.40的,整齐结构
1.因素的抽取 2. 因素个数的确定 3. PCA结构矩阵所包含的信息 4. 因素的命名 5. 因素转轴 6. 因素分析的统计假定 7. 主成分分析和因素分析 8. 探索性因素分析和验证性因素分析
1.因素的抽取 (factor extraction)
解释一组变量的总方差 (独特方差+共同方差 ) 可用于对一组变量进行分类 是最常用的因素分析选择。
体育科学研究方法——第五章资料的整理与分析方法
体育科学研究方法——第五章资料的整理与分析方法尊敬的各位领导、专家、同事们:大家好!我今天将为大家讲解体育科学研究方法的第五章,资料的整理与分析方法。
资料的整理与分析是体育科学研究中非常重要的一环。
合理地整理和分析数据,可以为研究者提供有力的支持和论证,进而推动科学研究的发展。
一、资料的整理方法1.数据清洗数据清洗是整理数据的第一步,它的目的是删除、修正不完整、错误或不适用的数据。
数据清洗时,我们要注意遵循科学原则,确保数据的真实性、准确性和可靠性。
2.数据归类数据归类是将数据按照一定的规则分类,使得整理后的数据具有明确的结构和体系。
数据归类可以根据不同的研究目的和主题进行,例如按照运动员的年龄、性别、水平等进行分类。
3.数据标记数据标记是对整理后的数据进行标识和注释,以便后续的分析和处理。
数据标记可以通过添加注释、编号、符号等方式进行,使得数据在后续的分析过程中有更好的辨识度和可读性。
二、资料的分析方法1.描述性统计描述性统计是通过计算数据的均值、标准差、频数等指标来描述数据的主要特征和分布情况。
常用的描述性统计方法包括原始数据的整理和绘制直方图、散点图、饼图等,以及计算数据的总体均值、中位数、众数等。
2.探索性因素分析探索性因素分析是通过对数据进行降维处理,找出变量之间的相关性,提取出数据中的主要因素,并给出各因素的权重。
探索性因素分析在体育科学研究中常用于提取运动员身体素质测试中的主要影响因素。
3.相关性分析相关性分析是通过计算数据间的相关系数,研究两个或多个变量之间的相关关系。
常见的相关性分析方法包括皮尔逊相关系数、斯皮尔曼等级相关系数等。
相关性分析可以帮助研究者了解变量之间的关系,对研究结果进行解释和预测。
4.归因分析归因分析是研究数据中各因素对结果的影响程度和贡献度。
归因分析可以通过单因素方差分析、多因素方差分析等方法进行。
归因分析有助于确定哪些因素对结果具有显著影响,为研究者提供筛选和优化变量的依据。
探索性因素分析讲解
二、探索性因素分析的原理
1、因素分析模型 K个观测变量,分别为x1,x2,…,xk, xi为具有零均值, 单位方差的标准化变量。 因子模型的一般表达式为:
因子负载(Factor loadings) 特殊因子 (Ufacotor)
xi ai1 f 1 ai 2 f 2 ... aimfm ui (i 1, 2,..., k )
因子之间彼此独立 特殊因子和公因子之间彼此独立
二、探索性因素分析的原理
a11 .
二、探索性因素分析的原理
2、因素分析中的有关概念 (1)因子负载(loading):当公因子之 间完全不相关时,aij等于第i个变量和第j个 因子之间的相关系数。 反映了因子和变量之间的相关程度 大多数情况下,人们往往假设公因子之间 时彼此正交的(Orthogonal),即不相关。
三、探索性因素分析的步骤
判断是否适合做因素分析的方法:
(2)巴特利特球体检验(Bartlett test of sphericity) 差异显著——适合做因素分析
三、探索性因素分析的步骤
(3)KMO(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)测度 比较观测变量之间的简单相关系数和偏相 关系数的相对大小出发,其值的变化范围 从0到1 KMO<0.5肯定不适合做因素分析,最好大 于0.8
四、求解初始因子
2、公因子分析法 公因子方差的估计
用主成分分析的结果作为公因子方差的初始估计值 把每个变量和其余变量的相关系数中绝对值最大的, 作为该变量的公因子方差的初始估计值 用每个变量和剩下的其他变量的复相关系数的平方, 即R2作为该变量的公因子方差的初始估计值。
探索性因素分析的原理与步骤
(五)、因子的解释
经验性&主观色彩 合理即可接受
分析 过程
1
操作 演示
结果 展示
2 3
目录
*
数据
数据符合相应假设 从数据得到的信息 进行EFA的必要性
SPSS操作演示
基于EFA对量表进行初步修订
判断:判断该数据是否适合采用因子分析 删除:删除那些负载小和重复负载的变量 提取:根据新的旋转成份矩阵和碎石图 方案:提出量表进一步修订的建议和方案
(三)、因子提取
三种方法:
1. 以特征跟是否>1为标准 2. 参考特征跟的碎石图 3. 方差贡献率
(三)、因子提取
唯一 正确 客观
综合判断
(四)、因素的旋转
目的:更易解释的负荷结构 方法:正交旋转VS斜交旋转
(四)、因素旋转
因素间可以相关 事实上的相关被强制限制 导致较差的拟合度 斜交旋转能提供更多的信息
分析 过程
1
操作 演示
结果 展示
2 3
目录
*
分析 过程
1
操作 演示
结果 展示
2 3
目录
*
探索性因素分析的基本过程
(一)、确定变量及样本
1. 高质量的数据产生高质量的信息 2.否则就是garbage in,garbage out
(二)、判断是否适合做EFA
1. 观察相关矩阵 2.KMO值检验和球形检验的结果
因子累计方差贡献率为55.866%,各个项目在相应因素上 具有较大的负荷,处于.553-.821之间。各因子内部一致性 系数在.803-.826, 问卷总的内部一致性系为.875。
。结果表示如下:
(四)、最终结果呈现
探索性因素分析
PFA
解释一组变量的共同方差(独特方差被设定为0) 可用于确定一组变量的维度 如量表中的一组题目 特别是用于检验一个 因素 能否解释一组变量的共同方差 缺点是有时会得到负的特征值, 是无意义的.
3. 考虑由最大似然法所产生的模型拟合度的信 息
4. 根据以上三方面的信息将可能的因素个数压 缩到一个比较小的范围内
5. 根据4 分别抽取不同个数的因素比较旋转后 因素负荷的可解释性以作出最终决定
这是一个相对比较全面的程序。研究者可以 批判性地采用总之因素个数的确定并不存在 着唯一 正确 客观的答案
• 主成份分析法适用状况于单纯为简化大量变 项为较少数的成份时,以及作为因素分析的 预备工作。
主轴因素法 (principal axis factors)
• 分析变项间的共同变异量而非全体变异量。 • 将相关矩阵中的对角线,由原来的1.0改用
共同性(communalities)来取代。 • 目的在抽出一系列互相独立的因素。第一
因素分析中的共同方差,独特方差和误差方差
2.因素个数的确定
因素个数的确定是探索性因素分析中的 一个非常重要的决定,因为一旦因素个 数确定模型的拟合度也就确定了,不随 以后因素的旋转而改变 。
Kaiser 法
特征值代某一因素可解释的总变异量,特征 值越大,代表该因素的解释力越强。
特征值以1为标准。低于1的特征值,代表该 因素的变异数少于单一一个变项的变异数1, 无法以因素的形式存在。
PC1
PC2
.49
.20
Depression
.49
.23
Anger
探索性因素分析
探索性因素分析探索性因素分析(ExploratoryFactorAnalysis)是一种常用的数据分析方法,用于研究大量数据背后隐藏的关系和模式。
它是一种运用统计技术,对大量的观测数据进行凝练和分析的过程,帮助研究者理解数据背后的结构和模式。
探索性因素分析的目的是通过提取可以从原始观测数据中获取的未知因素,识别数据中的结构特征。
它利用这些因素构建一个模型,以更好地解释数据背后的模式,以解释被考虑变量间的差异。
与其他统计方法相比,探索性因素分析有着独特的优势:它可以从未经处理的原始数据中提取出潜在的因素,并以更加简洁的方式解释数据。
探索性因素分析的主要步骤包括:(1)数据收集;(2)特征抽取;(3)因素析出;(4)因素解释。
第一步是数据收集,探索性因素分析是建立在有充分数据的基础上的,因此,研究者必须准备充分的数据,以便有效地进行分析。
为了收集有价值的数据,研究者可以使用诸如问卷调查、实验测量、数据库档案等数据收集方式。
第二步是特征抽取,研究者可以通过使用诸如旋转、标准化等技术,从观测数据中提取出可以表达其表征的特征,以便进一步的分析。
第三步是因素析出,研究者可以通过使用像主成分分析、因子分解等因素析出技术,从观测数据中提取出潜在的因素。
最后一步是因素解释,研究者可以将提取出的因素用于解释观测数据中的变量,通过观察每个因素的因素负荷度,以便理解原始数据背后的模式。
探索性因素分析在很多诸如心理学、市场营销、社会学、经济学等领域都得到了广泛的应用,它在这些研究领域中都有着重要的作用。
它提供了一种简便易行的方法,帮助研究者从大量观测数据中提取出模式以及更有意义的结果。
总之,探索性因素分析是一种有用的数据分析方法,它可以帮助研究者从数据中获取有价值的信息,为后续的研究和应用提供支持和依据。
探索性因素分析的原理与应用
(4)Equamax:平方最大正交旋转。
(5)Promax:在方差极大正交旋转的基础上进
行斜交旋转。
33
根据旋转后的因素载荷矩阵可以清晰
地确定因素中的变量:将对同一因素
上不同载荷的变量进行大小排序,因
素载荷小的变量将从该因素中删除。 一般是以载荷量=0.3为临界值标准。
34
含义:指确定不同公共因素在对某一原始变
29
Scree Plot
4
3
Eigenvalue
2
1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
C omponent Number
30
统计学含义:指对初始抽取的因素载荷矩 阵实施旋转变换,使得因素载荷矩阵中的 相关系数更加显著,相关系数向0和1两极 转化,从而使各个因素的意义更加明显。 旋转的目的:当初始载荷不易解释时,常 对载荷做旋转,以使各变量在各因素上的 载荷或者变大或者变小,以便得到一个更 简单而易于解释的结构。
累积贡献率:是所有主要因素贡献率的和。
21
计算
相关
矩阵
因素
因素
计算
解释
提取
旋转
因素
分数
因素
含义
22
作用:检验因素分析的适用性。若大部分变 量之间的相关很小,表明它们之间共享因素
的可能性很小;变量之间应该有较大的相关,
且绝对值较大并显著时,才可进行因素分析。
方法:计算所有变量之间的相关系数,涉及
9
要提取几个因素?
每个因素包含哪些变量? 为确定的因素命名并解释其含义。
探索性因素分析主成分分析与因素分析
一般加權最小平方法(generalized weighted least squares factoring) 在無加權平方法下,增加權數的考量(以共同性加權) 有較大的共同變異的變項被較大的加權
萃取結果
PCA:
以最少的直交成分來解釋最大的變項變異量
具有單一的數學解
FA:
以最少的直交因素來反應相關矩陣
具有不同的最佳解
6
不同的萃取方法一
主成分法(Principal components) 目的在使每一個成分能夠代表最大的觀察變異量 第一個主成分為觀察變項的線性整合,能夠反應最大的變異量, 依序發展各主成分 可以得到最大的解釋變異量
FA:尋找測量題目背後的結構與理論意涵,並利用這些潛在結構進行分析應用(得到因素 factors )
萃取過程
差異在於兩者對於觀察相關矩陣的處理方式
也就是處理變異數上的差異
PCA analyzes variance: 觀察變項的所有變異量均被分析(觀察相關係數矩陣中對角線總和)
FA analyzes covariance: 僅有共同變異量(shared variance)被分析(觀察相關係數矩陣中對 角線以共同性來取代)
5
因素分析的類型
不同萃取方法皆產生直交的成分或因素來反應觀察相關矩陣R
不同點在於抽取的標準不同,例如最大變異、最小殘差等
當樣本數大、觀察變項數目多或共同性估計相近時,各方法差異不大
因素分析結果是否穩定不是決定於萃取的方法而是變項間的關係
探索性因素分析-淡江大学
13
理論架構1 --數學模式
Zjn=aj1F1n+aj2F2n+…+ajqFqn+djUjn, j=1,2,…,p, n=1,2,…,N
其中
Zjn:第n個樣本單位在第j個觀察變數的分數 Fin:第n個樣本單位在第i個共同因素之分數 Ujn:第n單位在第j個觀察變數的獨特因素之分數 aji:為因素權重(factor weight) ,用以表示第i個共同因 素對第j個觀察變數之權重,又稱為組型(or因素)負荷量 (pattern loading) dj:第j個觀察變數之獨特因素的權重 且假設 Z、F、U均為已標準化之分數 ~N(0,1)
驗証性因素分析(Confirmatory factor analysis)
8
探索性因素分析 v.s.驗証性因素分析
由三個變數x1, x2, x3找到2個共同因素f1, f2,則其路徑圖如下
其中表可觀測的, 表不可觀測的。 Note: 在驗證性因素分析路徑圖中並非每個因素 fi 皆與變數 xi 間有連線(即路徑) 一般使用LISREL分析方法
正面肯定
負面評價
9.我常會覺得自己是一個失敗者
6
潛伏結構
自尊因素 組型負荷量 自尊變數
我覺得自己和別人一樣有價值,I57
獨特性 0.368 0.395 0.429 0.501 0.467 0.582 0.266 0.364 0.555 0.45
獨特因素 e1 e2 e3 e4 e5 e6 e7 e8 e9 e10
27
未轉軸因素分析報表範例
19
(二) 共同因素之萃取方法
主軸法(method of principal) 是以共同因素對總共同性之貢獻極大化為萃取原則 重心法(centroid method of factoring) 在電腦普及以前,常以重心法估計組型負荷量 重心法是根據觀察變數之相關係數矩陣計算組型負 荷量 最大概似法(maximum likelihood analysis) 需先假設共同因素之個數及服從常態分配,然後依 此假定推導因素及共同性 缺點計算過程相當繁複且不一定得到收斂的結果 較適用於驗證性因素分析
05.探索性因素分析
2015-2016学年第二学期
高级心理统计
6
基本原理 (2/5)
• 因子载荷 (factor loading)
– 反映了观测变量是如何由公因子线性表示的 – 也反映了因子和变量之间的相关程度。
• 变量相关
– 任何两个观测变量之间的相关系数等于对应因子载荷 乘积之和
用数目较少且更有意义的潜在构念来解释一组观测变量在一组变量中选择少数几个最有代表性即与所有其他因素相关最高的变量建立少数几个独立的因素代替多数变量进行多元回归以解决多元共线性的问题量表的结构效度分析高级心理统计20152016学年第二学期基本目标考察被试在各个条目上的反应具有多大程度的变异并试图用较少的因子结构来解释这些变异即每个条目变量在多大程度上能用几个相同的因子来解释类似回归分析高级心理统计20152016学年第二学期基本原理15是公因子commonfactors是特殊因子uniquefactorsij是第i个观测变量在第j个公因子上的载荷因素分析模型假定k个特殊因子之间彼此独立特殊因子和公因子之间也彼此独立
rij ai1a j1 ai 2 a j 2 aim a jm
• 公因子模型是从解释变量相关关系的角度出发的
2015-2016学年第二学期 高级心理统计 7
2015-2016学年第二学期
高级心理统计
8
基本原理 (3/5)
• 共同度 (communality)
– 即公因子方差,观测变量方差由公因子解释的比例。 当公因子彼此独立 (正交)时,等于该变量有关的因子载 荷的平方和
高级心理统计
3
基本目标
• 考察被试在各个条目上的反应具有多大程度的变 异,并试图用较少的因子结构来解释这些变异
第十章探索性因素分析
• Correlation Matrix框几种检验变量是否适宜做因素分析 Matrix框几种检验变量是否适宜做因素分析 的方法: 的方法 • Coefficients 计算相关系数矩阵 • Significance levels 显著性水平 • Determinant 相关系数的行列式 • Inverse 相关系数矩阵的逆矩阵 • Reproduced 再生相关矩阵 • Anti-image 反映像相关矩阵检验 • KMO and Bartlett’s test of sphericity检验变量的偏相关是 否很小,相关矩阵是否单位阵。
四、解释因子
• 因子旋转 因子旋转是实现因子解释的方法,其目的是通过改变坐标 轴的位置,重新分配各个因子所解释的方差比例,是因子 结构更简单更易于解释。 • 因子旋转的方法 因子旋转的方法: • 正交旋转(因子轴的夹角为90度)和斜交旋转(因子轴之 间的夹角小于90度)。 • 旋转方法选择的原则:依据研究问题的需要。如果只关心 旋转方法选择的原则 是几个因子则用正交旋转;如果要得到几个有理论和实际 意义的因子需采用斜交旋转。
• 因子分析有两个核心问题:构造因子变量;对因子变量进 行命名解释。 • 有四个步骤: • (1)确定原始变量是否适于因素分析 • (2)构造因子变量 • (3)利用旋转使得因子变量具有可解释性 • (4)计算因子变量得分
• 确定原始变量是否适于因素分析 • (1)计算相关系数矩阵,如果大部分相关系数均小于0.3, 说明不适合做因素分析; • (2)Bartlett test of sphericity(巴特利特球形检验),如果 P值小于0.05表明适合做因子分析 • (3)Anti-image correlation matrix(反映像相关矩阵检验), 如果反映像相关矩阵中有些元素的绝对值较大,说明这些 变量不适合做因子分析。 • (4)KMO(Kaiser-Meyer-Olkin)检验 • KMO取值范围在0—1之间,越接近于1越适合做因素分析。 • 其标准为: • 0.9<KMO非常适合; • 0.8<KMO<0.9适合; • 0.7<KMO<0.8一般;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
17
共同性與解釋百分比
Communality共同性:
變項的變異量被因素解釋的百分比
− .086 .981 − .071 − .977 Αrotated = .994 .026 .997 − .040
(-.086)2+(.981)2=.970 (-.071)2+(-.997)2=.960 (.994)2+(.026)2=.989 (997)2+(-.040)2=.996 1.919 .48 3.915 .98
5
因素分析的類型
不同平平方法皆產生直交的成分或因素來反應觀察相關矩陣R
不同點在於抽平的標準不同,例如最大變異、最小殘差等 當樣本數大、觀察變項數目多或共同性估計相近時,各方法差異不大 因素分析結果是否穩定不是決定於平平的方法而是變項間的關係
方法目的
PCA:單純的化簡測量(得到成分components) FA:尋找測量題目背後的結構與理論意涵,並利用這些潛在結構進行分析應用(得到因素 factors )
18
SUM= 1.994 %= .50
重重矩陣
重重矩陣為由因素所推導出的相關矩陣
R
− .086 .981 .970 − .953 − .059 − .125 − .071 − .977 − .086 − .071 .994 .997 − .953 .962 − .098 − .033 R = = .994 .026 .981 − .977 .026 − .040 − .059 − .098 .989 .990 .997 − .040 − .125 − .033 .990 .996
Oblique rotation(斜交轉軸)
允許因素間具共相關之轉軸 因素間最大的相關由δ(delta)決定, 負的δ越小,表示月接近直交, δ=-4為 直交, δ接近1時,因素間的相關可能最高 Direct oblimin:使因素負荷量的差累(cross-products)最小化 Direct quartimin:使型態矩陣中的負荷量平方的差累(cross-products)最小化 Orthoblique:使用quartimax計式將因素負荷量重新量尺化(rescaled)以產生直交 的結果,因此最後的結果保共斜交的性質 Promax:將直交轉軸(varimax)的結果再進行共相關的斜交轉軸。因素負荷量平2, 9 4,6次方以產生接近0但不為零的值,藉以找出因素間的相關,但仍保共最簡化因 素的特性
實務層次的問題
因素分析受到相關係數的特性所影響,任何影響相關係數的原因都可能干擾因 素分析 樣本數、遺漏值、常態性、線性關係、偏離值 多元共線性(multicollinearity)與單一性(singularity),極端的共線性與單一性個於 因素分析具共影響 相關係數的大小:如果觀察矩陣中相關係數均小於.3,抽平因素能力低,可能 需放棄使用因素分析 因素分析的偏離值:當某測量變項不被因素所解釋時。當僅共兩個變項所決定 的因素,可能是一種不穩定的因素。
相關矩陣R 上式可以轉成為R=AA’,A稱為因素負荷矩陣
特徵值矩陣L
R = VLV ′ = V L LV ' = (V L )( LV ' ) = AA′
15
因素負荷矩陣
前式可以轉成為R=AA’,A稱為因素負荷矩陣
R = VLV ′ = V L LV ' = (V L )( LV ' ) = AA′
A =V L
− .283 .651 .177 − .685 2.00 A= − .658 .252 .00 .207 .675 − .400 .900 .00 .251 − .947 = .348 1.91 .932 .286 .956
探索性因素分析: 主成分分析與因素分析
1
相關矩陣
Observed correlation matrix
由觀察變項計計得到的相關係數矩陣
Reproduced correlation matrix
由因素導出的相關係數矩陣
Residual correlation matrix
觀察相關係數矩陣與重重相關係數矩陣的差異
平平結果
PCA:
以最少的直交成分來解釋最大的變項變異量 具共單一的數學解
FA:
以最少的直交因素來反應相關矩陣 具共不同的最佳解
6
不同的平平方法一
主成分法(Principal components) 目的在使每一個成分能夠個表最大的觀察變異量 第一個主成分為觀察變項的線性整合,能夠反應最大的變異量, 依序發展各主成分 可以得到最大的解釋變異量 主要因素法(principal factors) 以共同性為分析的個象 因素的抽平以個個程序來進行,起始值為SMC(squared multiple correlations),反覆帶入共同性直到無改善 能夠產生最理想的重重矩陣 映像因素平平(image factor extraction) 各觀察變項的變異量為其他變項的投射。每一個變項的映像分數 係以多元迴歸的方法來計計,映像分數的共變矩陣被進行PCA 類似PCA,能夠產生單一的數學解,個角線與FA相同,為共同 性 因素負荷量不是相關係數,而是變項與因素的共變 7
相關矩陣中的個角線個表變項的標準化的變異量(1.00) 因素分析經由因素的平平個於觀察變項相關矩陣進行平平後,轉成 成為特徵值(L) L=V’RV V’V=I V稱為特徵向量
1.00 − .953 − .055 − .130 − .283 .651 − .283 .177 .658 .675 − .953 1.00 − .091 − .036 .177 − .685 2.00 .00 L= = .651 − .685 .252 .207 − .055 − .091 1.00 .990 − .658 .252 .00 1.91 1.00 .675 .207 − .130 − .036 .990
13
因素分析的範例解明
Cost
Cost of ski ticket S1 S2 S3 S4 S5
Lift
Speed of ski lift
Depth
Depth of snow
Powder
Moisture of snow
32 61 59 36 62
Cost Cost Lift Depth Powder
Pattern matrix型態矩陣
斜交轉軸後各觀察變項與因素間排除因素間相關後之相關係 數矩陣 為斜交轉軸可以反應因素意義的係數
Factor score coefficients matrix因素分數係數矩陣
用以反應因素得分的類迴歸方程式係數矩陣
3
因素分析的目的與問題
因素分析的主要目的在將繁多的變項縮減為少 數的因素,找出變項背後的結構,涉及下列問 題的探討
16
直交轉軸
Varimax法:將因素負荷量的變異數最大化 將高相關更高,低相關更低(19度轉軸)
ΑunrotatedΛ = Αrotated
cos Ψ − sin Ψ Λ= sin Ψ cos Ψ
Α rotated − .400 .900 − .086 .981 .251 − .947 .946 .325 − .071 − .977 = .325 .946 = .994 .932 .348 .026 .286 .956 .997 − .040
2
因素分析的各類矩陣
Orthogonal rotation直交轉軸
所共的因素不具共相關的轉軸結果
Oblique rotation斜交轉軸
因素間具共相關的轉軸結果
Loading matrix因素負荷矩陣
直交轉軸後各觀察變項與因素間的相關係數矩陣
Structure matrix結構矩陣
斜交轉軸後各觀察變項與因素間的相關係數矩陣
Alpha 因素平平 法
1 -.086 -.071 .994 .997 1.997 49.93 1.995 49.87 97.85 2 -.981 .977 -.026 .040 1.917 47.92 1.919 47.99
映像因素平平 法
1 -.086 -.071 .993 .993 1.984 49.61 1.983 49.59 96.35
8
Rotation 轉軸
轉軸的時機
依目的:得到最佳的結構,或保留因素的原始面貌 利用因素散佈圖協助判斷:觀察變項應在各軸上:接近各軸,遠離原點,形成群 落
Orthogonal rotation(直交轉軸)
Varimax:使負荷量的變異數在因素內最大( Г =1) Quartimax :使負荷量的變異數在變項內最大( Г =0) Equamax :綜合前兩者,使負荷量的變異數在因素內與變項內同時最大( Г =.5) Г(gamma)指標:表示簡化的程度:0表變項最簡化,1表因素最簡化,.5表兩者 各半