探索性因子分析法.doc
探索性因子分析(课堂PPT)
确定因子个数的方法(三)
➢碎石图
碎石图是按特征值大小排列因子,横轴表 示因子序号,纵轴表示特征值大小。
公因子提取方法
➢主成分分析法
假设变量是因子的纯线性组合,第 一成分有较大的方差,后续成分其 可解释的方差逐个递减。
➢最大似然法
该方法不要求多元正态分布,给出 参数估计。
因子命名
• 因子载荷阵显示了原始变量与各主成分之 间的相关程度。根据他们的相关程度的大 小,综合出各因子的含义。如果每个因子 与原始变量相关系数没有很明显的差异, 对因子命名就比较困难。
➢公因子的累积方差贡献率
根据累计贡献率达到的百分比确定
确定因子个数的方法(二)
• 实际上累积贡献率是一个次要指标 。主要指标是特征值, 在前一指标达 到的情况下,只要累计贡献率不是 太差都可以接受。即使70%也不是 太大的问题。实际处理中,很少碰 到累计贡献率太低的情况,如果问 卷设计和数据收集没有太大问题的 前提下。
判断变量是否适合做因子分析
1. KMO(Kaiser-meyer-olkin)检验 KMO统计量是用来比较各变量间简单相关系
数和偏相关系数的大小。在0~1之间取值,越接近 1,越适合作因子分析。 2. 巴特利特球形检验
巴特利特球形检验原假设H0为:相关阵是单 位阵,既各变量各自独立。
3. 反映象相关矩阵检验
的变量间强相关问题 ➢数据化简,将具有错综复杂关系的
变量综合为少数几个因子(不可观 测的、相互独立的随机变量) ➢发展测量量表
探索性因子分析——步骤
收集观测变量
构造相关矩阵
判断是否适合作因子分析
确定因子个数 提取因子
特征值大小、因子累计贡献率、碎石图
因子旋转 解释因子结构 计算因子得分
探索性因子分析课件
探索性因子分析的理论假设
主要包括: ①所有的公共因子都相关(或都不相关); ②所有的公共因子都直接影响所有的观测变量; ③特殊(唯一性)因子之间相互独立; ④所有观测变量只受一个特殊(唯一性)因子的影响; ⑤公共因子与特殊因子(唯一性)相互独立。
探索性因子分析
探索性因子分析基本原理
探索性因子分析模型的一般表达式为
其中,Xn表示观测变量,FM代表公因子,它 是各个观测变量所共有的因子,解释变量之间的 相关;Un代表特殊因子,它是每个观测变量所特 有的因子,只对一个原始变量起作用;WM代表因 子载荷,是每个变量在公因子上的相关系数;而 en代表了每一观测变量的随机误差。
探索性因子分析
探索性因子分析
因子得分
• 因子得分就是每个观测量的公共因子的值。根 据因子得分系数和原始变量的标准化值,可以 计算每个观测量的各因子的得分数,并可以据 此对观测量进行进一步的分析。
• 计算因子得分的基本思想是将因子变量表现为 原有变量的线性组合,即通过以下的因子得分 函数计算:
F x x x x j
探索性因子分析
确定因子个数的方法(三)
➢碎石图 碎石图是按特征值大小排列因子,横轴表示因子序号,纵轴表 示特征值大小。
探索性因子分析
公因子提取方法
➢主成分分析法
假设变量是因子的纯线性组合,第一成分 有较大的方差,后续成分其可解释的方差 逐个递减。
➢最大似然法
该方法不要求多元正态分布,给出参数估 计。
j11 j22 jຫໍສະໝຸດ 3(j=1,2···p)
jp p
探索性因子分析
估计因子得分的方法
➢回归法 因子得分的均值为0,方差等于估计因子 得分与实际得分之间的多元相关的平方
因子分析的步骤范文
因子分析的步骤范文因子分析是一种用于探索和解释多变量数据结构的统计方法。
它通过找到一组潜在的不可观测因子,将原始变量降维,并在更小的数量的维度上解释数据的变异。
以下是因子分析的一般步骤。
1.确定研究目的和研究问题:在进行因子分析之前,需要明确研究的目的以及希望从数据中获得的信息。
这有助于确定适当的因子分析模型和分析技术。
2.收集和准备数据:收集与研究问题相关的数据,并进行必要的数据清洗和变量转换。
确保数据具有合适的度量属性和适当的样本大小,以确保因子分析的有效性。
3.确定因子分析的类型:在因子分析中有两种常见的方法:探索性因子分析(EFA)和确认性因子分析(CFA)。
EFA用于发现数据中存在的潜在因子,而CFA用于验证和测试已经在EFA中发现的因子结构。
4.选择合适的因子提取方法:在EFA中,需要选择合适的因子提取方法来识别最重要的因子。
常用的因子提取方法包括主成分分析(PCA)和最大似然估计。
这些方法会根据数据的统计特性直接计算因子。
5. 确定因子数:确定因子的数量是因子分析的一个关键步骤。
可以使用不同的方法来确定因子数量,例如Kaiser准则、Scree图和并排矩阵。
这些方法旨在提供一个统计依据,以决定保留多少个因子。
6.进行因子旋转:因子旋转是用于提高因子分析结果的解释性的一种技术。
它通过旋转原始因子轴,使得因子更容易理解和解释。
常用的因子旋转方法包括正交旋转(如方差最大化旋转)和斜交旋转(如极简主义旋转)。
7.解释和解读结果:根据旋转后的因子结构,解释和解读因子及其对原始变量的关系。
这有助于识别和命名因子,并理解它们的含义。
8.评估和验证结果:最后,评估因子分析的可信度和有效性,并验证因子结构的稳定性和一致性。
这可以通过计算因子得分,进行因子负荷的研究,以及进行交叉验证来完成。
总结起来,因子分析的步骤包括确定研究目的和问题、收集和准备数据、确定分析类型、选择因子提取方法、确定因子数量、进行因子旋转、解释和解读结果,以及评估和验证结果。
探索性因子分析与验证性因子分析
探索性因子分析与验证性因子分析探索性因子分析与验证性因子分析比较研究湖北武汉杨丹全文:探索性因子分析与检验性因子分析就是因子分析的两种相同形式。
它们都就是以普通因子模型为基础,但它们之间也存有着很大差异。
本文通过对它们展开比较分析,找到其优劣,并对方法论分析提供更多一定的指导依据。
关键词:探索性因子分析、验证性因子分析、结构方程模型现实生活中的事物就是错综复杂的,在现实的数据中,我们经常碰到的就是多元的情况,而不仅仅就是单一的自变量和单一的因变量。
因此必须使用多元的分析方法,而因子分析就是其中一种非常关键的处置降维的方法。
它就是将具备错综复杂关系的变量(或样品)综合为少数几个因子,以重现完整变量与因子之间的相互关系,同时根据相同因子还可以对变量展开分类。
它实际上就是一种用以检验潜在结构就是怎样影响观测变量的方法。
因子分析主要存有两种基本形式:探索性因子分析(exploratoryfactoranalysis)和检验性因子分析(confirmatoryfactoranalysis)。
探索性因子分析(efa)致力于找到事物内在的本质结构;而检验性因子分析(cfa)就是用以检验未知的特定结构与否按照预期的方式产生促进作用。
两者之间就是既有联系也有区别的,下面我们就从相同的方面展开分析比较。
一、两种因子分析的相同之处两种因子分析都就是以普通因子模型为基础的。
因子分析的基本思想就是通过变量的相关系数矩阵内部结构的研究,找到能够掌控所有变量的少数几个随机变量回去叙述多个变量之间的有关关系,但在这里,这少数几个随机变量就是不容观测的,通常称作因子。
然后根据相关性的大小把变量分组,使同组内的变量之间相关性较低,但相同组的变量相关性较低。
如图1所示,我们假定一个模型,它表明所有的观测变量(变量1到变量5)是一部分受到潜在公共因子(因子1和因子2)影响,一部分受到潜在特殊因子(e1到e5)影响的。
而每个因子和每个变量之间的相关程度是不一样的,可能某给定因子对于某些变量的影响要比对其他变量的影响大一些。
探索性因子分析法
探索性因子分析法探索性因子分析(ExploratoryFactorAnalysis,简称EFA)是指使用相关分析的统计方法,旨在通过对一组变量之间的相关性来建立一个较小的变量集合,这些变量可以有效地表明以前未知的变量之间的相关性以及它们之间的潜在关系。
这个方法最初是由巴斯等人提出的,但现在已经成为一种常用的统计技术。
它已经广泛用于衡量政策,心理学和社会研究中的素质。
这种分析方法的基本思想是研究一组变量之间的相关性,以确定低级变量的几个组合,即因子。
这些因子可以用来解释变量之间的关系,以便更好地理解数据。
它试图理解数据中有多少潜在变量,这些变量应该占据什么位置。
EFA的统计分析流程大致如下:首先,将待分析的变量输入到统计分析软件中,然后进行因子载荷(factor loadings)分析。
据此,可以确定因子载荷矩阵,即每个变量对每个因子的影响程度。
接下来,对因子载荷进行提取,如主成分分析、因子旋转等,以达到有效的变量组合,并计算出每个因子的因子分数,以确定变量之间的关系。
有几种常用的因子旋转方法,包括oblimin旋转、varimax旋转和promax旋转。
oblimin旋转的目的是消除因子之间的相关性,当因子之间存在相关性时,这将对研究结果产生影响。
varimax旋转是另一种主要方式,使结果更加紧凑,减少被评价变量与任何单个因子的相关度,以获得更加清晰的因子分布情况。
promax旋转是varimax 旋转的一种变形,当变量之间存在同方差变换(OBL)时,可以使用promax旋转来消除这种变异。
EFA的研究可以给出关于变量结构的信息,这也可以帮助研究者更好地了解政策的作用、认知的发展及社会关系的情况。
它还可以作为一种确定一组变量之间关系的基础性方法,帮助研究者了解变量之间的相关性,以便更好地理解变量之间的关系。
此外,探索性因子分析也有一些缺点。
它需要大量的计算,运行时间可能会比较长。
另外,在角度变换时,很容易误把载荷系数反转,这会对结果产生不利影响。
spss探索性因子分析
巴特利特球度检验
原假设:所有的变量都是独立的
如果该统计量的观测值比较大,且对应的概率P小 于给定的显著性水平,应拒绝原假设
意味着所有的变量是相互依赖的,原有变量适合做 因子分析。
巴特利特球度检验
拒绝原假设“所有的变量都是独立 的”,即变量是相互依赖的
Kaiser-Meyer-Olkin measure of sampling adequacy (KMO)
累计贡献率 这五个因子可以累计解释 55.478%的变异。
20
⚫ 根据碎石图(Scree Plot)确定因子数量
21
⚫ 每个因子包含哪些测项? ⚫ 因子载荷(factor loadings):因子载荷是变量X
与因子F的相关系数。 ⚫ 因子载荷绝对值越接近1,表明变量X与因子F的相关
性越强。
22
变量名称
INV4 INV3 INV2 INV1
(1)具有描述性的功能:将数目众多的变量浓缩成数 目较少的几个精简变量,这些精简变量即是一般的因子 (factor),以较少的因子(factor)概括所有的观察 测项(item)
(2)探索理论构念的架构:透过因子分析可以将杂乱 无章的变量重新排列组合,理出头绪;此种探索性的功 能有助于建立新的假设、发展新的理论,即为探索性因 子分析(Exploratory Factor Analysis, EFA)
17个测项->有哪些子构念?
构念
技术就绪度
(TRI)
子构念 测项
创新程度
(INNOVATI ON)
乐观程度
(OPTIMISM)
不适应感
(DISCOMFORT)
不安全感
(INSECURITY)
INS5 INS4 INS3 INS2 INS1
探索性因子分析范文
探索性因子分析范文探索性因子分析首先从一个高维数据集开始,其中包含许多变量。
然后,它试图寻找这些变量之间的共性,以找到能够解释数据变量间关系的隐含结构。
这个结构可以用潜在因子的形式表示,每个潜在因子代表了一组高度关联的变量。
探索性因子分析的目标是减少数据的复杂性,同时保持尽可能多的信息。
为了达到这个目标,它试图识别哪些变量与哪些因子高度关联,并将这些变量从原始数据中移除。
这样一来,我们就可以在分析时更加关注与潜在因子相关的变量,而不用考虑全部的原始变量。
1.确定研究的目标和研究的变量。
在使用探索性因子分析之前,我们需要明确研究的目标以及要分析的变量。
2.收集数据并进行预处理。
收集数据后,我们需要对数据进行预处理,包括处理缺失值、异常值和标准化变量等。
3.确定分析的方法。
根据数据的特点和研究的目标,选择适当的探索性因子分析方法。
常用的方法包括主成分分析和因子分析等。
4.进行因子提取。
在这一步中,我们使用选择的方法从数据中提取潜在因子。
因子提取的主要目标是找到能够解释尽可能多的变异性的因子。
5.旋转因子。
在因子提取之后,我们可能需要旋转因子。
旋转因子的目的是使得因子更加有解释性和可解释性。
6.解释因子。
一旦我们获得了旋转后的因子,我们可以分析和解释每个因子。
这可以通过观察因子载荷和因子得分来完成。
7.验证分析结果。
为了确保分析结果的可靠性和稳定性,我们可以使用一些统计指标,如可信性分析和重复性分析来验证分析结果。
探索性因子分析的优势在于能够简化数据集并发现变量间的潜在结构和关系。
它可以帮助我们理解数据的本质和内在规律,并提供更具解释力的结果。
然而,它也存在一些限制,如在因子选择和旋转过程中的主观性和因子解释的复杂性。
总而言之,探索性因子分析是一种非常有用的数据分析方法,可以用于降维和数据理解。
通过使用探索性因子分析,我们可以发现变量间的隐藏关系,从而更好地理解和解释数据集。
exploratory factor analysis (efa
exploratory factor analysis (efa【原创实用版】目录1.探索性因子分析(EFA)的概述2.EFA 的应用领域和优点3.EFA 的步骤和过程4.EFA 的局限性和挑战5.EFA 的未来发展趋势正文探索性因子分析(EFA)是一种常用的数据分析方法,旨在通过研究变量之间的关系来识别潜在的共同因素。
这种方法在社会科学、心理学、教育学等领域中得到了广泛的应用,以解决研究中的多元变量问题。
本文将从 EFA 的概述、应用领域和优点、步骤和过程、局限性和挑战以及未来发展趋势等方面进行详细阐述。
首先,EFA 是一种无监督的统计分析方法,通过研究原始变量之间的相关性来识别潜在的因子。
这种方法不需要先验的理论知识,可以自动发现数据中的结构和关系。
EFA 的优点在于能够简化原始变量的数量,将具有错综复杂关系的变量归纳为少数几个共同因子,从而降低研究的复杂度。
此外,EFA 还可以为后续的理论建构和研究提供有益的启示。
其次,EFA 的应用领域十分广泛,涉及社会科学、心理学、教育学、市场营销等诸多领域。
在这些领域中,EFA 可以帮助研究者解决多元变量问题,提高研究的可解释性和可预测性。
例如,在市场营销领域,EFA 可以用于分析消费者的购买行为,识别影响消费者购买决策的关键因素。
接着,EFA 的步骤和过程主要包括以下几个方面:(1)收集数据:收集与研究问题相关的原始变量数据;(2)数据清洗:处理缺失值、异常值等问题,保证数据质量;(3)选择合适的旋转方法:如正交旋转、斜交旋转等;(4)执行 EFA:运用统计软件进行计算,得到因子载荷矩阵、共性矩阵等结果;(5)解释结果:根据旋转后的因子载荷矩阵,解释各因子的含义和作用。
然而,EFA 也存在一些局限性和挑战。
例如,EFA 的结果受到样本特征和数据结构的影响,可能存在不稳定和可变性。
此外,EFA 无法确定因子的精确含义,需要结合理论知识进行解释。
因此,在使用 EFA 时,研究者需要充分考虑其局限性,并结合其他研究方法进行综合分析。
探索性因子分析分析
因子的解释和命名——因子旋转
• 因素分析的目的不仅是求公因子,更要是要知道每个因子 的意义。根据主成分法计算的因素模式解释很麻烦,因为大 多数因子都和许多变量相关。 • 因子旋转的目的:通过改变因子轴的位置,重新分配各因 子所解释的方差比例,为了获得结构因子模式的“简单结构” (simple structure): — 在各因子上只有少数变量有较高的负荷,其它变量上 的负荷(绝对值)很低; — 每个变量只在少数因子上有很高的负荷; — 任取两因子,每个变量只能在一个因子上有较高负荷。 • 简言之,就是调整因素负荷矩阵式中的行、列值向0和±1 极化,使某些变量的负荷尽可能往某个因子上集中,而另一 些变量的负荷尽可能往另一个因子上集中,使得每个因子上 仅“负载”几个变量。
输出各个变量的基本描述统计量
输出因子分析的初始解
相关系数矩阵
变量相关系数矩 阵的行列式值
反映像相关矩阵
求解初始因子解
因子分析中有多种确定因子变量的方法, 如基于主成分模型的主成分分析法和基于因子 分析模型的主轴因子法、极大似然法、最小二 乘法等。 其中基于主成分模型的主成分分析法是使 用最多的因子分析方法之一。下面以该方法为 对象进行分析。
将标准化因子值作为新变量保存在当前数据 文件中,计算出的因子值均值为0,默认的 变量名为FAC1_1、FAC2_1、FAC3_1 (分别对应因子1、2、3)等,其中第二个 数字表示第一次分析过程。
SPSS中实现过程(课后作业) SPSS中实现步骤
研究问题 表所示为20名大学生关于价值观的9项测 验结果,包括合作性、对分配的看法、行为出 发点、工作投入程度、对发展机会的看法、社 会地位的看法、权力距离、对职位升迁的态度、 以及领导风格的偏好。
探索性因子分析法
探索性因子分析法
探索性因子分析法是统计学中一种常用的数据分析方法,它结合因子分析技术
和其他技术(如结构方程建模、多元决策分析、聚类分析等),开展数据探索,探索样本之间的变化规律、行为模式和结构关系,揭示数据的内在联系及其他关联性,并进行匹配和准确预测。
因此,在基础教育中,探索性因子分析法可以有效地帮助我们深入洞察学习环境、学习进程以及学习者行为特征,提高教育学者和研究者的知识积累,从而使得基础教育更加有效、全面、精确地进行进行。
例如,在基础教育中,探索性因子分析法可以帮助教育者预测学习者的学习行为和发展模式,及时调整课程设计和教育手段;可以帮助家长了解学习者学习和发展情况,制定更好的学业计划;可以帮助专业人士有效分析数据,建立教育模型,提升教育水平。
总之,探索性因子分析法为基础教育提供了一种有效、灵活、可靠的数据分析方法,在教育学中具有极为重要的意义。
16_探索性因子分析
因子旋转:
有时因子载荷较均匀,不容易直接看出潜在因子对哪一
个指标的影响最大,因而不容易赋予潜在因子一个合理
的变量名称。在这种情况下,需采用某种旋转(rotation) 的方法,即,使用某种线性变换将初始潜在因子转换成 一组新的潜在因子,使得新的潜在因子对每一个指标的 因子载荷的绝对值向0或1两极分化,从而能清楚地看到
变量的可测性
可测变量(measured variable):可以直接观察或测
量而得到的变量。 潜在变量(latent variable):不能或不易直接观测得 到的变量。这种变量往往是根据某种理论假设的, 所以也称为理论变量(theoretical variable)。
可测变量
潜在变量
什么是因子分析?
当观察变量较多时,模型过于复杂,求解困难。
x7
x1 x2
x8
x9
父亲身体状况 父亲生活环境 x5 x6 母亲生活环境 x5 子女 生活环境 x6 母亲身体状况 x3 x4 x10 x11 x12 子女 内生因素 子女 身体状况 x13
x14
x15
如何解决变量多的回归分析问题呢? --- 结构方程模型分析 必备知识:因子分析
探索性因子分析的假设条件:
(1) x i 是随机变量; (2) δi 是均值为 0,方差为常数的正态随机变量; (3) δi 之间相互独立; (4) δi 与所有的ξj 独立; (5) ξi 是方差为1的随机变量,且ξi 之间相互独立。
第四节
探索性因子分析的方法步骤
1、估计因子载荷; 2、确定潜在因子的个数; 3、解释潜在因子的实际意义; 4、计算因子得分。
a 2 = Cov (X 2 ,ξ ) = b 1 r 2 1 + b 2 r 2 2 + b 3 r 2 3
因子分析(探索性)_X1_X2_X3
因子分析(探索性)结果输出结果1:KMO检验和Bartlett的检验KMO检验和Bartlett的检验KMO值0.888Bartlett球形度检验近似卡方2005.769 df 253.000p 0.000***注:***、**、*分别代表1%、5%、10%的显著性水平图表说明:上表展示了KMO检验和Bartlett球形检验的结果,用来分析是否可以进行因子分析。
● 若通过KMO检验(KMO>0.6),说明了题项变量之间是存在相关性的,符合因子分析要求;● 若通过Bartlett检验:P<0.01或P<0.05, 呈显著性,则可以进行因子分析。
智能分析KMO检验的结果显示,KMO的值为0.888,同时,Bartlett球形检验的结果显示,显著性P值为0.000***,水平上呈现显著性,拒绝原假设,各变量间具有相关性,因子分析有效,程度为适合。
输出结果2:方差解释表格总方差解释成分特征根旋转后方差解释率特征根方差百分比累积特征根方差百分比累积1 10.063 43.752% 43.752% 4.921 21.395% 21.395%2 2.185 9.502% 53.254% 3.808 16.556% 37.951%3 1.552 6.749% 60.003% 2.803 12.186% 50.138%4 1.274 5.538% 65.541% 2.678 11.645% 61.783%5 1.008 4.384% 69.925% 1.873 8.142% 69.925%6 0.832 3.616% 73.541%7 0.766 3.331% 76.872%8 0.663 2.882% 79.754%9 0.569 2.474% 82.228%10 0.542 2.358% 84.587%11 0.479 2.083% 86.67%12 0.430 1.871% 88.541%13 0.403 1.754% 90.295%14 0.385 1.675% 91.97%15 0.292 1.27% 93.24%16 0.265 1.154% 94.394%17 0.264 1.149% 95.543%18 0.229 0.994% 96.537%19 0.208 0.906% 97.443%20 0.178 0.773% 98.216%21 0.157 0.683% 98.9%22 0.149 0.649% 99.549%23 0.104 0.451% 100.0%图表说明:图表说明:● 碎石图是根据各主成分对数据变异的解释程度绘制的图。
探索性因子分析PPT演示课件
3
• 探索性因子分析法(Exploratory Factor Analysis, EFA)是一项用来找出多元观测变量的本质结构、 并进行处理降维的技术。
• 特点: (1)利用因子分析来确定因子个数——降维 (2)完全依赖资料数据
4
探索性因子分析的理论假设
主要包括: ①所有的公共因子都相关(或都不相关); ②所有的公共因子都直接影响所有的观测变 量; ③特殊(唯一性)因子之间相互独立; ④所有观测变量只受一个特殊(唯一性)因子 的影响; ⑤公共因子与特殊因子(唯一性)相互独立。
21
• Example
22
• 旋转后的因子表达式可以写成:
FAC1 1 0.091 pop'0.392 school'0.039 em ploy ' 0.299 services'0.403 house' FAC2 1 0.484 pop'0.096 school'0.465 em ploy ' 0.138 services'0.098 house'
19
因子得分
• 因子得分就是每个观测量的公共因子的值。根 据因子得分系数和原始变量的标准化值,可以 计算每个观测量的各因子的得分数,并可以据 此对观测量进行进一步的分析。 • 计算因子得分的基本思想是将因子变量表现为 原有变量的线性组合,即通过以下的因子得分 函数计算:
· · p) Fj j1 x1 j 2 x2 j3x3 jpxp (j=1,2·
16
• 因子分析的一个重要目的在于对原 始变量进行分门别类的综合评价。 如果因子分析结果保证了因子之间 的正交性,但对因子不易命名,可 以通过对因子模型的旋转,得到容 易解释的结果。
探索性因子分析
探索性因子分析探索性因子分析(Exploratory Factor Analysis, EFA)是一种常用的统计方法,用于发现数据集中潜在的因子结构。
本文将探讨探索性因子分析的基本原理、应用领域以及分析步骤。
一、探索性因子分析的基本原理探索性因子分析的主要目标是通过对一组观测变量的统计分析,找出其中存在的共同的因素或维度,从而解释变量之间的相关关系。
其基本原理是将原始观测数据转化为较少数量的因子,以便更好地理解和解释数据。
探索性因子分析的核心假设是,一组观测变量可能是由一组隐含的共同因子所决定的。
每个共同因子代表一种概念或特征,而每个观测变量则表现出这些共同因子的不同强度。
通过探索性因子分析,我们可以识别出这些共同因子,从而更好地理解观测变量之间的关系。
二、探索性因子分析的应用领域探索性因子分析在各个学科和领域中都有广泛的应用。
以下列举几个常见的应用领域:1. 心理学:探索性因子分析在心理学中常用于测量和评估心理特质、人格特征和心理健康等方面。
通过分析心理测量问卷的数据,可以识别出隐藏在问卷题目背后的共同因子,进而得到更全面和准确的评估结果。
2. 教育研究:探索性因子分析可以用于分析教育测试成绩的数据,帮助研究人员了解学生的学习特征和学科能力,并发现不同因素对学生学业成绩的影响。
3. 市场调研:在市场调研中,探索性因子分析可以用于分析产品或服务的评价数据,帮助企业了解顾客需求和偏好,并提供科学依据为产品改进和市场策略制定。
4. 医学研究:在医学研究中,探索性因子分析可以用于分析疾病风险因素、病人症状和临床变量等数据,从而帮助医生和研究人员更好地了解和解释疾病发展的机制。
三、探索性因子分析的步骤进行探索性因子分析通常需要以下步骤:1. 收集数据:首先,需要收集与研究目的相关的数据。
这些数据可以是问卷调查、观察记录、实验结果或其他形式的数据。
2. 数据预处理:在进行因子分析之前,通常需要对数据进行预处理。
第7讲 探索性因子分析.
2 2 2 2 2 2 11 21 31 12 22 32 2 2 2 2 2 2 22 32 ) 3 (11 21 31 ) 3 (12
三、因子分析的几个关键问题
(一)使用因子分析的可能性
并非所有的多变量数据均适合采用因子分析方法。 SPSS软件提供4个统计量来判断观测数据是否适 合进行因子分析。 1. KMO检验(Kaiser-Meyer-Olkin Measure of Sampling Adequacy) KMO是Kaiser-Meyer-Olkin的取样适当性量数, 其值变化于0~1之间。KMO值越接近于1,表示 变量间的公共因子越多,变量间的偏相关 (partial correlation)系数越低,越适合进行因 子分析;当KMO系数过小时,表示变量偶对之间 的相关不能被其他变量解释,进行因子分析不适 合。
20
21 22 23 24 25 26 27 28 29 30 31 32
资料来源:Pizam, Neumann, and Reichel(1978).
探索性因子分析的目的在于找出量表的潜在结构, 减少题项的数目,使之变为一组较少而彼此相关较 大的变量。因而探索性因子分析是一种资料推导的 分析。 如果一个量表层面及所包含的题项已非常明确,使 用者为再确认该量表各层面及所包含的题项是否如 原先使用者所预期的,需要采用一定的方法加以验 证,以探究量表的因素结构是否能与抽样样本适配, 此种因子分析称为验证性因子分析。因而验证性因 子分析是一种理论推导的分析。 目前探索性因子分析方法在旅游研究领域的应用相 对较广,因而这里仅讨论探索性因子分析。
17
18 19
旅游设施员工的一般友好程度 (General friendliness of the employees of tourist facilities)
探索性因子分析
• Example
• 旋转后的因子表达式可以写成:
FA1C 10.091po'p0.392sch'o0o.0l39emp' l 0.299serv'ic0.4es03hou' se FA2C 10.484po'p0.096sch'o0o.4l65emp' lo 0.138serv'ic0.0es98hou' se
• 因子旋转通常分为两类:
正交旋转
Varimax方差最大旋转,它使每个因子上的具有 最高载荷的变量数最小,可简化对因子的解释。
斜交旋转
因子旋转(二)
• 正交旋转的基本假定是,因子分析中被提 取出来的因子之间是相互独立的,因子间 并不相关。它的目的是要获得因子的简单 结构,即使每个变量在尽可能少的因子上 有较高的负载;而斜交旋转中,因子间的夹 角是任意的,也就是说斜交旋转对因子间 是否相关并无限定,这种因子旋转的结果 就会使各因子所解释的变量的方差出现一 定程度的重叠。
估计因子得分的方法
回归法
因子得分的均值为0,方差等于估计因子 得分与实际得分之间的多元相关的平方
Bartlett法
因子得分均值为0,超出变量范围的特殊 因子平方和被最小化
Anderson-Rubin法
因子得分的均值为0,标准差为1,且彼此 不相关。是为了保证因子的正交性而对 Bartlett因子的调整。
公因子的累积方差贡献率
根据累计贡献率达到的百分比确定
确定因子个数的方法(二)
• 实际上累积贡献率是一个次要指标 。主要指标是特征值, 在前一指标达 到的情况下,只要累计贡献率不是 太差都可以接受。即使70%也不是 太大的问题。实际处理中,很少碰 到累计贡献率太低的情况,如果问 卷设计和数据收集没有太大问题的 前提下。
探索性因子分析多元回归分析方差分析
1.做一个探索性因子分析(固定10个因子)
提取方法:主成份分析。
提取方法:主成份。
旋转法:具有 Kaiser 标准化的正交旋转法。
a a. 旋转在 7 次迭代后收敛。
[数据集1] C:\Documents and Settings\hp\桌面\探索性因子分析开始340份.sav
a. 因变量:因子3
b. 已输入所有请求的变量。
a. 预测变量:(常量),因子9,因子6,因子7。
b. 因变量:因子3
a. 因变量:因子3
b. 预测变量:(常量),因子9,因子6,因子7。
a. 因变量:因子3
a. 因变量:因子3
a. 因变量:因子3
3.以年级为控制变量,选取其中的任意一个因子,做一个方差分析
[数据集1] C:\Documents and Settings\hp\桌面\探索性因子分析开始340份.sav
"在此之后"检验年级
同类子集。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
探索性因子分析法(Exploratory Factor Analysis,EFA)目录[隐藏]∙ 1 什么是探索性因子分析法?∙ 2 探索性因子分析法的起源∙ 3 探索性因子分析法的计算∙ 4 探索性因子分析法的运用∙ 5 探索性因子分析法的步骤∙ 6 探索性因子分析法的优点∙7 探索性因子分析法的缺点∙8 探索性因子分析法的假定∙9 EFA在教育、心理领域存在的问题及建议[1]∙10 参考文献[编辑]什么是探索性因子分析法?探索性因子分析法(Exploratory Factor Analysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。
因而,EFA能够将将具有错综复杂关系的变量综合为少数几个核心因子。
[编辑]探索性因子分析法的起源因子分析法是两种分析形式的统一体,即验证性分析和纯粹的探索性分析。
英国的心理学家Charles Spearman在1904年的时候,提出单一化的智能因子(A Single Intellectual Factor)。
随着试验的深入,大量个体样本被分析研究,Spearman的单一智能因子理论被证明是不充分的。
同时,人们认识到有必要考虑多元因子。
20世纪30年代,瑞典心理学家Thurstone打破了流行的单因理论假设,大胆提出了多元因子分析(Multiple Factor Analysis)理论。
Thurstone 在他的《心智向量》(Vectors of Mind, 1935)一书中,阐述了多元因子分析理论的数学和逻辑基础。
[编辑]探索性因子分析法的计算在运用EFA法的时候,可以借助统计软件(如SPSS统计软件或SAS统计软件)来进行数据分析。
[编辑]探索性因子分析法的运用1、顾客满意度调查。
2、服务质量调查。
3、个性测试。
4、形象调查。
5、市场划分识别。
6、顾客、产品及行为分类。
[编辑]探索性因子分析法的步骤一个典型的EFA流程如下:1、辨认、收集观测变量。
2、获得协方差矩阵(或Bravais-Pearson的相似系数矩阵)3、验证将用于EFA的协方差矩阵(显著性水平、反协方差矩阵、Bartlett 球型测验、反图像协方差矩阵、KMO测度)。
4、选择提取因子法(主成分分析法、主因子分析法)。
5、发现因素和因素装货。
因素装货是相关系数在可变物(列在表里)和因素(专栏之间在表里)。
6、确定提取因子的个数(以Kaiser准则和Scree测试作为提取因子数目的准则)。
7、解释提取的因子(例如,在上述例子中即解释为“潜在因子”和“流程因子”)。
[编辑]探索性因子分析法的优点1、EFA法便于操作。
2、当调查问卷含有很多问题时,EFA法显得非常有用。
3、EFA法既是其他因子分析工具的基础(如计算因子得分的回归分析),也方便与其他工具结合使用(如验证性因子分析法)。
[编辑]探索性因子分析法的缺点1、变量必须有区间尺度。
2、沉降数值至少要要变量总量的3倍。
[编辑]探索性因子分析法的假定对于主因子分析法来说,不存在异常值、等距值、线形值、多变量常态分配以及正交性等情况。
[编辑]EFA在教育、心理领域存在的问题及建议[1]1.样本容量、观测变量数目不够很多应用探索性因子分析的研究中,普遍存在的一个问题就是样本容量及观测变量数目太小。
探索性因子分析中,一般要求样本容量至少为100-200,当变量的公共方差较大时,则一定数目的小样本也能确保因子负载的稳定性。
国内学者曾做过一项调查,结果表明:1991-2000年国内两种心理学期刊发表的运用因子分析的文章中,有近10%的文章研究样本小于100,甚至有多达50%的文章没有提供这一信息。
而对于观测变量的数目,一般认为,观测变量与所提取的因子数目之比至少为4。
很多研究者认为观测变量的数目并不与被提取的因子数目相关联,因为研究者事先并不知道会有多少个因子被提取出来,因此,无法依据被提取的因子个数对观测变量的数目进行安排,但是,实际上很多研究者在因子分析前对所探讨的观测变量的因子结构已有了一定的预期。
教育、心理领域中,存在着相当数量的研究并未达到这些标准。
这或许是由于研究者对因子分析的要旨理解不深,但更有可能的是研究者对这类方法的细节重视不够。
2.因子提取方法的误用探索性因子分析中最常用的提取因子的方法主要有两种:主成分分析法和主轴因子法。
决定选用何种方法时,一般有两点值得考虑:一是因子分析的目的;二是对变量方差的了解程度。
如果因子分析的目的是用最少的因子最大程度解释原始数据的方差,则应用主成分分析法;若因子分析的主要目的是确定数据结构,则适合用主轴因子法。
实际上,虽然研究者大多认为主成分分析法和主轴因子法的结果差别不大,但是Widman提出,主轴因子法使用复相关系数的平方作为公共方差的初始估计值,通过不断重复,最后得到确定的公共方差的值,所以,这一过程比起主成分分析法,因子负载就更准确。
因此,他建议研究者最好使用主轴因子法而不是主成分分析法。
但实际研究中,研究者大量使用的是主成分分析法,导致这一结果的最直接可能就是SPSS软件的缺省设置即为主成分分析法。
3.因子数目的确定标准及因子旋转中存在的问题心理领域中,研究者运用的确定因子数目的标准大多是Kaiser法,即特征值≥1.0的标准。
SPSS中,缺省的提取因子方法就是Kaiser法,但实际这一标准仅仅适用于主成分分析法。
Fabrigar等人提出,特征值≥1.0的标准通常会导致提取过多的因子。
当因子提取过多时,因子的重要性就值得怀疑了。
例如,假设有这样的案例,分别从5个变量和10个变量中提取因子,在5个变量的情况下,特征值为1.0的因子将解释变量总方差的20%(1/5,每个变量的方差估计为1,总方差即为5);相应地,在10个变量的情况下,同样特征值为1.0的因子只能解释总体方差的10%(1/10),显然,当从大量变量中提取因子时,使用这样的标准将导致所提取的因子只能解释总方差很小的一部分。
而碎石检验准则的主观性太强,并且,在有些情况下,因子的特征值并没有临界点,因为因子特征值是以一种线性的方式逐渐下降的,所以这种情况是可能存在的,例如双重负荷现象,因此,这种方法并没有太强的使用价值。
一般推荐使用Reise等人的平行分析方法来确定因子的数目。
这种标准比起碎石检验标准来说,减少了研究者主观因素的影响,结果也更客观、真实、有效。
虽然正交旋转能容易地解释和表示因子分析的结果,但由于其规定因子间不相关,因此正交旋转的结果往往并不符合实际。
建议在探索性因子分析中使用斜交旋转法,它既能很容易地解释因子,同时也确保了因子间的简单结构,更重要的是,允许因子间的相关也更符合现实。
例如,在探索性因子分析中提取出了家庭受教育水平和家庭经济收入这两个因子,如果勉强进行正交旋转,忽视两因子间的相关,必然会对结果造成很大的影响,实际上这两个因子都属于家庭社会经济地位的范畴,具有很高的相关,因此,进行斜交旋转,允许两因子间的相关,这样得到的结果才更有说服力。
实际研究中,研究者更多地还是采用了正交旋转的方法,1991-2000年国内两种心理学期刊发表的运用因子分析的文章中,高达60%的文章使用正交旋转,而斜交旋转只占到了6%。
4.因子值缺乏重复验证性心理、教育领域中,研究者求解因子值时,绝大多数依赖的是SPSS,而该软件所提供的求解因子值的方法最后求得的因子值是以一种加权的方式获得的,这就使得这些因子值只适用于特定的样本,缺乏重复验证性。
为了克服这一缺陷,研究者建议使用一种简单的非加权的方法,该方法首先鉴别出在某一因子上有较高负载的变量,然后将这些负载的值相加,从而得到能反映该因子的一种特定的因子值。
使用这种方法研究者将失去变量在因子上的负载信息,但是,这样得到的因子值与SPSS提供的各种权重的因子值具有较高相关,因此,使用这种简单的策略获得的因子值是很有意义的,它能克服缺乏重复验证的缺陷。
当然,因子值本身实质上还是一种观测变量,存在一定的随机误差,可以使用潜变量模型的方法来消除这些随机误差。
5.研究结果的呈现形式不规范因子分析结果的呈现中,哪些信息需要研究者明确提供都有一定的规定,但教育、心理领域的应用中,很少有研究者能提供完整的信息。
作为因子分析的基础,相关矩阵是最根本的,研究者必须提供,否则,研究结果就缺乏重复验证的可能;另外,旋转前后因子所解释的方差、因子负载矩阵等信息也必须提供。
6.过于依赖SPSS,缺乏主动性近年来因子分析应用中存在的最大的问题就是研究者过于依赖SPSS软件,往往是电脑控制人脑,研究者丧失了主动性。
前面所讨论的因子分析实际应用中存在的一些主要问题,很大一部分是由SPSS本身所导致的。
研究者进行因子分析时,大多脱离自己的实际研究,盲目地采用SPSS的各种缺省设置,最后导致获得的研究结果缺乏可信性,不符合实际研究的需要。
例如,在连续性或非连续性(如二分类)变量的因子分析中,研究者应选择适当的分析方法,不能无视观测变量的类型,做统一的处理。
对于由连续变量和非连续变量所组成的混合变量,研究者建议使用Tobit模型;分类顺序变量则应该采用最大似然法(Maximum Likelihood)或加权最小二乘法(Weighted Least Squares)。
为了克服这种依赖性,有些研究者提出了采用其它的一些统计方法,逼迫研究者在进行统计分析时进行更多的思考,如CEFA软件。
总之,实际研究中,研究者应根据各种情况,选用适合的统计策略,尽量克服各种可能存在的问题,避免人脑受电脑的控制;另外,研究者自身加强统计知识的学习对于因子分析的正确运用也显得至关重要。
美文欣赏1、走过春的田野,趟过夏的激流,来到秋天就是安静祥和的世界。
秋天,虽没有玫瑰的芳香,却有秋菊的淡雅,没有繁花似锦,却有硕果累累。
秋天,没有夏日的激情,却有浪漫的温情,没有春的奔放,却有收获的喜悦。
清风落叶舞秋韵,枝头硕果醉秋容。
秋天是甘美的酒,秋天是壮丽的诗,秋天是动人的歌。
2、人的一生就是一个储蓄的过程,在奋斗的时候储存了希望;在耕耘的时候储存了一粒种子;在旅行的时候储存了风景;在微笑的时候储存了快乐。
聪明的人善于储蓄,在漫长而短暂的人生旅途中,学会储蓄每一个闪光的瞬间,然后用它们酿成一杯美好的回忆,在四季的变幻与交替之间,散发浓香,珍藏一生!3、春天来了,我要把心灵放回萦绕柔肠的远方。
让心灵长出北归大雁的翅膀,乘着吹动彩云的熏风,捧着湿润江南的霡霂,唱着荡漾晨舟的渔歌,沾着充盈夜窗的芬芳,回到久别的家乡。
我翻开解冻的泥土,挖出埋藏在这里的梦,让她沐浴灿烂的阳光,期待她慢慢长出枝蔓,结下向往已久的真爱的果实。
4、好好享受生活吧,每个人都是幸福的。
人生山一程,水一程,轻握一份懂得,将牵挂折叠,将幸福尽收,带着明媚,温暖前行,只要心是温润的,再遥远的路也会走的安然,回眸处,愿阳光时时明媚,愿生活处处晴好。