韩宝成教授 因素分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•
SPSS步骤见下页实例:
将左框中鉴别程度达显著性的题项a1-a22选入右边 “variables”下面,打开“Descriptive”按钮。
取样适当性量数检验,当KMO值越 大时,表示变量间的共同性因素愈 多,愈适合进行因素分析, Kaiser (1974)认为,如果KMO小于0.5, 不宜进行因素分析。
1.4 因素分析的基本步骤
• 因素是一种构念,是存在于大量变量之中的某种共同 变异(covariance),它隐含在大量可观测的事物背 后,难以直接测量,但我们可以从复杂的外在现象中 计算、估计、或抽取得到,其数学原理是共变的抽 取。 • 换句话说,受到同一个构念影响的测量分数共同相关 的部分,就是构念所在的部分,用统计的术语来说, 构念由被称为“因素”的共同相关的部分的得分来表示。 • “动机”的例子用下图来表示因素分析的思路。
1.1 示例:
• Gardner是第二语言习得研究领域的一位著名学者,他和他的同 事在调查第二语言学习者差异时设计的问卷中这有这样几个问 题:
这6个问题在测量什么?学习法语的态度?学习法语的愿望? Gardner认为,这些问题所共同反映的内容,是所谓学习动机 (motivation)。 • 换句话说,一个学习动机强的人,会在这6个题目上得到高分, 反之,学习动机弱的人会得低分。虽然每个问题侧重点不同,但 是影响这些题目分数高低的共同原因,就是学习动机这一“潜在变 量”(latent variable)。 • 这份简单的问卷有6个问题,即6个可观测和测量变量,研究者从 这6个变量中概括、推论出来1个客观存在的、不可观测和测量的 “潜在变量”——动机,并用它来概括和解释这6个观测事实,这种 从大量观测变量中寻找、确定基本变量(即因素)数目和性质的 统计分析技术便是因素分析(factor analysis)。 • •
1.4.1 具体步骤
A. 计算变量间相关矩阵或共变矩阵
– 根据原始数据计算出变量之间的相关系数,列出 相关矩阵,在相关系数的基础上进行因素分析, 一般应计算皮尔逊相关系数。 如果一个变量与其它变量间相关很低,在下一个 分析步骤中可考虑剔除此变量,但实际排除与 否,还要考虑到变量的“共同性”(communality) 与“因素负荷量”(factor loadings)。如以原始数 据为因素分析的数据,SPSS会自动先转化为相 关矩阵的方式进行因素分析。
– –
–
C.
决定转轴方向 – 因素负荷矩阵旋转的目的是,尽量使每个测验上的因素负荷值向两 极分化,使其绝对值都接近1或0,这样才能更好地进行把抽取的因 素区分开来,也便于对各个因素进行解释。 – 因素负荷矩阵的旋转包括正交旋转(又叫直角旋转,orthogonal rotation)和斜角旋转(oblique rotation)。所谓正交,指旋转 过程中,因素之间的夹角为90度,旋转后得出的因子(因素)之间 互不相关(相关系数为0);所谓斜角旋转,指容许因素与因素之 间具有一定的共变,因素之间的夹角不是90度。 – 转轴法使得因素负荷量易于解释。转轴以后,使得变量在每个因素 的负荷量不是变大就是变更小,而非转轴前每个因素的负荷量大小 均差不多。
•
•
因素数目的挑选。一种标准是(Kaiser)选取特征值大 于1的因素,Kaiser准则判断应用时,因素分析的题项 数最好不要超过30题,题项平均共同性最好在0.70以 上,如果受试样本大于250位,则平均共同性应在0.60 以上(Stevens, 1992),如果题项数在50题以上,有可 能抽去过多的共同因素。另一种标准是看“陡坡检验图” (scree test),从图的情形抽取因素分析的数目。在 多数的因素分析中,陡坡图是一个重要的选取准则。
– 常用的转轴方法有最大变异法(Varimax),四次方最大值 法(Quartimax),相等最大值法(Equamax),直接斜角 转轴法(Direct Oblimin), Promax转轴法,其中前三者属 “直角转轴法法”(orthogonal rotations),因素与因素间没 有相关(r=0),因素轴间夹角为900,后二者属“斜角转轴” (oblique rotations),表示因素与因素间彼此有某种程度 的相关,夹角不是900。 – 直角转轴的优点是因素间提供的信息不会重叠,观察体在某 一个因素的分数与在其它因素中的分数彼此独立不相关;缺 点是研究者迫使因素间不相关,但在实际生活中它们彼此之 间有相关的可能性很高。因而直接转轴法偏向较多人为操控 方式,不需要正确响应现实世界中自然发生的事情。
1.2 探索性因素分析
• 传统的因素分析主要用来探寻一些相关变量背后可能存在的因素结构, 对于这个因素结构的寻找,研究者没有任何事先的假定。也就是说,对 于因素的抽取、因素的数目、因素的内容以及变量的分类等,研究者没 有事先的预期,完全由因素分析程序去决定。这一套传统的因素分析方 法,被称为探索性因素分析(exploratory factor analysis;EFA)。 在典型的EFA中,研究者通过对共变关系的分解,找出最低限度的主要 成分(principal component)或共同因素(common factor),然后 进一步探讨这些主成分或共同因素与个别变量的关系,找出观察变量与 其相对应的因素之间的强度,即所谓的因素负荷(factor loading),以 说明因素与所属的观察变量的关系,决定因素的内容,并为因素取一个 合适的名字。 探索性因素分析旨在从众多的可观察变量中找出最少的因素,即将众多 相关的原始变量浓缩成为少数几个彼此独立的综合指标,用它来代表所 有的原始变量,这种多元(多变量)统计方法大部分用于研究活动的前 期阶段,具有试探性质,此时研究者想把许多变量简化,以寻找新的理 论模式。
–பைடு நூலகம்
B.
– –
估计因素负荷量
根据相关矩阵,用一系列数学方法求得因素矩阵; 再根据变量在各因素上的因素负荷量,算出各因素的特征 值(eigenvalues),决定因素的数目(表决定因素抽取的 方法,有“主成分分析法”(principal components analysis)、主轴法、一般化最小平方法、极大似然法、 Alpha因素抽取法与映象因素抽取法等。最常用的是“主成 分分析法”和“主轴法” 。 因素负荷越大,测验(或变量)与因素的相关性越高。各 测验与各因素的相关系数被称作因素负荷矩阵。 共同度(commonalities),代表每一测验(或变量)的 变异中能够被各因素解释的部分,其数值为每行因素负荷 的平方和。 共同度越高,表示该变量与其他变量可测量的共同因素越 多,也就越有影响力。
第二次因素分析,题项a9,a17已被移到左边,其它选项 同前。
第二次因素分析KMO值及共同性。
第二次因素分析陡坡图显示,第4个因素以 后,坡度显示为平坦,以保留前4个因素较
未转轴前的数据:整体 解释的方差(第二次因 素分析)
特征值大于1 者,4个因素。
转轴后4个因素可以解释 的总变异量
未转轴的因素矩阵,因素 负荷量小于.01未被显示
D. 决定因素与命名
– 转轴后,要决定因素数目,选取较少因素层面,获得较大 的解释量。在因素分析中,研究者应考虑(Bryman & Cramer, 1997)
• 可从相关矩阵中筛选变量。变量间如果没有显著的相关,或相 关太小,则变量间抽取的因素与研究者初始构建的层面可能差 距很大。相对的变量间如果有极显著的正\负相关,则因素分 析较易构建成有意义的内容。因素分析前,研究者可从变量间 相关矩阵分布中间要看出那些变量间有密接关系。 样本大小。因素分析的可靠性与样本大小关系密切。一般的原 则是,因素分析要有可靠的结果,样本数量要比量表变量项数 多。Gorsuch (1983)认为,题项与受试的比例最好为1:5。样 本总数不少于100人。如果研究主要目的在找出变量中涵括何 种因素,样本数要尽量大,才能保证因素分析的结果可靠。
未转轴的因素矩阵,因素 负荷量小于.01未被显示
转轴后的因素矩阵
题项在其所属因素层面顺 序,是按照因素负荷量的 高低排列。 第1次因素分析,特征值 大于1的因素共有5个,第 5个因素只包含2个题项 (a9,a17),层面所涵盖题 项内容太少,宜删除。 第2次因素分析步骤同 前,只是选取的变量为20 题(a9,a17未被选取)。
转轴后的因素矩阵,因素 负荷量小于.01未被显示
题项在其所属因素层面顺 序,是按照因素负荷量的 高低排列。 第2次因素分析,特征值 大于1的因素共有4个。
此表及第33页的转轴后4个因素解释变异量及累积解释变异量合 并,作为因素分析摘要表在研究报告中写出来。
根 据 因 素 所 涵 括 的 题 项 内 容 , 将 因 素 命 名
打开“Rotation”按钮。
转轴法:最大变异法
显示转轴后的信息
打开“Options”按钮。
完全排除遗漏值 因素负荷出现的格式
根据每一因素层面的因 素负荷量大小排序。
因素负荷量小于后 面数字者不被显 示。
KMO 大 于 0.5 , 可进行因素分析
X2=1168.905, p<0.01, 代表总 体相关矩阵有 共 同 因 素 存 在,适合进行 因素分析。
显示变量的相关矩阵
未转轴的统计量,显示因素分析未转轴之 前的的共同性、特征值(eigenvalues)等
打开“Extraction”按 钮。
陡坡图 主成分分析法抽取因素,SPSS默认法
相关矩阵,以相关矩阵 来抽取因素
特征值,系统内定位1,表示因素抽取时,只抽取特 征值大于1者,研究者可自己更改。
量化研究的基本概念及量表分析
第八讲 量表效度分析理论——因素分析
韩宝成
北京外国语大学 中国外语教育研究中心
一、因素分析
• 因素分析的目的是求得量表的“构念效度” (construct validity)。 • 因素分析是一种统计分析技术,它的目的是从 为数众多的可观测的“变量”中概括和推论出少 数的“因素”,用最少的“因素”来概括和解释最大 量的观测事实,从而建立其最简洁、最基本的 概念系统,揭示出事物之间最本质的联系。
•
•
1.3 实(验)证性因素分析
• 然而,科学研究的过程不仅仅是产生概念和提出理论 的过程,新的概念、假设、理论或模式往往需要通过 多次验证才能得到接受和发展。在验证性质的实验 中,研究者往往已经形成了一定的理论模式,想验证 他的模式是否能够解释他的观测资料,此时的因素分 析研究者称之为实证性因素分析(confirmatory factor analysis;CFA)。EFA和CFA的不同之处在于 前者旨在探寻相关变量背后的、潜在的因素结构,后 者旨在找出变量以验证已有的、事先确定的因素结构 或理论模式。前者又被称为主成分分析法,后者被称 为因素分析法。
•
•
•
Gardner设计的问卷中的6个问题(测验题 目)是6个具有高度相似性、高度相关、具 有共同特征的自变量,这6个自变量分别用 X1、X2、X3、X4、X5、X6来表示。 它们背后共同的特征,就是我们要从这6个 自变量背后抽取的“因素”,用Y来表示,这 个“Y”就是Gardner称之为“动机”的“共同因 素”(common factors),是“理论”上的存 在。 图中的g、h、I、j、k、l、则是动机这个构 念无法被6个题目估计到的独特因素 (unique factors),理论上,可以用来估 计动机的题目可以有无限多,本例为了说明 问题只取了6个,如何从这6个共同因素中 估计出潜在的构念Y的得分?主要工作就是 计算出各个共同因素的权重a、b、c、d、 e、f,又称为因素分数系数(factor score coefficient)。
共同性,转轴后
转轴前后两个因素可以解 释的总变异量
未转轴的特征值
未转轴前的数据:整体 解释的方差
特征值大于1 者,5个。
解 释 变 异 量 : 特征 值 / 题 项 总 数 7.868/22=35.764%
转轴后5个因素可以解释 的总变异量
陡坡图显示,第5个因素以后,坡度显示为 平坦,以保留前5个因素较为适宜。