SPSS探索性因子分析的过程

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一.因子分析的定义

在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。

因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型

i

m im i i i i U F F F F Z +++++=αααα · · · 332211

i Z 为第i 个变量的标准化分数;

(标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。)

m F 为共同因子;

m 为所有变量共同因子的数目;

i U 为变量i Z 的唯一因素;

im α为因子负荷。

(也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关系数,它反映了第i 个变量在第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。)

因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。

所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数,也就是i Z 在第m 个共同因子变量上的相对重要性,因此,im α绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针:一为“共同性”,二为“特征值”。

所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能被因子变量所能解释的部分。

所谓特征值,是每个变量在某一共同因子的因子负荷的平方总和(一直行所有因子负荷的平方和),在因子分析的的共同因子抽取中,特征值最大的共同因子会最先被抽取,其次是次大者,最后抽取的共同因子的特征值会最小,通常会接近于0。将每个共同因子的特征值除以总题数,为此共同因子可以解释的变异量,因子分析的目的之一,即在因素结构的简单化,希望以最少的共同因子能对总变异量做最大的解释,因而抽取的因素越少越好,但抽取的因子的累积变异量越大越好。 三.SPSS 中实现过程 (一)录入数据

(二)因子分析

1.在菜单栏中依次单击“分析”|“降维”|“因子分析”选项卡,打开如图所示“因子分析”对话框。从原变量量表中选择需要进行因子分析的变量,然后单击箭头按钮将选中的变量选入“变量”列表中。“变量列表”的变量为要进行因子分析的的目标变量,变量在区间或比率级别应该是定量变量。分类数据(如:性别等)不适合因子分析。

2.“描述按钮”:主要设定对原始变量的基本描述并对原始变量进行相关性分析。

选中“原始分析结果”复选框,表示因子分析未转轴前之共同性、特征值、变异数百分比及累积百分比,这是一个中间结果,对主成分分析来说,这些值是要进行分析变量的相关或协方差矩阵的对角元素。

KMO与Bartlett球形度检验用来检验适不适合用来做因子分析。KMO检验,检验变量间的偏相关是否很小;巴特利特球形检验,检验相关阵是否是单位阵。KMO值越接近1越适合做因子分析,巴特利特检验的原假设设为相关矩阵为单位阵,如果Sig值拒绝原假设表示变量间存在相关关系,因此适合做因子分析。

3.单击“抽取”按钮:

主要设定提取公共因子的方法和公共因子的个数。

方法:主成分分析法。SPSS默认方法。该方法假定原变量是因子变量的线性组合,第一主成分有最大的方差,后续成分可解释的方差越来越少。这是使用最多的因子提取方法。

分析:相关性矩阵。表示以相关性矩阵作为提取公共因子的依据,当分析中使用不同的尺度测量变量时比较适合。输出:未旋转的因子解。显示未旋转时因子负荷量、特征值及共同性。

碎石图。表示输出与每个因子相关联的特征值的图,该图用于确定应保持的因子个数,通常该图显示大因子的陡峭斜率和剩余因子平缓的尾部之间明显的中断。按特征值大小排列,有助于确定保留多少个因子。

抽取:基于特征值。表示抽取特征值超过指定值的所有因子,在“特征值大于”输入框中指定值,一般为1。

4.旋转:用于设定因子旋转的方法。旋转的目的是为了简化结构,以帮助解释因子SPSS默认不旋转。

方法:最大方差法:是一种正交旋转方法,他使得对每个因子有高负载的变量的数目达到最小,并简化了因子的解释。

输出:旋转解。该复选框只有在选择里旋转方法之后才能选择,对于正交旋转会显示已旋转的模式矩阵和因子变换矩阵。

5.得分:用于对因子得分进行设置,即计算因子得分。

取默认值,单击继续按钮。

6.选项:用于设定对变量缺失值的处理和系数显示的格式。

缺失值:按列表排除个案。去除所有含缺失值的个案后再进行分析。

系数显示格式:按大小排列。载荷系数按照数值的大小排列,并构成矩阵,使得在同一因子上具有较高载荷的变量的排列在一起,便于得到结论。

(三)结果分析

1.KMO及Bartlett’检验

相关文档
最新文档