使用SPSS进行探索式因素分析的教程
用SPSS做探索性因子分析
DRAFT ONLY
附:在SPSS 中做探索性因子分析
1
10.12
操作步骤
2
3 第一步:载入数据并启动因子分析。 4
5
6
7 第二步:选择因子所对应的测度项。在这个研究中,我们选择对应于七个变量(包括8 自变量、因变量、与控制变量) 的测度项。
9
10
告读者丗本书的正式版丆《社会调查设计与数据分析:从立题到发表》丆 终于作为国内最好的研究方法丛书-重庆大学万卷方法丛书的一员出版了乮六2011年6月乯。有兴趣购买的读者现在可以从卓越购买。相比于意见稿丆正式版丗
- 增加了第13章丆构成性测度与PLS•C - 增加了第14章丆潜变量的调节作用 - 大量充实第15章丆论文写作与发表
- 第12章中数据分析的结果做了大量更新丆原内容介绍的方法与数据分析的结论虽然正确丆数据计算结果有错误。
其它各章也做了相当多的修改丆不再赘述。正式版比意见版的内容增加了大概三分之一。这些新增的内容对于科研人员和方法论老师来讲是十分重要。
本附录是书稿的一部分。
DRAFT ONLY
1
2
第三步:设定因子求解办法为主成分分析法。使用相关系数矩阵,并设定主要因子的
3
4
特征根大于1。
5
6
7
8
第四步:设计因子旋转方法为“Varimax”。然后在“Factor Analysis”窗口中按“ok”
开始计算。
9
10
DRAFT ONLY
1
2
10.13
主成分分析的结果
3
4 对应于27个测度项,主成分分析法一共产生了27个因子。这是可以产生的因子个数
5 的上限。“Total ”列报告了每一个因子所对应的特征值。“% of Variance ”表示这个特征
SPSS操作步骤及解析
目录
第四章统计描述 (2)
4.2 频数分析 (2)
4.3描述性统计量 (2)
4.4.1(探索性数据分析)操作步骤 (4)
第五章统计推断 (6)
5.2单样本t检验 (6)
5.3 两独立样本t检验 (7)
5.4 配对样本t检验 (8)
第六章方差分析 (9)
6.2.2 单因素单变量方差分析(One-way ANOVA)(操作步骤) (10)
6.3.3 多因素单变量方差分析操作步骤 (14)
6.3.5 不考虑交互效应的多因素方差分析 (17)
6.3.6 引入协变量的多因素方差分析 (18)
第八章相关分析 (19)
8.2 连续变量相关分析实例 (20)
8.3 离散变量相关分析的实例(列联表) (22)
第九章回归分析 (24)
9.1.3 线性回归(操作步骤) (26)
1.多重共线性检验 (26)
2.使用变量筛选的方法克服多重共线性 (29)
二、曲线估计(操作步骤) (32)
9.2.5二项Logistic回归(操作步骤) (35)
第十章聚类分析 (39)
10.3.1 K-均值操作步骤: (39)
10.4.1 系统聚类法操作步骤 (43)
第十一章判别分析 (47)
11.3.1 操作步骤 (48)
第十二章因子分析 (53)
12.2.2操作步骤 (56)
第十三章主成分分析 (64)
13.2 操作步骤 (65)
第十四章相应分析 (69)
14.2相应分析实例(操作步骤) (70)
第十五章典型相关分析 (75)
15.2操作步骤: (75)
第四章统计描述
统计描述是指如何搜集、整理、分析、研究并提供统计资料的理论和方法,用于说明总体的情况和特征。
图解spss探索分析实例
图解spss探索分析实例
最后更新:2012-12-10 阅读次数:【字体:小中大】
探索分析是在对数据的基本特征统计量有初步了解的基础上,对数据进行的更为深入详细的描述性观察分析。它在一般描述性统计指标的基础上,增加了有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。主要的分析如下:
(1)观察数据的分布特征:通过绘制箱锁图和茎叶图等图形,直观地反映数据的分布形式和数据的一些规律,包括考察数据中是否存在异常值等。过大或过小的数据均有可能是奇异值、影响点或错误数据。寻找异常值,并分析原因,然后决定是否从分析中删除这些数据。因为奇异值和影响点往往对分析的影响较大,不能真实地反映数据的总体特征。
(2)正态分布检验:检验数据是否服从正态分布。很多检验能够进行的前提即总体数据分布服从正态分布。因此,检验数据是否符合正态分布,就决定了它们是否能用只对正态分布数据适用的分析方法。
(3)方差齐性检验:用Levene检验比较各组数据的方差是否相等,以判定数据的离散程度是否存在差异。例如在进行独立右边的T检验之前,就需要事先确定两组数据的方差是否相同。如果通过分析发现各组数据的方差不同,还需要对数据进行方差分析,那么就需要对数据进行转换使得方差尽可能相同。Levene检验进行方差齐性检验时,不强求数据必须服从正态分布,它先计算出各个观测值减去组内均值的差,然后再通过这些差值的绝对值进行单因素方差分析。如果得到的显著性水平(Significance)小于0.05,那么就可以拒绝方差相同的假设。
使用SPSS进行探索式因素分析的教程
使用SPSS进行探索式因素分析的教程
探索性因素分析是一种统计方法,用于确定一组变量之间的潜在结构。SPSS是一种常用于数据分析的软件工具,它提供了强大的因素分析功能。
以下是一个使用SPSS进行探索性因素分析的简单教程,该教程可以
帮助您了解如何使用SPSS来执行因素分析并对结果进行解释。
步骤1:导入数据
步骤2:准备数据
确保您的数据符合因素分析的前提条件。确定您要进行因素分析的变
量是否具有线性关系,并进行必要的数据转换(例如,对数转换)以满足
这个条件。
步骤3:执行因素分析
在SPSS的“分析”菜单下,选择“数据准备”和“因子”。在弹出
的对话框中,选择您要进行因素分析的变量并将其移动到“因子”框中。
选择“萃取方法”(如主成分分析或最大似然估计)并指定要提取的因素
的数量。您还可以选择执行因子旋转以获得更简单和解释性更强的因子结构。
步骤4:解读结果
SPSS将生成一个因素分析的输出报告,其中包含多个表格和图形。
以下是一些常见的解读步骤:
-总体解释:观察“总体解释”表,了解因子数量和提取方法的解释
力度。查看“因素”的特征值,了解提取的因子解释的总方差比例。
-因子负荷:查看“因子负荷”表,该表显示了原始变量与提取的因
子之间的相关性。较高的因子负荷表示原始变量与特定因子之间的较强关联。
-因子旋转:如果您选择了因子旋转,则查看“旋转因子载荷矩阵”表,该表显示了旋转后的因子负荷。查看这些旋转后的因子负荷以确定是
否存在更简单的因子结构。
-因子得分:根据选定的因子分析方法,可以生成每个观测值的因子
得分。这些得分表示了每个观测值在每个因子上的得分情况,可以用于后
统计分析软件spss使用指南
ABCD
医学
医学研究中经常需要用到统计分析,SPSS软件 提供了丰富的医学统计方法。
其他领域
如金融、经济、管理等领域也经常使用SPSS软 件进行数据分析。
02
数据输入与整理
数据类型及变量定义
数值型数据
01
包括整数和浮点数,可用于进行各种数学运算和统计
分析。
分类型数据
02 包括有序分类和无序分类两种,用于表示不同的类别
误用统计方法
不同的统计方法适用于不同的数据类 型和分析目的,需根据实际需求选择
合适的统计方法。
忽视假设检验
假设检验是统计分析的重要环节,需 根据分析结果判断假设是否成立,避
免误导结论。
提高使用效率和准确性建议
熟悉软件界面和操作流程
使用快捷键和自定义设置
熟练掌握SPSS软件界面和常用功能,提高 操作效率。
探索性数据分析方法
数据清洗
在进行分析前,用户可以使用SPSS的数据清洗功能,检 查和处理数据中的异常值、缺失值和重复值,以保证分析 结果的准确性和可靠性。
相关性分析
通过计算变量间的相关系数和显著性水平,用户可以了解 变量之间的线性关系强度和方向,为后续回归分析等提供 基础。
数据转换
SPSS支持多种数据转换方法,如对数转换、标准化、归 一化等,以满足不同分析模型对数据的要求。
spss实验报告4
spss实验报告4
SPSS实验报告4:探索性数据分析与统计推断
引言
SPSS(统计包括社会科学)是一种常用的统计分析软件,广泛应用于各种学科的研究中。在本次实验中,我们将使用SPSS进行探索性数据分析和统计推断,以探索数据的特征和进行假设检验。
方法
我们使用了一个虚拟数据集,其中包含了一组学生的考试成绩和他们的学习时间。首先,我们使用SPSS进行描述性统计分析,包括平均值、标准差、最大最小值等,以了解数据的分布和基本特征。然后,我们进行了相关性分析,探索成绩和学习时间之间的关系。最后,我们使用了t检验和方差分析等统计方法进行假设检验,以验证我们的研究假设。
结果
描述性统计分析显示,学生的平均成绩为75分,标准差为10分,学习时间的平均值为3小时,标准差为1小时。相关性分析显示,成绩和学习时间之间存在显著的正相关关系(r=0.6,p<0.05)。假设检验结果显示,学习时间对成绩有显著影响(t=3.2,p<0.05),不同年级学生的成绩也存在显著差异(F=4.5,p<0.05)。
讨论
本次实验结果表明,学生的学习时间与考试成绩之间存在显著的正相关关系,这意味着学生花费更多的时间学习,通常能取得更好的成绩。此外,不同年级学生的成绩也存在显著差异,这可能与学习内容的难易程度有关。这些结果对
于教育教学实践具有一定的启示意义。
结论
通过SPSS进行探索性数据分析和统计推断,我们得出了一些有意义的结论,这些结论对于我们了解数据的特征、验证假设以及指导实践具有重要意义。SPSS
作为一种强大的统计分析工具,可以帮助我们更好地理解数据和进行科学研究。希望本次实验能够对大家对SPSS的应用有所帮助。
使用SPSS进行数据探索性分析的步骤
使用SPSS进行数据探索性分析的步骤
数据探索性分析是研究者在进行数据分析之前的一项重要工作。它可以帮助研究者了解数据的基本特征、发现数据中的规律和异常情况,并为后续的数据分析提供参考。SPSS是一款常用的统计软件,它提供了丰富的功能和工具,方便研究者进行数据探索性分析。下面将介绍使用SPSS进行数据探索性分析的步骤。
1. 导入数据
在SPSS中,首先需要将待分析的数据导入软件中。可以通过点击菜单栏中的"文件"-"打开"来选择数据文件,或者直接将数据文件拖入SPSS的工作区。导入数据后,SPSS会自动将数据显示在数据视图中。
2. 查看数据
在导入数据后,可以通过查看数据视图来了解数据的整体情况。数据视图显示了数据表格,每一列代表一个变量,每一行代表一个观察值。可以通过滚动条或者快捷键来浏览数据。同时,还可以通过点击菜单栏中的"数据"-"描述统计"-"频数"来查看每个变量的频数分布情况。
3. 处理缺失值
在数据分析过程中,经常会遇到缺失值的情况。缺失值可能对后续的数据分析产生影响,因此需要对缺失值进行处理。SPSS提供了多种处理缺失值的方法,如删除含有缺失值的观察值、替换缺失值等。可以通过点击菜单栏中的"数据"-"选择"-"筛选"来选择处理缺失值的方法。
4. 描述性统计分析
描述性统计分析是数据探索性分析的重要部分,它可以帮助研究者了解数据的基本特征。在SPSS中,可以通过点击菜单栏中的"分析"-"描述统计"-"统计量"来进行描述性统计分析。在弹出的对话框中,选择需要进行描述性统计分析的变量,并
使用SPSS软件进行多因素方差分析
使用SPSS软件进行多因素方差分析
使用SPSS软件进行多因素方差分析
一、引言
多因素方差分析(ANOVA)是一种统计方法,用于比较两个或
更多个因素对于某个连续型变量的影响是否显著不同。通常,研究者需要了解不同因素对于结果值的影响,并确定是否存在交互作用。SPSS(统计软件包for社会科学)是一款常用的统计软件,它提供了丰富的功能和工具,可用于数据分析和建模。本文将介绍如何使用SPSS软件进行多因素方差分析。
二、数据准备
在进行多因素方差分析之前,需要先进行数据准备。假设我们有一个研究目的是了解不同教育水平和不同工作经验对个人收入的影响。我们收集了400位参与者的数据,包括个人收入(连续型变量),教育水平(分类变量:小学、初中、高中、本科、硕士、博士)和工作经验(分类变量:1-5年、6-10年、11-15年、16年及以上)。
三、数据导入
首先,将数据导入SPSS软件。打开SPSS软件后,选择“文件”-“读取数据”-“输入数据”。在弹出的对话框中选择数据文件,并将其导入到SPSS软件中。
四、数据探索
在进行多因素方差分析之前,我们首先需要对数据进行探索,查看教育水平、工作经验和收入之间的关系。选择“描述统计”-“交叉表”菜单,将教育水平和工作经验作为行变量,
将收入作为列变量。点击“确定”按钮后,SPSS将生成一个
交叉表,显示不同教育水平和工作经验对于收入的平均值和标
准差等统计信息。
五、多因素方差分析
在导入数据并进行数据探索后,我们可以开始进行多因素方差分析。选择“分析”-“一般线性模型”-“多因素”菜单。在弹出的对话框中,将个人收入作为因变量,将教育水平和工作经验作为因子变量。点击“因子”按钮,将教育水平和工作经验拖动到因子变量框中。然后,点击“选项”按钮,对方差分析的设置进行调整,如是否显示交互作用。
探索性因素分析及SPSS应用
9
二 因素分析模型及条件
xx1i ll 1i11 ff 11 l1 2 f2 lij fj l1mflmimf m1i
m
i
k
1,,
k
j 1,, m
xk lk1 f1 lk 2 f2 lkm fm k
公因子理论:
p个观测变量,相当于一份问卷中的p个题项,它是一个随机 变量;不同被试都将有p个不同的数据;m个公因子,其值 称因子值(factor score);ε代表残差,包括特殊因子和误 差,是各变量中不能用公因子解释的部分;系数lij称为因子 负荷(factor loading),表示第i个变量在第j个因子上的相对重
2004-3-10
Application
12
第二节 因素分析步骤
• 筛选观测变量 • 样本数据适当性考察
因素分析适合度检验
• 确定因子数 • 求解因素模式 • 因子旋转
参数估计 正交旋转
1.因素抽取 主成分法 主轴因子法 极大似然法
……
未旋转解 共同度 特征值
3.因素旋转 方差最大法 平均正交法 斜交旋转
/MATRIX=IN(COR=*)
Exploratory Factor Analysis & SPSS
2004-3-10
Application
14
筛选观测变量
筛选观测变量是一个复杂的问题,它涉及到理论构想, 编制量表前开放式问卷项目的归纳整理和项目分析等。模 型中包含了无关的变量或者剔除了相关的变量可能极大地 影响分析的结果。以下观测变量最好不选入模型:
SPSS探索性因子分析的过程
S P S S探索性因子分析的
过程
Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT
现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示:
一.因子分析的定义
在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。
因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。
二.数学模型
Z为第i个变量的标准化分数;(标准分是一种由原始分出来的,它是用来说明原始分i
在所属的那批分数中的相对位置的。)
m F 为共同因子;
m 为所有变量共同因子的数目;
i U 为变量i Z 的唯一因素;
im α为因子负荷。(也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关
系数,它反映了第i 个变量在第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。)
因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。
SPSS探索性因子分析的过程
SPSS探索性因子分析的过程
SPSS探索性因子分析(Exploratory Factor Analysis,EFA)是一
种统计方法,旨在通过将大量的观测变量分解为较小的、相互关联的潜在
因子,来帮助研究者理解潜在的数据结构和模式。本文将介绍SPSS中进
行探索性因子分析的过程,包括数据准备、模型设定、因子提取和解释因子。
一、数据准备
在进行探索性因子分析之前,需要确保数据准备工作已经完成。这包
括了数据的清洗、缺失值的处理和变量的选择等。
清洗数据:删除不适用的或异常的数据,确保数据的一致性和可靠性。
处理缺失值:根据缺失数据的性质和缺失的模式,选择适当的处理方法,如删除带有缺失值的观测、替换缺失值(如均值填充)等。
选择变量:根据研究目的和理论基础,选择合适的变量进行因子分析。
二、模型设定
在SPSS中,打开要进行因子分析的数据集,选择"数据"菜单下的"概
要统计",然后选择"因子"。
选择因子旋转方法:因子旋转是为了使提取出的因子更易解释和理解。常用的旋转方法有正交旋转(如Varimax旋转)和斜交旋转(如Oblimin
旋转)等。在进行因子旋转时,可以根据理论和实际情况选择适当的旋转
方法。
三、因子提取
在SPSS的因子分析过程中,需要进行因子提取来确定潜在因子的数量。
选择因子数:在进行因子提取时,需要预设潜在因子的数量。根据Kaiser准则和Scree图等指标,确定因子的个数。Kaiser准则建议保留特征值大于1的因子,Scree图则可通过图形分析法确定因子数。
执行因子分析:根据前面设定的方法和参数,执行因子分析。
探索性因素分析
3
探索性因素分析 2/4
– 因素分析目的: 將許多的變數減縮為少數幾個因素,以做為 建立更深入的研究模型之基礎。 建立一組相互獨立的因素以用於處理共線性 (multicollinearity)對某些研究方法所產生的 問題(例如:迴歸)。 找出可能的變數集群(clustering)。
6
進行因素分析前資料的檢視
1. 檢視資料的相關係數矩陣,相關係數須顯著的大於0.3。
2. Bartlett的球型檢定(Bartlett test of sphericity),此種統 計檢定主要是用來檢定變數間的相關係數是否顯著,核定 結果若p值小於0.05即代表顯著。
3. 取樣適切性量數(KMO),其值介於0到1之間,若KMO等於 1表示每一變數均可被其他變數完全的預測,若KMO≧0.9, 表示資料非常適合做因素分析;0.9>KMO≧0.8,表示很適 合;0.8>KMO≧0.7,表示還不錯;0.6>KMO≧0.5,表示不 太適合;KMO<0.5,表示資料不適合做因素分析。
19
主軸因素法(Principal axis factoring)。
如果R的對角線元素不是1,而是以小於1的某些正數取代, 稱為主軸因素法(Principal Axis Factoring,PAF)。
SPSS探索性因子分析的过程
现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示:
问题 题项 从未使用 很少使用 有时使用 经常使用 总是使用 1 2 3 4 5 a1 电脑 a2 录音磁带 a3 录像带 a4 网上资料 a5 校园网或因特网 a6 电子邮件 a7 电子讨论网 a8 CAI 课件 a9 视频会议 a10
视听会议
一.因子分析的定义
在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。
因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型
i
m im i i i i U F F F F Z +++++=αααα · · · 332211
i Z 为第i 个变量的标准化分数;(标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的
那批分数中的相对位置的。)
m F 为共同因子;
m 为所有变量共同因子的数目;
i U 为变量i Z 的唯一因素;
使用SPSS进行探索式因素分析的教程
使用S P S S进行探索式因素分析的教程
第4章探索式因素分析
在社会与行为科学研究中,研究者经常会搜集实证性的量化资料來做验证,而要证明这些资料的可靠性与正确性,则必须依靠测量或调查工具的信度或效度(杨国枢等,2002b)。一份好的量表应该要能够将欲研究的主题构念(Construct,它是心理学上的一种理论构想或特质,无法直接观测得到)清楚且正确的呈现出来,而且还需具有「效度」,即能真正衡量到我们欲量测的特性,此外还有「信度」,即该量表所衡量的结果应具有一致性、稳定性,因此为达成「良好之衡量」的目标,必须有以下两个步骤:第一个步骤是针对量表的题项作项目分析,以判定各项目的区别效果好坏;第二步骤则是建立量表的信度与效度。量表之项目分析、信度检验已于第2、3章有所说明,本章将探讨量表之效度问题。
4-1 效度
效度即为正确性,也就是测量工具确实能测出其所欲测量的特质或功能之程度。一般的研究中最常使用「内容效度」(Content Validity)与「建构效度」(Construct Validity)来检视该份研究之效度。
所谓「内容效度」,是指该衡量工具能足够涵盖主题的程度,此程度可从量表内容的代表性或取样的适切性来加以评估。若测量内容涵盖所有研究计划所要探讨的架构及内容,就可说是具有优良的内容效度。在一般论文中,常使用如下的描述来「交代」内容效度:
而所谓「建构效度」系指测量工具的内容,即各问项是否能够测量到理论上的构念或特质的程度。建构效度包含收敛效度(Convergent Validity)与区别效度(Discriminant Validity),收敛效度主要测试以一个变量(构念)发展出的多项问项,最后是否会收敛于一个因素中(同一构念不同题目相关性很高);而区别效度为判别问项可以与其它构念之问项区别的程度(不
使用SPSS进行探索式因素分析的教程
第4章 探索式因素分析
在社会与行为科学研究中,研究者经常会搜集实证性的量化资料來做验证,而要证明这些资料的可靠性与正确性,则必须依靠测量或调查工具的信度或效度(杨国枢等,2002b )。一份好的量表应该要能够将欲研究的主题构念(Construct,它是心理学上的一种理论构想或特质,无法直接观测得到)清楚且正确的呈现出来,而且还需具有「效度」,即能真正衡量到我们欲量测的特性,此外还有「信度」,即该量表所衡量的结果应具有一致性、稳定性,因此为达成「良好之衡量」的目标,必须有以下两个步骤:第一个步骤是针对量表的题项作项目分析,以判定各项目的区别效果好坏;第二步骤则是建立量表的信度与效度。量表之项目分析、信度检验已于第2、3章有所说明,本章将探讨量表之效度问题。
4—1 效度
效度即为正确性,也就是测量工具确实能测出其所欲测量的特质或功能之程度。一般的研究中最常使用「内容效度」(Content Validity)与「建构效度」(Construct Validity )来检视该份研究之效度.
所谓「内容效度」,是指该衡量工具能足够涵盖主题的程度,此程度可从量表内容的代表性或取样的适切性来加以评估。若测量内容涵盖所有研究计划所要探讨的架构及内容,就可说是具有优良的内容效度。在一般论文中,常使用如下的描述来「交代」内容效度:
而所谓「建构效度」系指测量工具的内容,即各问项是否能够测量到理论上的构念或特质的程度。建构效度包含收敛效度(Convergent Validity )与区别效度(Discriminant Validity ),收敛效度主要测试以一个变量(构念)发展出的多项问项,最后是否会收敛于一个因素中(同一构念不同题目相关性很高)
spss授课_explore
7
6
5
4
3
2 1
N = 12 14
P
1
2
GROUP
17
18
19
20
21
例急性克山病患者与该地区14 例:某克山病高发区测得12例急性克山病患者与该地区 某克山病高发区测得 例急性克山病患者与该地区 名健康人的血磷值( 名健康人的血磷值(mg%)。数据如下:试作探索性分析 方 。数据如下:试作探索性分析( 差是否齐?是否是正态分布?) 差是否齐?是否是正态分布?) 组别 急性克 山病人 健康人 血磷值 4.75 6.40 2.62 3.44 6.50 5.20 5.60 3.80 4.30 5.78 3.76 4.15 2.38 2.60 2.10 1.80 1.90 3.65 2.30 3.80 4.60 4.85 5.80 4.25 4.22 3.84
9
周期(天)
7 6 5 4 3 2 Std. Dev = 1.95 1 0
. 31 . 30 . 29 . 28 . 27 . 26 . 25 . 24 . 23 0 0 0 0 0 0 0 0 0
Frequency
Mean = 28.2 N = 21.00
. 32 0
周期(天)
10
身高 Stem-and-Leaf Plot Frequency Stem & Leaf 2 10 . 89 3 11 . 011 7 11 . 2223333 14 11 . 44445555555555 19 11 . 6666666677777777777 24 11 . 888888888888889999999999 18 12 . 000000000001111111 15 12 . 222222333333333 9 12 . 444444555 5 12 . 66677 3 12 . 889 1 13 . 0 Stem width: 10.00 Each leaf: 1 case(s)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章探索式因素分析
在社会与行为科学研究中,研究者经常会搜集实证性的量化资料來做验证,而要证明这些资料的可靠性与正确性,则必须依靠测量或调查工具的信度或效度(杨国枢等,2002b)。一份好的量表应该要能够将欲研究的主题构念(Construct,它是心理学上的一种理论构想或特质,无法直接观测得到)清楚且正确的呈现出来,而且还需具有「效度」,即能真正衡量到我们欲量测的特性,此外还有「信度」,即该量表所衡量的结果应具有一致性、稳定性,因此为达成「良好之衡量」的目标,必须有以下两个步骤:第一个步骤是针对量表的题项作项目分析,以判定各项目的区别效果好坏;第二步骤则是建立量表的信度与效度。量表之项目分析、信度检验已于第2、3章有所说明,本章将探讨量表之效度问题。
4-1 效度
效度即为正确性,也就是测量工具确实能测出其所欲测量的特质或功能之程度。一般的研究中最常使用「内容效度」(Content Validity)与「建构效度」(Construct Validity)来检视该份研究之效度。
所谓「内容效度」,是指该衡量工具能足够涵盖主题的程度,此程度可从量表内容的代表性或取样的适切性来加以评估。若测量内容涵盖所有研究计划所要探讨的架构及内容,就可说是具有优良的内容效度。在一般论文中,常使用如下的描述来「交代」内容效度:
本研究问卷系以理论为基础,参考多数学者的问卷内容及衡量项目,并针对研究对象的特性加以修改,并经由相关专业人员与学者对其内容审慎检视,继而进行预试及修正,因此本研究所使用之衡量工具应能符合内容效度的要求。
本研究之各研究变项皆经先前学者之实证,衡量工具内容均能足够地涵盖欲探讨的研究主题。另外,本研究于正式施测前,亦针对问卷之各题项与相关领域的学者、专家进行内容适切度之讨论,因此,研究采用之衡量工具应具内容效度。
在内容效度方面,主要是根据文献探讨及专家研究者的经验。然因本研究问卷设计之初,考虑目前相关的文献中,尚未对本研究议题提出实证性问卷,故只能自行设计量表,对于内容效度是否达成,尚有疑虑。
而所谓「建构效度」系指测量工具的内容,即各问项是否能够测量到理论上的构念或特质的程度。建构效度包含收敛效度(Convergent Validity)与区别效度(Discriminant Validity),收敛效度主要测试以一个变量(构念)发展出的多项问项,最后是否会收敛于一个因素中(同一构念不同题目相关性很高);而区别效度为判别问项可以与其它构念之问项区别的程度(不同构念不
同题目相关性很低)。衡量收敛效度的统计方式可使用探索式因素分析法(Exploratory factor analysis),简称因素分析。进行因素分析时,若发现各构念的衡量项目皆可收敛于同一个共同因素之下,则表示该量表的收敛效度是可被接受的。至于区别效度,则可采用因素分析与皮尔森相关分析,首先,必须在因素分析法中,各构念的衡量项目皆没有与其它构念的衡量项目收敛于同一个共同因素之下,此外,在皮尔森相关系数矩阵中,不同构念的衡量项目彼此之间关联性很低,如皮尔森系数皆小于0.3,若出现上述两现象显示不同构念的衡量项目间彼此皆不具有强烈的关连性,据此,即可显示出区别效度是可以被接受的。进行量表之建构效度评估时,虽理应同时检视收敛效度与区别效度,然审视国内之硕士论文或一些期刊论文都可发现,大部分都只以因素分析进行收敛效度之评估,并据以说明量表的建构效度,其方法如:同一构念中,若因素负荷量的值愈大(通常取0.5以上者才保留该项目,否则删除后再重新执行一次因素分析),表示收敛效度愈高。此外,也可使用属线性结构方程(Linear Structural Equation)领域的验证性因素分析(Confirmatory Factor Analysis),以进行模式的适合度检定,并检定各构念是否具有足够的收敛效度与区别效度。
4-1因素分析的意义
因素分析(Factor Analysis)属于多元统计分析技术的一种,其主要目的是浓缩数据。它透过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想的变量来表示其基本的数据结构。这些假想变量能够反映原来众多的观测变量所代表的主要信息,并解释这些观测变量之间的相互依存关系,我们把这些假想变量称之为基础变量,即因素(Factors)。因素分析就是研究如何以最少的信息遗失,而能把众多的观测变量浓缩为少数几个因素。
一般在对实际问题做研究时,研究者往往希望尽可能地多多收集与研究主题相关的变量,以期能针对问题有比较全面性的、完整性的掌握和认识。虽然收集这些数据需投入许多的人力、物力与时间成本,虽然它们能够较为整体而精确地描述研究主题,但将这些资料实际用在分析、建模时,这些变量未必能真正发挥研究者预期的作用,也就是说研究者的「投入」和「产出」并非呈合理的正比,相反的,这样的搜集资料行为反而会给研究者于统计分析时带来许多问题,这些问题如下:
■计算量的问题
由于研究者所收集的变量相当多,如果这些变量都投入数据的分析与建模,无疑的,这将会增加分析过程中于计算上的工作量。虽然,目前计算机运用普遍且其计算能力亦相当优异,然而对于此种高维的变量和庞大的数据仍是于计算上所不容忽视的。
■变数间的相关性问题
由于研究者针对特定之主题所收集到的诸多变量之间通常或多或少都会存在着相关性。也就是说,变量之间往往具有信息的高度重迭性和高度相关性,这些特质将会给统计方法的应用带来许多不便。例如,在多元线性回归分析中,如果这些众多的解释变量之间,存在着较强且显着的
相关性,即存在着高度的多重共线性,那么于回归方程的参数估计时,将带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。
为解决上述的问题,最简单且最直接的解决方法即是精减变量之个数,但是这又必然会导致信息的漏失和信息不完整等现象产生,这是一个Trade-off的问题。为此,研究者无不希望探索一种更有效的解决方法,期盼它既能大大减少参与数据分析、建模的变量个数,也同时不会造成信息的大量漏失。而因素分析正是这样一种能够有效降低变量维数(个数),并已得到广泛应用的分析方法。因素分析是由心理学家所发展出来的,最初心理学家借助因素分析模型来解释人类的行为和能力,1904年Charles Spearman在美国心理学杂志上发表了第一篇有关因素分析的文章,在往后的三四十年里,因素分析的理论和数学基础理论逐步获得发展和改善,也因此,这个统计分析工具逐渐被人们所认识和接受。50年代以来,随着计算机的普及和各种统计软件的出现,因素分析在社会学、经济学、医学、地质学、气象学和市场营销等越来越多的领域得到了应用。
因素分析以最少的信息漏失为前提,试图将众多的原始变量综合成较少几个综合指标,这些综合指标即名为因素(factor)。一般而言,因素具有以下几个特点:
■因素个数远少于原始变量的个数
原始变量综合成少数几个因素后,因素将可以替代原始变量参与数据建模,这将大大减少分析过程中的计算工作量。
■因素能够反映原始变量的绝大部分信息
因素并不是原始变量的简单取舍,而是原始变量重组后的结果,因此不会造成原始变量信息的大量遗失,并能够代表原始变量的绝大部分信息。
■因素之间的线性关系不显着
由原始变量重组出来的因素之间的线性关系较弱,因素参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。
■因素具有命名解释性
通常,因素分析产生的因素能够透过各种方式最终获得命名解释性。因素的命名解释性有助于对因素分析结果的解释评价,对因素的进一步应用有重要意义。例如,对高校科研情况的因素分析中,如果能够得到两个因素,且其中一个因素是对科研人力投入、经费投入、立项项目数等变量的综合,而另一个是对结项项目数、发表论文数、获奖成果数等变量的综合,那么,该因素分析就是较为理想的。因为这两个因素均有命名可解释性,其中一个反映了科研投入方面的情况,可命名为科研投入因素,另一个反映了科研产出方面的情况,可命名为科研产出因素。总之,因素分析是研究如何以最少的信息遗失将众多原始变量浓缩成少数几个因素,如何使因素具有一定