第7讲 探索性因子分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X2
X3
(b) 潜在变量模型
三个相关系数可以 1 、2 、 3 表示,亦 即 12 1 • 2 、 23 2 • 3、13 1 • 3。在不同
的数学算则与限定条件下,可以求得前述方程
中 12 、23 、13 的 1 、 2 、3 三个系数的最
佳解,此即因子分析所得到的参数估计结果。估计 得出的共同部分F则称为公因子(common factor),此因子模式建立后,研究者即可利用F的 估计分数来代表观察变量,达到资料简化的目的。
表3 KMO统计量的判断原理
KMO统计量 .90以上 .80以上 .70以上 .60以上 .50以上
.50以下
因子分析适切性 判别说明
极佳的(Perfect) 极适合进行因子分析(Marvelous)
良好的(Meritorious) 适合进行因子分析(Meritorious)
适中的(Middling) 尚可进行因子分析(Middling)
(四)几个重要指标的计算
在因子分析中,涉及几个重要指标的计算:共同性、 特征值和解释量。这里以三个变量抽取两个公共因 子为例,三个变量的线性组合为:
V1 11F1 12F 2 U1
V 2 21F1 22F2 U 2
V 3 31F1 32F2 U 3
表2 共同性、特征值与解释量的计算
变量
2. 巴特利特球体检验(Bartlett test of sphericity)
巴特利特球体检验的目的在于检验零假设(null hypothesis)“相关矩阵是一个单位矩阵”和备择 假设“相关矩阵不是一个单位矩阵”何者成立。若 检验结果的Sig. 值<0.05,就要拒绝零假设而接受 备择假设,表示该相关矩阵不是单位矩阵,代表总 体的相关矩阵间有公共因子存在,适合进行因子分 析。如检验结果的Sig. 值≥0.05,就要接受零假设, 表示相关矩阵是单位矩阵,数据就不适宜进行因子 分析。
独特因子有两个假定:
(1)所有的独特因子间互不相关;
(2)所有的独特因子与所有的公共因子间也不相关。
而公共因子间则可能彼此相关,也可能不存在相关。 如在直交转轴状态下,所有的公共因子间彼此没有 相关;而在斜交转轴的情况下,所有的公共因子彼 此间就有相关。
潜在变量的一个重要统计原则是局部独立性原则 (principal of local independence)。如果一组 观察变量背后确实存在潜在变量,当统计模型正确 确定了潜在变量后,各观察变量之间所具有的相关 就会消失,即具有统计独立性。如果观察变量的剩 余方差中仍带有相关,那么局部独立性即不成立, 此时因子分析所得到的结果并不适切。
25 饮食场所的质量 (Quality of eating and drinking places)
26 天气条件 (Weather conditions)
27 旅游信息的充分性 (Adequacy of tourism information)
28 宾馆/汽车旅馆的拥有 (Availability of hotels/motels)
(二) 因子与共变结构
因子分析所处理的材料是观察变量之间的共变,亦 即利用数学原理来抽离一组观察变量之间的公共变 异成分,然后利用这个公共变异成分来反推这些变 量与此一公共部分的关系。
如有一组观察变量,以X表示,第i与第j个观察变量
间具有相关 ij ,从因子分析模型的观点来看,ij系 指两者的公共部分,此一公共部分可以系数 i 和 j (因子载荷量factor loading)来表示,于是有
表1 美国马萨诸塞州科德角游客满意度评价指标
变量(Variable)
度假区的交通条件 (Traffic condition in resort area) 商业化程度 (Extent of commercialization) 一般商品和服务的费用 (Cost of general goods and services) 度假的费用 (Cost of vacationing) 服务和商品价格收费的公平性 (Fairness of the services and goods for the price charges) 拥有露营地 (Availability of campgrounds) 拥有海滩停车场所 (Availability of parking spaces for the beaches) 露营地设施的质量 (Quality of facilities at campgrounds) 居民帮助游客的意愿 (Willingness of residents to aid tourists) 居民对游客的接待 (General hospitality of residents towards tourists) 居民对游客的礼貌 (Courtesy of residents towards the tourists) 度假区的易达性 (Ease of access to the resort area) 海滩上设施的质量 (Quality of facilities at beaches) 公路方向标志的充足性 (Adequacy of directional signs on highways) 当地居民的一般友好程度 (General friendliness of the people in the area) 宾馆/汽车旅馆的服务质量 (Quality of service in hotels/motels)
因子分析对于潜在变量的定义与估计,有一个重要
的方法学原则,称为简约原则(principle of parsimony)。简约有结构简约和模型简约双重涵 义,前者指观察变量与潜在变量之间具有最简化的 结构特性,后者指最简单的模型应被视为最佳模型。 测验所得的最佳化因子结构,称之为简化结构 (simple structure),是因子分析的最重要的基 本原则。
22 饮食场所的服务质量 (Quality of service in eating and drinking places)
23 购物设施的拥有及其质量 (Availability and quality of Baidu Nhomakorabeahopping facilities)
24 海滩区域的清洁程度 (Cleanliness of the beach area)
▪ 三、因子分析的几个关键问题
(一)使用因子分析的可能性
并非所有的多变量数据均适合采用因子分析方法。 SPSS软件提供4个统计量来判断观测数据是否适 合进行因子分析。
1. KMO检验(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)
KMO是Kaiser-Meyer-Olkin的取样适当性量数, 其值变化于0~1之间。KMO值越接近于1,表示 变量间的公共因子越多,变量间的偏相关 (partial correlation)系数越低,越适合进行因 子分析;当KMO系数过小时,表示变量偶对之间 的相关不能被其他变量解释,进行因子分析不适 合。
资料来源:Pizam, Neumann, and Reichel(1978).
探索性因子分析的目的在于找出量表的潜在结构, 减少题项的数目,使之变为一组较少而彼此相关较 大的变量。因而探索性因子分析是一种资料推导的 分析。
如果一个量表层面及所包含的题项已非常明确,使 用者为再确认该量表各层面及所包含的题项是否如 原先使用者所预期的,需要采用一定的方法加以验 证,以探究量表的因素结构是否能与抽样样本适配, 此种因子分析称为验证性因子分析。因而验证性因 子分析是一种理论推导的分析。
ij i • j
以三个观察变量( X1、X 2、X 3)为例,在两两之
间具有相关的情况下,可以计算出三个相关系数
(12 、23、13 ),如图(a)所示。
这三个观察变量的公共变异部分,可以F来表示, 其与三个观察变量的关系可以图(b)表示
13
12
23
X1
X2
X3
(a) 相关模型
F
1
2
3
X1
一、基本概念 二、基本原理 三、EFA分析的几个关键问题 四、EFA分析的操作程序 五、实际调查案例剖析
▪ 一、基本概念
因子分析(factor analysis),也称因素分析,可 分为探索性因子分析(Exploratory Factor Analysis,EFA)和验证性因子分析 (Confirmatory Factor Analysis,CFA)两种。
V1 V2 V3 特征值 解释量
F1(公共因子一)
11 21
31
2 11
2 21
2 31
(121
2 21
2 31
)
3
F2(公共因子二)
12 22 32
2 12
2 22
2 32
(122
2 22
2 32
)
3
共同性C 特殊因子U
2 11
2 12
2 21
2 22
2 31
2 32
1 C1 1C2 1 C3
29 环境质量 (Quality of the environment)
30 拥有海滩 (Availability of beaches)
31 餐馆、咖啡厅和酒吧的拥有 (Availability of restaurants, cafeterias and bars)
32 风景与自然景观 (Scenery and natural attraction)
(三) 因子分析方程式
因子分析的一般数学模型可以表达为:
Zj j1F1 j2F 2 j3F3 jmFm Uj
式中,Zj 代表第j个变量的标准化分数;Fi 为第i个公 共因子;m为所有变量公共因子的数目;Uj 为变量
Zj 的特殊因子;ji为因子载荷量(factor
loading),表示第i个公共因子对第j个变量的方差 贡献。
在旅游研究领域,有许多涉及心理学方面的抽象概 念,如游客的动机和满意度、景区所在地居民对旅 游影响的感知等均很难用单一指标来表述,通常研 究者们会通过构建繁杂的指标体系来进行测量。
如何将上述繁杂的指标体系缩减为较少数量具有代 表性意义的公共评价因子,就需要借助探索性因子 分析方法。
序号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
目前探索性因子分析方法在旅游研究领域的应用相 对较广,因而这里仅讨论探索性因子分析。
▪ 二、基本原理
(一) 潜在变量模型与基本原则
因子分析所得到的潜在变量,就是社会科学中所谓 的抽象构念,因而因子模型又被称为潜在变量模型 (latent variable model)。
因子分析是一种潜在结构分析法,其假定每个变量 (在量表中称为题项)均由两个部分所构成,一为 公共因子(common factor),一为独特因子 (unique factor)。公共因子的数目会比指标(原 始题项)数少,而每个指标皆有一个独特因子,如 果一个量表共有n个题项数,则也会有n个独特因子。
19 海滩上的可用空间 (Availability of space on the beach)
20
旅游设施的员工帮助游客的意愿 (Willingness of the employees of tourist facilities to aid tourists)
21 宾馆/汽车旅馆提供设施的质量 (Quality of facilities offered at hotels/motels)
17 旅游设施员工的一般友好程度 (General friendliness of the employees of tourist facilities)
18
旅游设施的员工对游客的礼貌 (Courtesy of employees of tourist facilities towards tourists)
普通的(Mediocre) 勉强可进行因子分析(Mediocre)
欠佳的(Miserable) 不适合进行因子分析(Miserable)
无法接受的
非常不适合进行因子分析
(Unacceptable) (Unacceptable)
资料来源:Kaiser (1974)
根据Kaiser(1974)的观点,当KMO的值小于0.50时, 较不宜进行因子分析,KMO的值至少要在0.60以上, 才可以进行因子分析。