结构方程模型(SEM)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SEM与回归分析的区别
与传统的回归分析不同,结构方程分析能 同时处理多个因变量. 同时,回归分析假设自变量为确定,非随 机的,即自变量是没有测量误差的,而 SEM却没有这样的严格假设. 若各因子可以直接测量(因子本身就是指 标),则结构方程模型就是回归分析.
SEM与传统因子分析的不同
若不考虑因子间的因果关系,即没有结构 模型这部分,则结构方程模型就是传统的 探索性因子分析. 与传统的探索性因子分析不同,在结构方 程模型中,我们可提出一个特定的因子结 构,并检验它是否吻合数据(即验证性因 子分析).
SEM的来源
从统计学与方法学的发展脉络来看,结构 方程模式并不是一个崭新的技术,而是因 子分析(factor analysis)与路径分析(path analysis)两种在社会与行为科学非常重要 的统计技术的结合体.相对于这两大分析 技术的发展轨迹,Kaplan(2000)指出 SEM的历史根源系来自两个重要的计量学 科:心理计量学与经济计量学,这两个学 术领域对于SEM的发展有着重要的影响.
结构方程模型(SEM)
重庆大学经管学院 闫 威
什么是SEM
结构方程模型(Structural Equation Modeling,简 称SEM)是一门基于统计分析技术的研究方法学 (statistical methodology),用以处理复杂的多变 量研究数据的探究与分析. 在社会科学以及经济,管理,市场等研究领域, 有时需要处理多个原因,多个结果的关系,或者 会碰到不可直接观测的变量(即潜变量),这些 都是传统的统计方法不好解决的问题.20世纪80 年代以来,结构方程分析迅速发展,弥补了传统 统计方法的不足,成为多元统计分析的重要工具.
SEM分析的基本步骤
(概念)模型发展
理论性发展:以理论为基础,经过观念的厘清, 文献整理与推导,或是研究假设的发展等理论 性的辩证与演绎过程,最终提出一套有待检证 的假设模型. 模型设定:发展可供SEM进行检验与估计的 变量关系与假设模型.模型设定的具体产品, 是建立一个SEM路径图. 模型识别:只有在模型符合统计分析与软件执 行的要求,也就是在能够被有效识别的情况下, SEM分析才能顺利进行.
SEM分析的基本步骤
模型估计修正
抽样与测量 参数估计 拟合检查 模型修正 讨论与结论
A review of Steps in SEM
Step 1: Developing a theoretically based model (基于 理论提出一个或多个基本模型) Step 2: Constructing a path diagram of causal relationships Step 3: Converting the path diagram into a set of structural equations and specifying the measurement model Step 4: Estimating the proposed model Step 5: Evaluating goodness-of-fit (拟合程度) criteria Step 6: Interpreting and modifying the model
期刊与论文:
专门期刊:《结构方程模型》(Structural Equation Modeling ) 论文:见诸于国内外许多一流期刊
SEM概述
很多社会,心理等变量,均不能准确地及直接地 量度,这包括智力,社会阶层,学习动机等,我 们只好退而求其次,用一些外显指标(observable indicators),去反映这些潜变量. 例如:我们以学生父母教育程度,父母职业及其 收入(共六个外显变量),作为学生家庭社会经济 地位(潜变量)的指标,我们又以学生中,英,数 三科成绩(三个外显变量),作为学业成就(潜变量) 的指标.
SEM的来源
经济计量学:
Haavelmo在1943年利用一系列的联立方程式 (simultaneous equation)来探讨经济学变量的 相互关系 ,是为经济计量学中的联立方程模 型. 联立方程模型分析虽然可以用来探讨复杂变量 的关系,对于总体经济现象的解释有其效力, 但是它所遭到的最大批评在于无法针对特定的 经济现象进行精确有效的时间序列性预测.
SEM发展历史
从发展历史来看,结构方程模式的起源甚早,但其核心 概念在1970年代初期才被相关学者专家提出,到了1980 年代末期即有快速的发展.基本上,结构方程模式的概 念与70年代主要高等统计技术的发展(如因素分析)有 着相当密切的关系,随着计算机的普及与功能的不断提 升,一些学者(如Jreskog, 1973; Keesing, 1972; Wiley, 1973)将因子分析,路径分析等统计概念整合,结合计 算机的分析技术,提出了结构方程模型的初步概念,可 以说是结构方程模型的先驱者.而后Jreskog与其同事 Srbom进一步发展矩阵模式的分析技术来处理共变结构 的分析问题,提出测量模型与结构模型的概念,并纳入 其LISREL之中,积极促成了结构方程模式的发展.
为什么要采用SEM
差不多所有心理,教育,社会研究中涉及的变量 (如智力,学习动机,家庭社会经济地位)均难 以直接准确测量(latent variable),我们只好退而 求其次,用一些外显指标(observable indicators)去 间接地测量这些潜变量.结构方ห้องสมุดไป่ตู้模型能同时处 理潜变量及其指标. SEM提供一个处理(自变量)测量误差的方法, 采用多个指标去反映潜变量,也令估计整个模型 因子间关系,较传统回归方法更为准确合理. 结构方程模型可用以比较不同的模型(拟合优 度).
探索性因子分析 VS. 验证性因子分析
不同点:
基本思想的差异:是否利用了先验信息?探索 性因子分析主要是为了找出影响观测变量的因 子个数,以及各个因子和各个观测变量之间的 相关程度;而验证性因子分析的主要目的是决 定事前定义因子的模型拟合实际数据的能力. 验证性因子分析要求事先假设因子结构,我们 要做的是检验它是否与观测数据一致.
验证性因子分析是结构方程模型中的一项基本而重要的内容.
SEM优点
同时处理多个因变量 容许自变量与因变量含测量误差 同时估计因子结构和因子关系 容许更大弹性的测量模型
SEM应用的主要类型
Jreskog & Srbom(1996)指出SEM的模块化应用策略 有三个层次,第一是单纯的验证(confirmatory),也就 是针对单一的先验假设模型,评估其适切性,称为验证 型研究;第二是模型的产生(model generation),其程 序是先设定一个起始模型,在与实际观察数据进行比较 之后,进行必要的修正,反复进行估计的程序以得到最 佳契合的模型,称为产生型研究;第三是替代模型的竞 争比较,以决定何者最能反应真实资料,称为竞争型研 究. Maccallum & Austin(2000)从文献整理中发现,以单纯 的验证与模型产生为目的SEM研究约占20%与25%,涉及 竞争比较的SEM研究则有55%.
SEM的特点
理论先验性 同时处理测量与分析问题 以协方差的应用为核心 适用大样本分析
SEM基本模型
简单来说,SEM可分测量方程 (measurement equation)和结构方程 (structural equation)两部分. 测量方程描述潜变量与指标之间的关系, 如家庭收入指标等社会经济地位的关系, 三科成绩与学业成就的关系.而结构方程 则描述潜变量之间的关系,如社会经济地 位与学业成就的关系.
SEM基本模型
测量模型:对于指标与潜变量(例如六个社会经 济指标与社会经济地位)间的关系,通常写成如下 测量方程: x=∧xξ+δ y=∧yη+ε
x,y是外源(如六项社经指标)及内生(如中,英,数成 绩)指标.δ,ε是X,Y测量上的误差. ∧x是x指标与ξ潜变量的关系(如六项社会经济地位指标 与潜社会经济地位的关系).∧y是y指标与η潜变量的关 系(如中,英,数成绩与学业成就间关系).
SEM发展现状
软件包:
LISREL(Jreskog & Srbom, 1989, 1996) AMOS(Arbuckle,1997) EQS(Bentler,1985,1995) MPLUS Muthén MPLUS(Muthén & Muthén, 1998) 1998 CALIS(Hartmann,1992) RAMONA(Browne,Mels,& Cowan,1994)等 .
探索性因子分析是在一张白纸上作图, 而验证性因子分析是在一张有框架的图上完善和修改.
探索性因子分析 VS. 验证性因子分析
不同点:
分析方法的差异
探索性因子分析——传统因子分析(管理统计中已 讲).主要步骤包括:收集观测变量,获得协方差 矩阵(或相关系数矩阵) ,提取因子 ,因子旋转 , 解释因子结构 ,计算因子得分 . 验证性因子分析.主要步骤包括:定义因子模型 (选择因子个数和定义因子载荷 ) ,收集观测值 , 获得相关系数矩阵,根据数据拟合模型,评价模型 是否恰当,与其他模型比较 .
sem的来源haavelmo在1943年利用一系列的联立方程式simultaneousequation来探讨经济学变量的相互关系是为经济计量学中的联立方程模联立方程模型分析虽然可以用来探讨复杂变量的关系对于总体经济现象的解释有其效力但是它所遭到的最大批评在于无法针对特定的经济现象进行精确有效的时间序列性预测
Measurement Model
测量模型
φ12
ξ1
ξ2
λ11 X1 δ1
λ21 X2 δ2
λ31 X3 δ3
λ41 X4 δ4
λ52 X5 δ5
λ62 X6 δ6
λ72 X7 δ7
λ82 X8 δ8
SEM路径图常用图标的含义
圆或椭圆表示潜变量或 因子 正方形或长方形表示观 测变量或指标 单向肩头表示单向影响 或效应 双向弧形箭头表示相关 单向箭头指向因子表示 内生潜变量未被解释的 部分(即残差项) 单向箭头指向指标表示 测量误差
SEM的来源
心理计量学:
Spearman认为,人类心智能力测验得分之间的相互关 系,可以被视为是由这些分数背后所具有的一个潜的 共同因素(common factor)的影响结果. Thurston认为,在复杂的智力测量背后,应该存在着 不同且独立的一组共同因素,他称之为核心心智能力 (primary mental abilities),由于这一组共同因素的存 在,构成了智力测验得分的复杂关系.研究者必须找 出这些因素,才能利用此一因素结构来对智力测验得 分之间的共变(协方差)关系,得到最理想的解释, 得出最大的解释力.
ξ1
η1 β21
η2
λ52 y5 ε5
λ62 y6 ε6
λ72 y7 ε7
λ82 y8 ε8
SEM分析的基本步骤
SEM分析的基本步骤可以分为(概念)模型发展 与模型估计修正两个阶段. 前者在发展SEM分析的原理基础并使SEM模型符 合特定的技术要求,此时研究者的主要工作在概 念推导与SEM分析的技术原理的考虑. 后者则是产生SEM的计量数据来评估SEM模型的 优劣好坏,并进行适当或必要的修正,此时所着 重的是分析工具与统计软件(例如LISREL,EQS, AMOS,MPLUS等)的操作与应用.
SEM基本模型
结构模型:指标(外显变量)含有随机(或系统)性的测量误 差,但潜变量则不含这些部份.SEM可用以下结构方程 表示潜变量之间的关系(例如社会经济地位与学业成就 的关系): η=Bη+Γξ+ζ η——内生(依变)潜变量(如学业成就) ξ——外源(自变)潜变量(如社会经济地位) B——内生潜变量间的关系(如学业成绩与其他内生潜变 量的关系) г——外源潜变量对内生潜变量的影响(如社会经济地位对 学业成就的影响) ζ——结构方程的残差项,反映了η在方程中未能被解释 的部分.
探索性因子分析 VS. 验证性因子分析
相同点:两种因子分析都是以普通因子模 型为基础的.因子分析的基本思想是通过 变量的相关系数矩阵内部结构的研究,找 出能控制所有变量的少数几个随机变量去 描述多个变量之间的相关关系,但在这里, 这少数几个随机变量是不可观测的,通常 称为因子.然后根据相关性的大小把变量 分组,使得同组内的变量之间相关性较高, 但不同组的变量相关性较低.
潜变量之间的关系,即结构模型,通常是研究的重点.
Path Model
结构模型
X1
γ11 γ12
ζ1
β31
Y1
γ 32
Y3
ζ3
X2
β21
β32
Y2
γ13
X3
γ 23
ζ2
SEM Full Model
全模型
δ1 X1 δ2 X2 λ11 λ21 δ3 X3 λ31 δ4 X4 λ41 γ11 γ21 ε1 y1 ε2 y2 λ11 λ21 ε3 y3 λ31 λ41 ε4 y4