结构方程模型隐变量分析通径分析方差结构模型与
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一个或多个有依据的可能模型 (alternative models)
SEM 软件程序 (e.g., LISREL)
输入 Input
依据 S 及指定模型
找出与 S 相距最小的Σ S
输出 Output
Σ 、各路径参数(因子负荷loading、
因子相关系数factor correlations等) 各种拟合指数
– A = 0.50 – B = 0.33 – C = 0.53
例子 (4/4)
X1 HIV知识程度Fra bibliotekA 0.5
X2 HIV态度看法
B 0.33
Y 行为改变
C 0.53
▪ 检查模型的准确性
– 拟合优度指数(goodness of fit index),简称为拟合指数(fit index):
2 、NNFI、CFI
除方式选项是pairwise和listwise,然而这又是一对 普遍矛盾:pairwise式的删除虽然估计到尽量减少 数据的损失,但会导致协方差阵或者相关系数阵的 阶数n参差不齐从而为模型拟合带来巨大困难,甚 至导致无法得出参数估计;listwise不会有pairwise 的问题,因为凡是遇到case中有缺失值那么该case 直接被全部删除,但是又带来了数据信息量利用不 足的问题
应用条件
▪ 连续的正态内生变量(对于内生变量的分布, 理想情况是联合多元正态分布即JMVN)
▪ 模型可识别(识别方程)(比较有多少可用 的输入和有多少需估计的参数;模型不可识 别会带来参数估计的失败)
▪ 对不完整数据的适当处理
应用条件
▪ 完整的数据或者对不完整数据的适当处理 对于缺失值的处理,一般的统计软件给出的删
(exogenous)—— 内生变量是由方程系统决定的, 可以简单的理解为因变量,在方程“等号”的左边 (可以是潜变量也可以是显变量);外生变量不是由 方程系统确定,在可以理解为自变量,在方程“等号” 的右边(可以是潜变量也可以是显变量)。 ➢ 经典的估计方法不再适用(距法)
情景评价1 情景评价2 情景评价3
特性
▪ (一)SEM具有理论先验性 ▪ (二)SEM同时处理测量与分析问题 ▪ (三)SEM以协方差的运用为核心,亦可处理平均数估计
在SEM分析过程中最重要的数学程序,即是在产生模型导出共变矩 阵(S matrix)。如果研究者所设定的SEM模型有问题,或是资料估计 过程导致S matrix无法导出,整个SEM即无法完成。 除了协方差以外, SEM也可以处理变量的集中趋势的分析与比较,也就是平均数的检验。 传统上,平均数检验是以t检验或方差分析(ANOVA)来进行。由于 SEM可以对于截距进行估计,使得SEM可以将平均数差异的比较纳入分 析模型当中,同时若配合潜在变量的概念,SEM更可以估计潜在变量的 平均数,使得SEM的应用范围更为广泛。 ▪ (四)SEM适用于大样本之分析 ▪ (五)SEM包含了许多不同的统计技术 ▪ (六)SEM重视多重统计指针的运用
– df=[不重复元素non-duplicating elements, p(p+1)/2] – [估计参数estimated parameters]
– 在前面例子 df =9 x 10/2 – 21 = 24
应用条件
▪ 模型的说明和因果关系具有基本的理论基础
▪ 合理的样本量 (James Stevens的Applied Multivariate Statistics for the Social Sciences一书中说平均一个自变量大 约需15个case;Bentler and Chou (1987)说平均一 个估计参数需5个case就差不多,但前提是数据质 量非常好;而Loehlin (1992)在进行蒙特卡罗模拟之 后发现对于包含2~4个因子的模型,至少需100个 case,当然200更好;小样本量容易导致模型计算 时收敛的失败进而影响到参数估计;特别要注意的 是当数据质量不好比如不服从正态分布或者受到污 染时,更需要大的样本量。
CALIS/TCALIS
▪ 协方差结构分析的过程——CALIS (Covariance Analysis of Linear Structural Equations),该过程可广泛用于多变量线性 回归、路径分析和因果关系模型、各种线性 或非线性潜变量模型,它对于SEM的处理可 能不如AMOS或LISREL那样能直观输出因果 关系和路径图形,但是从程序语句上来说要 比前二者简单一些 。
▪ 目前,已经有多种软件可以处理SEM,包括: LISREL,AMOS, EQS, Mplus,SAS。
相关术语
▪ 线性结构方程(linear structural equations, LISREL )
▪ 通径分析(path analysis) ▪ 方差结构分析(analysis of covariance
举例
健康的看法
自报健康水平
身体功能1 身体功能2 真实健康水平
100名学生在9个不同学科间的相关系数(correlation coefficient matrix)
假定的模型(基于理论)
再生/隐含矩阵 (reproduced/implied matrix)
样本相关(或协方差)矩阵 correlation/covariance matrix
概况
▪ 结构方程模型(Structural Equation Modeling, SEM)
▪ 处理多个原因、多个结果的关系,或者会碰到不 可直接观测的变量(即潜变量),这些都是传统 的统计方法不能很好解决的问题。 20世纪80年 代以来,结构方程模型迅速发展,弥补了传统统 计方法的不足,成为多元数据分析的重要工具。
structures) ▪ 验证性因子分析( Confirmatory Factor
Analysis ,CFA)
▪ 隐变量分析模型Latent Variable Analysis
▪ 潜(隐)变量模型(Latent Variable Model)
➢ 潜变量/显变量( manifest) ➢ 内生变量(endogenous) /外生变量
例子 (1/4) HIV行为干预研究
X1
HIV知识程度
A
X2
HIV态度看法
B
Y
行为改变
C
A, B, C: 路径(path), 或因果 路径(causal path).
例子 (2/4)
▪ 相关系数矩阵
Variable X1
X2
Y
X1
1
X2
0.5
1
Y
0.6 0.7
1
例子 (3/4)
▪ 估计
– Corr(X1, X2) A = 0.50 – Corr(X1, Y) B + AC = 0.60 – Corr(X2, Y) C + AB = 0.70
SEM 软件程序 (e.g., LISREL)
输入 Input
依据 S 及指定模型
找出与 S 相距最小的Σ S
输出 Output
Σ 、各路径参数(因子负荷loading、
因子相关系数factor correlations等) 各种拟合指数
– A = 0.50 – B = 0.33 – C = 0.53
例子 (4/4)
X1 HIV知识程度Fra bibliotekA 0.5
X2 HIV态度看法
B 0.33
Y 行为改变
C 0.53
▪ 检查模型的准确性
– 拟合优度指数(goodness of fit index),简称为拟合指数(fit index):
2 、NNFI、CFI
除方式选项是pairwise和listwise,然而这又是一对 普遍矛盾:pairwise式的删除虽然估计到尽量减少 数据的损失,但会导致协方差阵或者相关系数阵的 阶数n参差不齐从而为模型拟合带来巨大困难,甚 至导致无法得出参数估计;listwise不会有pairwise 的问题,因为凡是遇到case中有缺失值那么该case 直接被全部删除,但是又带来了数据信息量利用不 足的问题
应用条件
▪ 连续的正态内生变量(对于内生变量的分布, 理想情况是联合多元正态分布即JMVN)
▪ 模型可识别(识别方程)(比较有多少可用 的输入和有多少需估计的参数;模型不可识 别会带来参数估计的失败)
▪ 对不完整数据的适当处理
应用条件
▪ 完整的数据或者对不完整数据的适当处理 对于缺失值的处理,一般的统计软件给出的删
(exogenous)—— 内生变量是由方程系统决定的, 可以简单的理解为因变量,在方程“等号”的左边 (可以是潜变量也可以是显变量);外生变量不是由 方程系统确定,在可以理解为自变量,在方程“等号” 的右边(可以是潜变量也可以是显变量)。 ➢ 经典的估计方法不再适用(距法)
情景评价1 情景评价2 情景评价3
特性
▪ (一)SEM具有理论先验性 ▪ (二)SEM同时处理测量与分析问题 ▪ (三)SEM以协方差的运用为核心,亦可处理平均数估计
在SEM分析过程中最重要的数学程序,即是在产生模型导出共变矩 阵(S matrix)。如果研究者所设定的SEM模型有问题,或是资料估计 过程导致S matrix无法导出,整个SEM即无法完成。 除了协方差以外, SEM也可以处理变量的集中趋势的分析与比较,也就是平均数的检验。 传统上,平均数检验是以t检验或方差分析(ANOVA)来进行。由于 SEM可以对于截距进行估计,使得SEM可以将平均数差异的比较纳入分 析模型当中,同时若配合潜在变量的概念,SEM更可以估计潜在变量的 平均数,使得SEM的应用范围更为广泛。 ▪ (四)SEM适用于大样本之分析 ▪ (五)SEM包含了许多不同的统计技术 ▪ (六)SEM重视多重统计指针的运用
– df=[不重复元素non-duplicating elements, p(p+1)/2] – [估计参数estimated parameters]
– 在前面例子 df =9 x 10/2 – 21 = 24
应用条件
▪ 模型的说明和因果关系具有基本的理论基础
▪ 合理的样本量 (James Stevens的Applied Multivariate Statistics for the Social Sciences一书中说平均一个自变量大 约需15个case;Bentler and Chou (1987)说平均一 个估计参数需5个case就差不多,但前提是数据质 量非常好;而Loehlin (1992)在进行蒙特卡罗模拟之 后发现对于包含2~4个因子的模型,至少需100个 case,当然200更好;小样本量容易导致模型计算 时收敛的失败进而影响到参数估计;特别要注意的 是当数据质量不好比如不服从正态分布或者受到污 染时,更需要大的样本量。
CALIS/TCALIS
▪ 协方差结构分析的过程——CALIS (Covariance Analysis of Linear Structural Equations),该过程可广泛用于多变量线性 回归、路径分析和因果关系模型、各种线性 或非线性潜变量模型,它对于SEM的处理可 能不如AMOS或LISREL那样能直观输出因果 关系和路径图形,但是从程序语句上来说要 比前二者简单一些 。
▪ 目前,已经有多种软件可以处理SEM,包括: LISREL,AMOS, EQS, Mplus,SAS。
相关术语
▪ 线性结构方程(linear structural equations, LISREL )
▪ 通径分析(path analysis) ▪ 方差结构分析(analysis of covariance
举例
健康的看法
自报健康水平
身体功能1 身体功能2 真实健康水平
100名学生在9个不同学科间的相关系数(correlation coefficient matrix)
假定的模型(基于理论)
再生/隐含矩阵 (reproduced/implied matrix)
样本相关(或协方差)矩阵 correlation/covariance matrix
概况
▪ 结构方程模型(Structural Equation Modeling, SEM)
▪ 处理多个原因、多个结果的关系,或者会碰到不 可直接观测的变量(即潜变量),这些都是传统 的统计方法不能很好解决的问题。 20世纪80年 代以来,结构方程模型迅速发展,弥补了传统统 计方法的不足,成为多元数据分析的重要工具。
structures) ▪ 验证性因子分析( Confirmatory Factor
Analysis ,CFA)
▪ 隐变量分析模型Latent Variable Analysis
▪ 潜(隐)变量模型(Latent Variable Model)
➢ 潜变量/显变量( manifest) ➢ 内生变量(endogenous) /外生变量
例子 (1/4) HIV行为干预研究
X1
HIV知识程度
A
X2
HIV态度看法
B
Y
行为改变
C
A, B, C: 路径(path), 或因果 路径(causal path).
例子 (2/4)
▪ 相关系数矩阵
Variable X1
X2
Y
X1
1
X2
0.5
1
Y
0.6 0.7
1
例子 (3/4)
▪ 估计
– Corr(X1, X2) A = 0.50 – Corr(X1, Y) B + AC = 0.60 – Corr(X2, Y) C + AB = 0.70