[电脑基础知识]spss多水平模型简介
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
层次结构数据为一种非独立数据,即某观察 值在观察单位间或同一观察单位的各次观察间不 独立或不完全独立,其大小常用组内相关(intraclass correlation,ICC)度量。
例如,来自同一家庭的子女,其生理和心理 特征较从一般总体中随机抽取的个体趋向于更为 相似,即子女特征在家庭中具有相似性或聚集性 (clustering),数据是非独立的(non independent)。
多水平模型简介
四川大学华西公共卫生学院 卫生统计学教研室 李晓松
概述 层次结构数据的普遍性 经典方法及其局限性 基本多水平模型 多水平模型的应用
概述
80 年代中后期,英美等国教育统计学家开始探 讨分析层次结构数据(hierarchically structured data) 的统计方法,并相继提出不同的模型理论和算法。
聚合:损失大量水平1单位的信息,更严重的 是可能导致“生态学谬误”(ecological fallacy)。
组内-组间分析:
每个水平2单位内进行分析,计算组内相关(组内效应); 通过平均或整合得到每个水平2单位的数据,计算组间
相关(组间效应); 忽略水平2的存在,在水平1上进行分析,计算水平1单
Anthony Bryk, University of Chicago Stephen Raudenbush, Michigan State University , Department of Educational Psychology
《Hierarchical Linear Models: Applications and
“单位” (unit) :指数据层次结构中某水平上 的一个实体。例如,每个子女是一个水平 1 单位, 每个家庭是一个水平 2 单位。
临床试验和动物实验的重复测量 多中心临床试验研究 纵向观测如儿童生长发育研究 流行病学现场调查如整群抽样调查 遗传学家系调查资料 meta 分析资料
Data Analysis Methods》1992
Nicholas Longford, Princeton University, Education Testing Service 《Random Coefficient Models》1993
多水平主成分分析 多水平因子分析 多水平判别分析 多水平logistic回归 多水平Cox模型 多水平Poisson回归 多水平时间序列分析 多元多水平模型 多水平结构方程模型
经典方法框架下的分析策略
经典的线性模型只对某一层数据的问题进行 分析,而不能将涉及两层或多层数据的问题进行 综合分析。
但有时某个现象既受到水平1变量的影响, 又受到水平2变量的影响,还受到两个水平变量 的交互影响(cross-level interaction)。
个体的某事件既受到其自身特征的影响,也 受到其生活环境的影响,即既有个体效应,也有 环境或背景效应(context effect)。
基本的多水平模型
经典模型的基本假定是单一水平和单一的随 机误差项,并假定随机误差项独立、服从方差为 常量的正态分布,代表不能用模型解释的残留的 随机成份。
当数据存在层次结构时,随机误差项则不满足 独立常方差的假定。模型的误差项不仅包含了模型 不能解释的反应变量的残差成份,也包含了高水平 单位自身对反应变量的效应成份。
例如,个体发生某种牙病的危险可能与个体 的遗传倾向、个体所属的社会阶层(如饮食文化和 口腔卫生习惯)、环境因素(如饮水中氟浓度)等有 关。
分解(disaggregation) 聚合(aggregation) 组内-组间分析(within-between analysis)
分解:不满足模型独立常方差的基本假定, 回归系数及其标准误的估计无效,且未能区分个 体效应与背景效应。一种分析策略是用哑变量拟 合高水平单位的固定效应。
✓ ML3 (1994) / MLN (1996) / MLwiN (1999)
✓ HLM (Hierarchical Linear Model)
SAS (Mixed) SPSS (HLM) STATA (MLwiN)
来自百度文库
层次结构数据的普遍性
水平2 水平1
两水平层次结构数据
“水平” (level) :指数据层次结构中的某一层 次。例如,子女为低水平即水平 1 ,家庭为高水 平即水平 2 。
多水平模型将单一的随机误差项分解到与数 据层次结构相应的各水平上,具有多个随机误差 项并估计相应的残差方差及协方差。构建与数据 层次结构相适应的复杂误差结构,这是多水平模 型区别于经典模型的最主要特征。
多水平模型(multilevel models)最先应用于教育 学领域,后用于心理学、社会学、经济学、组织行 为与管理科学等领域,逐步应用到医学及公共卫生 等领域。
Harvey Goldstein, UK, University of London, Institute of Education
《Multilevel Models in Educational and Social Research》1987
非独立数据不满足经典方法的独立性条件, 采用经典方法可能失去参数估计的有效性并导致 不合理的推断结论。
但非独立数据的组内相关结构各异,理论上, 不同的结构应采用相应的统计方法。如纵向观测 数据常用广义估计方程(GEE),但有两个局限性: 一是对误差方差的分解仅局限于2水平的情形, 二是没有考虑解释变量对误差方差的影响。当应 变量的协差阵为分块对角阵时,一般采用多水平 模型。
位间的相关(总效应)。
组内相关系数(intra-class correlation, ICC)被当作是 总结多层次数据内部相关的最终统计量,但并没有对误 差方差进行解释。
多水平分析的概念为人们提供了这样一个框架,即 可将个体的结局联系到个体特征以及个体所在环境或背 景特征进行分析,从而实现研究的事物与其所在背景的 统一。