多层线性模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0 j 00 01W j 0 j 1 j 10 11W j 1 j
多层线性模型简介
4、多层线性模型的优点 (1)使用收缩估计的参数估计方法,使得估计结 果更为稳定、精确 收缩估计:使用两个估计的加权综合作为最后的估 计。其一是来自第一层数据的OLS估计,另一个是 来自第二层数据的加权最小二乘法估计,最后的估 计是对以上两个估计的加权。 (2)可以处理样本不等的数据 eg:当某些第二层单位在第一层的取样甚少时,可以 借助于其他二层单位和二层预测变量,对取样较少 的一层单位进行回归分析。第一层单位3个及以上。
多层线性模型——完整模型
在第一层方程中,0代表截距,1代表斜率 在第二层方程中,第一个下标代表第一层参 数的类型;第二个下标代表第二层参数的类 型。 β 0j和β 1j的预测变量可以相同,也可以不同。
多层线性模型——协方差模型
在零模型与完整模型之间,可通过向各层方 程中增加不同的变量,设定不同的随机成分 与固定成分来建构各种分析模型。 协方差模型(ANCOVA Model) _ 第一层: Y x x e
层次结构数据的普遍性
水平2
水平1
两水平层次结构数据
层次结构数据为一种非独立数据,即某观察值 在观察单位间(或同一观察单位的各次观察间) 不独立或不完全独立,其大小常用组内相关(intraclass correlation,ICC)度量。 例如,来自同一家庭的子女,其生理和心理 特征较从一般总体中随机抽取的个体趋向于更为 相似,即子女特征在家庭中具有相似性,数据是 非独立的。
多层线性模型简介
Hierarchical Linear Model (HLM)
主要内容
一、多层线性模型简介
二、多层线性模型基本原理
三、多层线性模型HLM软件的应用
多层线性模型简介
1、多层数据结构的普遍性 多层(多水平)数据指的是观测数据在单位上具有 嵌套的关系。 (1)教育研究领域 EG:学生镶嵌于班级,班级镶嵌于学校,或者学生 简单地镶嵌于学校,这时学生代表了数据结构的第 一层,而班级或学校代表的是数据结构的第二层; 如果数据是学生镶嵌于班级,而班级又是镶嵌于学 校,那么就是三层数据结构。
多层线性模型简介
(2)组织心理学研究领域 Eg:雇员镶嵌于不同的组织、工厂 (3)发展心理学领域 Eg:纵向研究、重复研究 在一段时间内对儿童进行多次观察,那么不同时间 的观测数据形成了数据结构的第一层,而儿童之间 的个体差异则形成了数据结构的第二层。这样,就 可以探索个体在其发展趋势或发展曲线上的差异。
HLM数学模型
例如:对73个学校1905名学生进行调查,目 的是考虑其刚上高中时的入学成绩与三年后 高考成绩之间的关系。 考虑方法: (1)如果用传统的线性回归分析,直接在学生 水平上进行分析,得出入学学业成绩对高考 成绩之间的一条回归直线,如下图1所示,从 图1的结果可以看出,传统回归分析没有区分 不同的学校之间的差异。
00
eij指第j个二层单位Y的变异
指所有二层单位的Y的总体平均数 0 j 指第二层方程的残差(随机项) 跨级相关:指Y的总体变异中有多大比例是由 第二层的变异引起的。
00 / 00
2
多层线性模型——完整模型
完整模型(The Full Model) 既包含了第一层的预测变量,又包含了第二层的 预测变量,可通过理论建构来说明解释Y的总体 变异是怎样受第一层和第二层因素的影响。 第一层: Y X e
图1:不考虑学校之间差异的回归直线
HLM数学模型
(2)如果将数据进行简单合并,用每个学校 学生的平均成绩代替这个学校的成绩,直接 在学校水平上估计入学成绩对高考成绩的影 响,得到一条回归直线,如图2所示,这种方 法忽略了不同学生(个体)之间的差异;
来自百度文库
图2:只考虑学校差异忽略学生差异回归直线
HLM数学模型
多层线性模型简介
3、多层线性模型分析方法 回归的回归方法 Eg:学生成绩(X) 学习动机(Y) 班级教师教学水平(W) (1)求各个班级学生成绩对学习动机的回归
Yij 0 j 1j X i j rij
多层线性模型简介
(2)求教师教学水平对β 0j和 β
1j
的回归方程
多层线性模型——零模型
第一层:
Yij 0 j eij
var(eij )
2
第二层:
0 j 00 u0 j
00 uoj eij
var(0 j ) 00
合并模型: Yij
多层线性模型——零模型
0 j指第j个二层单位Y的平均值
违背了传统回归( OLS)中关于残差相互 独立的假设 采用经典方法可能失去参数估计的有效性 并导致不合理的推断结论。
经典方法框架下的分析策略
经典的线性模型只对某一层数据的问题进行 分析,而不能将涉及两层或多层数据的问题进行 综合分析。 但有时某个现象既受到水平 1变量的影响, 又受到水平 2 变量的影响,还受到两个水平变量 的交互影响(cross-level interaction)。
指固定成分
Yij---第j个 学校的第i 个学生
0j
00
u0 j
随机成分
1 j 10
u1 j
多层线性模型基本原理
00和 10
为固定成分,指第二层单位间β 0j 和 β 1j 的平均值 0 j 和1 j 为随机成分,指第二层单位β 0j 和 β 1j 的变异
var(0 j ) 00
var(1 j ) 11
cov(0 j , 1 j ) 10
多层线性模型基本原理
把第一层和第二层方程整合如下:
Yij 00 10 xij 0 j 1 j xij eij
残差项
误差项间是相关的:同一第二层单位的个体 有相同的 0 j 和1 j 误差项间方差不等:相同第二层单位内的个 体间相似性比不同单位内个体相似性高 误差项与自变量有关:残差项包含 xij
图4:考虑不同学校平均成绩差异 和入学对毕业成绩影响程 度差异的回归直线
在许多研究中,取样往往来自不同层级和单位,这 种数据带来了很多跨级(多层)的研究问题,解决 这些问题的一种新的数据分析方法——多层模型分 析技术。 这一方法的开创及发展的主要贡献者之一是英国伦 敦大学的Harvey Goldstein教授及研究者把这种方 法称作“多层分析”。另一主要开拓者美国密歇根 大学的Stephen W.Raudenbush教授和同行把它称为 “分层线性模型结构”。在此,我们按照张雷等人 的叫法称其为“多层线性模型”或“多层模型”。
Time:一般用编码的形式来反映增量 Eg: 0、1、2、3、4、5 -5、-4、-3、-2、-1、0 线性发展模型的第一层方程并不一定为线性方程,也可以 为非线性方程。 Eg:
多层线性模型简介
(3)组内分析组间分析
对相同的数据进行三次计算: 一是在组内的个体层上进行的分析,称为组内效应 二是通过平均或整合第一层中的个体数据,得到第二层的组 间数据,称为组间效应 三是忽视组的特性而对所有的数据进行分析,称为总效应。 在此基础上,计算组内效应和组间效应在总效应的比例,从 而确定变异来自于组间还是组内。 组内分析组间分析的方法较前两种方法更多地考虑到了第一 层数据及第二层数据对变异产生的影响,但无法对组内效应 和组间效应做出具体的解释,也就无法解释为什么在不同的 组变量间的关系存在差异。
ij 0j 1j
ij
ij
第二层: 0 j 00 u 0 j 1 j 10
多层线性模型——协方差模型
第一层方程中,预测变量采用总体平均数为参 照的离差,与传统协方差分析的区别是β 0j被 进一步分解为 00和 0 j β 1j没有随机项,反映了协方差分析的一个重 要前提,协变量对因变量的回归系数的组间一 致性。检验这种假设的方法是把 1 j 纳入到方 程中,并检验 11 0 是否成立。
个体的某事件既受到其自身特征的影响,也受 到其生活环境的影响,即既有个体效应,也有环 境或背景效应(context effect)。 例如,学生(个体)的学习成绩与学生的勤 奋程度有关,还与学校的师资配备有关。 企业的创新能力与企业自身的创新投入、学 习能力有关,还与企业所属产业的 R&D 强度有关。
多层线性模型简介
5、多层线性模型的应用范围 (1)组织和管理研究 (2)对个体进行追踪、多次观测的发展研究 (3)教育研究 (4)元分析研究
多层线性模型基本原理
1、多层线性模型的基本形式
水平1(如:学生)
Yij 0 j 1 j X ij eij
水平2(如:学校)
多层线性模型——发展模型
发展模型 发展模型是把多次观测结果作为时间的某种 数学函数来建构模型。它多用于发展研究、 纵向研究或者追踪研究。 在这种模型中,第一层数据为不同时间的观 察结果,第二层数据为个体的特征。
多层线性模型——发展模型
第一层:线性发展模型
Yij 0 j 1 j TIME eij
多层线性模型——随机效应回归模型
随机效应回归模型(Radom Eeffect Regression Model) 第一层: Y X e
ij 0j 1j ij ij
第二层:
0j
00
u0 j
1 j 10
u1 j
多层线性模型——随机效应回归模型
此模型与完整模型的区别在于第二层没有预 测变量;与传统OLS回归区别在于第一层的 β 0j和β 1j是随机的而非固定的,其目的是寻 找第一层的截距、斜率在第二层单位上的变 异。
多层线性模型简介
2、多层数据的传统分析方法 个体的行为既受个体自身特征的影响,也受 到其所处环境的影响,所以研究者一直试图 将个体效应与组效应(背景效应或环境效应) 区分开来。 个体效应:由个体自身特征所造成的变异。 组效应:由个体所处环境所造成的变异。
多层线性模型简介
(1)只关注个体效应,而忽视组效应 只在个体这一层数据上考虑变量间的关系, 那么导致所观测到的效应既包含个体效应, 又包含组效应,从而增大了犯一类错误的概 率,夸大了变量间的关系。 (2)在组水平上进行分析 把数据集中起来, 使其仅在第二层的组间发 挥作用,从而丢失了重要的个体信息。
ij 0j 1j ij ij
var(eij )
2
多层线性模型——完整模型
第二层:
0j
00
W 01
j
u0 j
1 j 10 11W j u1 j
var(0 j ) 00
var(1 j ) 11
cov(0 j , 1 j ) 10
(3)如果假设不同学校入学成绩对高考
成绩的回归直线截距不同,斜率相同 (平均学习成绩之间存在差异),得到 如图3的结果,从图中结果可以看出,不 同学校学生平均高考成绩之间存在差异。
图3:考虑不同学校平均成绩差异的回归直线
HLM数学模型
(4)对73所学校分别做回归分析,得到
如图4的结果,如图4所示,从图中结果 可以看出,不同学校回归直线的截距和 斜率均不同,即:不同学校学生平均高 考成绩之间存在差异,入学学业成绩对 高考成绩的影响强度不同。
多层线性模型基本原理
因此,多层数据并不满足传统OLS回归分析 关于残差项的诸多假设。而多层线性模型将 残差项进行了分解,更符合实际情况,所以 对于多层数据使用多层线性模型进行分析更 为合理。
多层线性模型基本模型
2、多层线性模型的基本模型 零模型(The Null Model) 第一层和第二层均没有预测变量,只是将方 程分解为由个体差异造成的部分及由组差异 造成的部分,这种方法为方差成分分析。