多层线性模型的解读：原理与应用

合集下载

hlm模型的概念和原理

hlm模型的概念和原理
HLM模型（Hierarchical Linear Model，分层线性模型）是一种用于分析多层数据结构的统计方法，可以用于研究个体差异、群体差异以及群体与个体相互作用等方面的问题。

在社会科学、心理学、医学等领域得到广泛应用。

HLM的原理是基于线性模型的，但它将数据分为多个层次，并对每个层次的变量进行单独分析和建模。

HLM可以解决一些传统线性模型无法解决的问题，例如在研究个体差异时，传统线性模型只能考虑个体内差异，而HLM可以同时考虑个体内和个体间的差异。

在具体实现上，HLM模型涉及到两个重要的专业术语，分别是‘固定效应’和‘随机效应’。

固定效应是指做HLM模型时，不涉及group 干扰时的影响关系研究；随机效应可指在group层面时的影响关系情况。

如果完全不考虑group，即不考虑‘聚集性’问题，那么直接使用线性回归即可，并不需要使用HLM模型；而HLM模型就是处理‘聚集性’问题的一种进阶方法。

如果说使用HLM模型，并且在分析时只考虑个体效应不需要考虑group层面的效应，即只有固定效应项并无随机效应项；如果说使用HLM模型，并且在分析时考虑个体效应的同时还考虑group层面的效应，即包括固定效应项和随机效应项。

(完整版)多层线性模型介绍

多层线性模型：HLM（hierarchical linear model）计量模型，为解决传统统计方法如回归分析在处理多层嵌套数据时的局限而产生的，是目前国际上较前沿的一套社会科学数据分析的理论和方法，优势体现两个方面：一是解决了数据嵌套问题；二是为追踪研究或重复测量研究引入了新方法。

传统的线性模型，例如，ANOV A或者回归分析，只能对涉及某一层数据的问题进行分析，而不能将涉及两层或多层数据的问题进行综合分析，而多层线性模型对解决这些问题提供了有效的统计方法。

多层线性模型的参数估计方法与进行两次回归的方法在概念上是相似的, 但二者的统计估计和验证方法却是不同的, 并且多层线性模型的参数估计方法更为稳定。

因此多层模型的应用范围也相当广泛，与传统的用于处理多元重复测量数据的方法相比，该模型具有对数据资料要求低、能够明确表示个体在第一层次的变化情况、可以通过定义第一层次和第二层次的随机变异解释个体随时间的复杂变化情况、可以考虑更高一层次的变量对于个体增长的影响等特点。

多层线性模型( multilevel model ) 由Lindley 等于1972 年提出，是用于分析具有嵌套结构数据的一种统计分析技术。

作为传统方差分析模型的有效扩展Korendijk 等和Duncan 等众多的研究者对多层线性模型进行了广泛研究。

20 多年来，该方法在社会科学领域获得了广泛应用。

近年来，有研究者提出使用多层线性模型进行面板研究，并且已在社会科学领域取得较大进展。

面板研究中多层线性模型的应用优势：由上述分析可知，在面板研究中，传统的数据分析方法会遇到很多难以克服的困难，而多层线性模型可以很好地处理上述问题。

近年来，越来越多的面板研究开始采用多层线性模型的分析方法，显示出多层线性模型在面板研究中的独特优势。

首先，多层线性模型通过考察个体水平在不同时间点的差异，明确表达出个体在层次一的变化情况，因而对于数据的解释（个体随时间的增长趋势）是在个体与重复观测交互作用基础上的解释，即不仅包含不同观测时点的差异，也包含个体之间存在的差异。

多层线性模型简介

多层线性模型——零模型

第一层：
Yij 0 j eij
var(eij )
2

第二层：
0 j 00 u0 j
00 uoj eij
var(0 j ) 00

合并模型： Yij
多层线性模型——零模型
0 j指第j个二层单位Y的平均值
多层线性模型简介

（2）组织心理学研究领域 Eg:雇员镶嵌于不同的组织、工厂（3）发展心理学领域 Eg:纵向研究、重复研究在一段时间内对儿童进行多次观察，那么不同时间的观测数据形成了数据结构的第一层，而儿童之间的个体差异则形成了数据结构的第二层。这样，就可以探索个体在其发展趋势或发展曲线上的差异。
ij 0j 1j ij ij
var(eij )
2
多层线性模型——完整模型

第二层：
0j
00

W 01
j
u0 j
1 j 10 11W j u1 j
var(0 j ) 00
var(1 j ) 11
cov(0 j , 1 j ) 10
多层线性模型简介

3、多层线性模型分析方法回归的回归方法 Eg:学生成绩（X）学习动机（Y）班级教师教学水平（W）（1）求各个班级学生成绩对学习动机的回归

Yij 0 j 1j X i j rij
多层线性模型简介

（2）求教师教学水平对β 0j和 β
1j
的回归方程
00
eij指第j个二层单位Y的变异
指所有二层单位的Y的总体平均数 0 j 指第二层方程的残差（随机项）跨级相关：指Y的总体变异中有多大比例是由第二层的变异引起的。

(完整版)多层线性模型介绍

多层线性模型( multilevel model ) 由Lindley 等于1972 年提出，是用于分析具有嵌套结构数据的一种统计分析技术。

作为传统方差分析模型的有效扩展Korendijk 等和Duncan 等众多的研究者对多层线性模型进行了广泛研究。

20 多年来，该方法在社会科学领域获得了广泛应用。

近年来，有研究者提出使用多层线性模型进行面板研究，并且已在社会科学领域取得较大进展。

近年来，越来越多的面板研究开始采用多层线性模型的分析方法，显示出多层线性模型在面板研究中的独特优势。

分层线性模型

分层线性模型（hierarchical linear model HLM）的原理及应用
一、概念：
分层线性模型（hierarchical linear model HLM）又名多层线性模型
（Multilevel Linear Model MLM）、层次线性模型（Hierarch Linear Mode1）、多层分析（Multilevel Analysis/Model）。相对于传统的两种统计方法：一般线性模型（general linear model GLM）和广义线性模型（generalized linear models GLMs），它们又有所不同，HLM中的线性模型指的是线性回归，不过它与一般的分层线性回归（Hierarchical Regression）又是不同的，具体的不同见下面数学模型部分。HLM又被通俗的称为“回归的回归”。
Wikipedia：“一般线性回归和多重线性回归都是发生在单一层面，HLM相对于更适用于嵌套数据（nest data）。”
在理解HLM之前应了解有关回归分析和嵌套设计（分层设计）的基本知识。

二、模型：
1、假设：由于个体行为不仅受个体自身特征的影响，也受到其所处环境（群体/层次）的影响。相对于不同层次的数据，传统的线性模型在进行变异分解时，对群组效应分离不出，而增大模型的误差项。而且不同群体的变异来源也可能分布不同，可能满足不了传统回归的方差齐性假设。在模型应用方面，不同群体（层次）的数据，也不能应用同一模型。鉴于传统方法的局限性，分层技术则解决了这些生态谬误（Ecological Fallacy）。它包含了两个层面的假设：
4、与分层回归的区别：
a、向前回归、向后回归和逐步回归：
向前回归：根据自变量对因变量的贡献率，首先选择一个贡献率最大的自变量进入，一次只加入一个进入模型。然后，再选择另一个最好的加入模型，直至选择所有符合标准者全部进入回归。

多层线性模型的解读：原理与应用

多层线性模型的解读：原理与应用多层线性模型的解读：原理与应用浙江师范大学心理研究所陈海德Chenhaide351@ 一、多层数据结构的普遍性多水平、多层次的数据结构普遍存在，如学生嵌套于班级，班级有嵌套与学校。

传统的线性模型，如方差分析和回归分析，只能涉及一层数据的问题进行分析，不能综合多层数据问题。

在实际研究中，更令人感兴趣的是学生一层的变量与班级一层的变量之间的交互作用，比如，学生之间的个体差异在不同班级之间可能是相同的、也可能是不同的。

学生数据层中，不同变量之间的关系可能因班级的不同而不同。

因此，学生层的差异可以解释为班级层的变量。

另一种类型的两层嵌套数据来自纵向研究数据，不同时间观测数据形成了数据结构的第一层，而被试之间的个体差异形成了第二层。

可以探索个体在发展趋势上的差异。

二、传统技术处理多层数据结构的局限如果把变量分解到个体水平，在个体水平上分析。

但是我们知道这些学生是来自同一班级的，不符合观察独立原则。

导致个体间随机误差相互独立的假设不能满足。

如果把个体变量集中到较高水平，在较高水平上进行分析。

这样丢弃了组内信息，而组内变异可能占了大部分。

三、原理☆水平1的模型与传统的回归模型类似，所不同的是回归方程的截距和斜率不再是一个常数，而是水平2变量水平不同，其回归方程的截距和斜率也不同的，是一个随机变量。

如，每个班级的回归方程的截距和斜率都直接依赖于班级教师教学方法。

☆多层线性模型分为“随机截距模型”和“随机截距和随机斜率模型”。

“随机截距模型”假定因变量的截距随着群体的不同而不同，但各群体的回归斜率是固定，因此不同层次因素之间缺乏互动。

“随机截距和随机斜率模型”假定截距和回归斜率都因群体而异，允许不同层次因素之间的互动。

参数估计方法有：迭代广义最小二乘法、限制性的广义最小二乘估计、马尔科夫链蒙特卡罗法。

这些方法代替了传统的最小二乘法估计，更为稳定和精确。

比如，当第二层的某单位只有少量的被试，或不同组样本量不同时，多层线性模型进行了加权估计、迭代计算。

多层线性模型——原理与应用解读

式中，γ10=预测变量X对结果变量的影响效果 γ20=预测变量Z对结果变量的影响效果 γc0为控制变量对结果变量的影响，c=3,4,5 …
三、多层线性模型的应用
第三步，将检验假设2关于组织层面调节变量对因变量直接影响的跨层次效应，进一步验证截距项的存在是否可由组织层面加以解释和预测。截距项预测模式 Level-1： Yij=β0j+β1jXij+β2jZij+ βcj(控制变量) +rij Level-2：β0j=γ00+γ01Wij+ γ02Gij+μ0j β1j=γ10+μ1j β2j=γ20+μ2j βcj=γc0+μcj
一、多层线性模型简介
3、多层线性模型分析方法回归的回归方法 Eg：个体成就目标导向（X）
ቤተ መጻሕፍቲ ባይዱ
个体创造力（Y）
组织环境（W）（1）求各个组织个体成员的成就目标导向对创造力的回归 Yij 0 j 1 j X ij rij （2）求组织环境对 0 j 和 1 j 的回归方程 0 j 00 01Wj 0 j
三、多层线性模型的应用
具体检验步骤及多层线性模型构建如下：第一步，检验跨层次效果是否存在。只有组内与组间的变异成份显著，才能够进行下一步的截距与斜率项分析。虚无模式 Level-1：Yij=β0j+rij，式中rij ~N(0，σ2) Level-2：β0j=γ00+μ0j，式中μ0j ~ N(0，τ00)
式中，γ11= Level-2的斜率（用来检验H3a） γ12= Level-2的斜率（用来检验H3b） γ21= Level-2的斜率（用来检验H3c ） γ22= Level-2的斜率（用来检验H3d）

多层线性模型的原理及应用_雷雳

首都师范大学学报(社会科学版)Journal of Capital Normal University　2002年第2期(Social Sciences Edition )(总第145期)　心理学研究多层线性模型的原理及应用＊雷　雳1　张　雷2(1.首都师范大学教育科学学院心理学系,北京100089;2.香港中文大学教育心理学系) 摘　要:　本文对多层线性模型(Hierarchical Linear Models ,HL M )的理论缘起、应用范围以及其应用原理进行了阐述,在指出经典统计技术处理多层数据结构上的局限的同时,表明了多层线性模型在这方面的优越性。

本文最后对多层线性模型的效果及局限性进行了简要分析。

关键词:　多层数据;回归;线性模型;多层模型中图分类号:G44　文献标识码:A 文章编号:1004-9142(2002)02-0110-05收稿日期:2001-12-12作者简介:雷　雳(1968-),男,汉族,重庆市人,首都师范大学教育科学学院心理学系副教授,心理学博士;张　雷,男,汉族,天津市人,香港中文大学教育心理学系副教授,心理学博士。

＊联系方式:100089,北京市西三环北路83号,首都师范大学心理学系。

dr .leili @china .com 。

多层线性模型(Hierarchical Linear Models ,HLM )是针对经典统计技术在处理具有多层结构的数据时所存在的局限、以及可能产生的对分析结果的曲解而提出的,它适宜对广泛存在的多层数据结构进行恰当的、深入的分析和解释。

一、多层数据结构的普遍性在社会科学中,很多研究问题都体现为多水平的、多层的数据结构。

其中最为典型的例子就是在教育研究中学生镶嵌于班级、而班级又镶嵌于学校的现象;或者,也可以简单地把学生看成是镶嵌于学校。

在此,学生代表了数据结构的第一层,而班级或者学校则代表了数据结构的第二层。

如果数据是学生镶嵌于班级、且班级镶嵌于学校,那么就是三层的数据结构。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

多层线性模型的解读：原理与应用
浙江师范大学心理研究所陈海德
********************
一、多层数据结构的普遍性
多水平、多层次的数据结构普遍存在，如学生嵌套于班级，班级有嵌套与学校。

传统的线性模型，如方差分析和回归分析，只能涉及一层数据的问题进行分析，不能综合多层数据问题。

学生数据层中，不同变量之间的关系可能因班级的不同而不同。

因此，学生层的差异可以解释为班级层的变量。

另一种类型的两层嵌套数据来自纵向研究数据，不同时间观测数据形成了数据结构的第一层，而被试之间的个体差异形成了第二层。

可以探索个体在发展趋势上的差异。

二、传统技术处理多层数据结构的局限
如果把变量分解到个体水平，在个体水平上分析。

但是我们知道这些学生是来自同一班级的，不符合观察独立原则。

导致个体间随机误差相互独立的假设不能满足。

如果把个体变量集中到较高水平，在较高水平上进行分析。

这样丢弃了组内信息，而组内变异可能占了大部分。

三、原理
☆水平1（学生）的模型与传统的回归模型类似，所不同的是回归方程的截距和斜率不再是一个常数，而是水平2变量水平不同（不同的班级），其回归方程的截距和斜率也不同的，是一个随机变量。

如，每个班级的回归方程的截距和斜率都直接依赖于班级教师教学方法。

☆多层线性模型分为“随机截距模型”和“随机截距和随机斜率模型”。

“随机截距模型”假定因变量的截距随着群体的不同而不同，但各群体的回归斜率是固定，因此不同层次因素之间缺乏互动。

“随机截距和随机斜率模型”假定截距和回归斜率都因群体而异，允许不同层次因素之间的互动。

参数估计方法有：迭代广义最小二乘法、限制性的广义最小二乘估计、马尔科夫链蒙特卡罗法。

这些方法代替了传统的最小二乘法估计，更为稳定和精确。

比如，当第二层的某单位只有少量的被试，或不同组样本量不同时，多层线性模型进行了加权估计、迭代计算。

四、应用
1 用于类似组织管理、学校教育等具有多层数据结构的领域研究。

2 用于个体重复测量数据的追踪研究。

测量层面作为第一水平，个体层面作为第二水平
3 用于做文献综述，即对众多研究成果进行定量综合。

探讨不同研究中进行的处理、研究方法、被试特征和背景上的差异与效应之间的关系。

4 充分利用多层模型较为高级的统计估计方法来改善单层回归的估计和分析。

五、优势
1 由于多层线性模型建立在更合理的假设之上，考虑到了来自不同层次的随机误差和变量信息，因此能提供更加准确的标准误估计、更有效的区间估计和假设检验。

2 多层线性模型可以计算任何水平上测量的协方差，如可以通过计算不同水平变异在总变异中占的比率来确定不同水平对因变量的影响程度，例如研究者可以探讨班级和学生的其他特征对因变量变异的作用到底有多大。

还可以分析不同水平上变量之间的交互作用。

3 可以发现所得回归方程中，截距和斜率之间的相关关系，以便更好地解释自变量和因变量之间变化的规律。

4 多层次分析不仅可以用于分析观测变量之间的因果关系，而且作为协方差结构模型的拓展，可以分析具有多层结构的潜变量之间的因果关系，即建立多层水平结构方程模型。

5 不仅可以分析层次结构数据，还可以分析重复测量数据。

测量看成第一水平，测试个体看成第二水平。

6 不仅可以分析服从正态分布的连续数据，也可以分析离散型的数据，如二项分布和泊松分布的数据。

7 使用范围较广，传统单因素方差分析、回归分析都是多层分析模型的简化（假设两个水平模型中有一个水平的变量为常数）。

8
六、注意
1 如果数据不具备结构性，则不必用层次分析。

用传统的单水平分析模型可以得到更好解释。

2 虽然用多层分析可以更准确地描述事物间的因果关系，但它不能用来建立理论，不能代替专业理论方面的分析。

3 仍然以线性和正态的假设为基础。

4 仍然是研究几个变量预测一个变量的相对简单回归结构
七、步骤与结果解释
第一水平变量x，第二水平变量1为w，第二水平变量2为u，因变量为y
1 无条件均值模型（零模型）：不加入任何自变量，回答是否同一群体具有较大相似性，即第二水平随机变异显著是进行后面模型分析的基础，如果不显著则没有必要进行多水平分析。

1.1固定部分的参数估计：y的总体平均值估计
1.2随机部分的参数估计：群组之间是否存在显著差异？群组之间的相关（跨级相关：
ICC）？群组变异在总变异中占的比例？
1.3 描述模型拟合的差异统计量。

比如Deviance=1200
2 无条件增长模型（随机效应模型）：回答的问题是因变量y和自变量x是否有线性变化的趋势，以及这种线性变化趋势是否存在群体间差异。

模型中不加入第二层水平的自变量2.1固定部分的参数估计：y和x的关系（截距和斜率）
2.2随机部分的参数估计：第一水平的截距和斜率是否会随着第二水平的变化而变化。

2.3 描述模型拟合的差异统计量。

比如Deviance=900，与零模型相比，减少了300，如果
减少的300达到显著，则说明加入了第一水平变量，使模型拟合显著提高。

3 全模型（混合效应模型）：回答的问题是第二水平中哪些变量对x-y关系（即斜率和截距）有影响，影响程度多少。

2.1固定部分的参数估计：第二水平变量（w1、w2…）对x-y关系（即斜率和截距）的影
响是否达到显著。

对截距影响显著，则说明第二水平中的w1、w2变量对因变量y有显著影响；对斜率影响显著，则说明w1、w2变量对x-y关系有显著影响。

2.2随机部分的参数估计：检验引入第二水平变量w1、w2后，模型中变异的减少程度，说明了引入w1、w2的必要性，以及它们解释多大程度的变异。

另外，检验除了考虑第二水平变量（w1、w2…）的作用外，x-y关系（即斜率和截距）的变异是否依然显著，说明是否还需考虑其他第二水平上的因素。

3.3 描述模型拟合的差异统计量。

比如Deviance=850，与无条件增长模型相比，减少了
50，如果减少的50达到显著，则说明加入的了第二水平变量，使模型拟合显著提高。