多层线性模型(课堂PPT)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
但有时某个现象既受到水平1变量的影响, 又受到水平2变量的影响,还受到两个水平变量 的交互影响(cross-level interaction)。
个体的某事件既受到其自身特征的影响, 也受到其生活环境的影响,即既有个体效应,也 有环境或背景效应(context effect)。
例如,学生(个体)的学习成绩与学生 的勤奋程度有关,还与学校的师资配备有关。
图2:只考虑学校差异忽略学生差异回归直线
HLM数学模型
❖ (3)如果假设不同学校入学成绩对高考 成绩的回归直线截距不同,斜率相同 (平均学习成绩之间存在差异),得到 如图3的结果,从图中结果可以看出,不 同学校学生平均高考成绩之间存在差异。
图3:考虑不同学校平均成绩差异的回归直线
HLM数学模型
多层线性模型简介
❖ (1)只关注个体效应,而忽视组效应 ❖ 只在个体这一层数据上考虑变量间的关系,
那么导致所观测到的效应既包含个体效应, 又包含组效应,从而增大了犯一类错误的概 率,夸大了变量间的关系。 ❖ (2)在组水平上进行分析 ❖ 把数据集中起来, 使其仅在第二层的组间发 挥作用,从而丢失了重要的个体信息。
企业的创新能力与企业自身的创新投入、学 习能力有关,还与企业所属产业的R&D强度有关。
多层线性模型简介
❖ 2、多层数据的传统分析方法 ❖ 个体的行为既受个体自身特征的影响,也受
到其所处环境的影响,所以研究者一直试图 将个体效应与组效应(背景效应或环境效应) 区分开来。 ❖ 个体效应:由个体自身特征所造成的变异。 ❖ 组效应:由个体所处环境所造成的变异。
❖ (4)对73所学校分别做回归分析,得到 如图4的结果,如图4所示,从图中结果 可以看出,不同学校回归直线的截距和 斜率均不同,即:不同学校学生平均高 考成绩之间存在差异,入学学业成绩对 高考成绩的影响强度不同。
图4:考虑不同学校平均成绩差异 和入学对毕业成绩影响程 度差异的回归直线
❖ 在许多研究中,取样往往来自不同层级和单位,这 种数据带来了很多跨级(多层)的研究问题,解决 这些问题的一种新的数据分析方法——多层模型分 析技术。
的观测数据形成了数据结构的第一层,而儿童之间 的个体差异则形成了数据结构的第二层。这样,就 可以探索个体在其发展趋势或发展曲线上的差异。
层次结构数据的普遍性
水平2 水平1
两水平层次结构数据
层次结构数据为一种非独立数据,即某观察值 在观察单位间(或同一观察单位的各次观察间) 不独立或不完全独立,其大小常用组内相关(intraclass correlation,ICC)度量。
❖ 组内分析组间分析的方法较前两种方法更多地考虑到了第一 层数据及第二层数据对变异产生的影响,但无法对组内效应 和组间效应做出具体的解释,也就无法解释为什么在不同的 组变量间的关系存在差异。
HLM数学模型
❖ 例如:对73个学校1905名学生进行调查,目 的是考虑其刚上高中时的入学成绩与三年后 高考成绩之间的关系。 考虑方法:
例如,来自同一家庭的子女,其生理和心理 特征较从一般总体中随机抽取的个体趋向于更为 相似,即子女特征在家庭中具有相似性,数据是 非独立的。
违背了传统回归(OLS)中关于残差相互 独立的假设
采用经典方法可能失去参数估计的有效性 并导致不合理的推断结论。
经典方法框架下的分析策略
经典的线性模型只对某一层数据的问题进行 分析,而不能将涉及两层或多层数据的问题进行 综合分析。
多层线性模型简介
❖ 3、多层线性模型分析方法
❖ 回归的回归方法
❖ Eg:学生成绩(X)
学习动机(Y)
❖
❖
班级教师教学水平(W)
❖ (1)求各个班级学生成绩对学习动机的回归
Yij 0j1jXijrij
多层线性模型简介
❖ (2)求教师教学水平对β0j和 β1j 的回归方程
0j 000W 1 j 0j 1j 101W 1 j 1j
多层线性模型简介
❖ (3)组内分析组间分析
❖ 对相同的数据进行三次计算: ❖ 一是在组内的个体层上进行的分析,称为组内效应
❖ 二是通过平均或整合第一层中的个体数据,得到第二层的组 间数据,称为组间效应
❖ 三是忽视组的特性而对所有的数据进行分析,称为总效应。
❖ 在此基础上,计算组内效应和组间效应在总效应的比例,从 而确定变异来自于组间还是组内。
简单地镶嵌于学校,这时学生代表了数据结构的第 一层,而班级或学校代表的是数据结构的第二层; 如果数据是学生镶嵌于班级,而班级又是镶嵌于学 校,那么就是三层数据结构。
百度文库
多层线性模型简介
❖ (2)组织心理学研究领域 ❖ Eg:雇员镶嵌于不同的组织、工厂 ❖ (3)发展心理学领域 ❖ Eg:纵向研究、重复研究 ❖ 在一段时间内对儿童进行多次观察,那么不同时间
(1)如果用传统的线性回归分析,直接在学生 水平上进行分析,得出入学学业成绩对高考 成绩之间的一条回归直线,如下图1所示,从 图1的结果可以看出,传统回归分析没有区分 不同的学校之间的差异。
图1:不考虑学校之间差异的回归直线
HLM数学模型
❖ (2)如果将数据进行简单合并,用每个学校 学生的平均成绩代替这个学校的成绩,直接 在学校水平上估计入学成绩对高考成绩的影 响,得到一条回归直线,如图2所示,这种方 法忽略了不同学生(个体)之间的差异;
多层线性模型简介
Hierarchical Linear Model (HLM)
主要内容
❖ 一、多层线性模型简介 ❖ 二、多层线性模型基本原理 ❖ 三、多层线性模型HLM软件的应用
多层线性模型简介
❖ 1、多层数据结构的普遍性
❖ 多层(多水平)数据指的是观测数据在单位上具有 嵌套的关系。
❖ (1)教育研究领域 ❖ EG:学生镶嵌于班级,班级镶嵌于学校,或者学生
❖ 这一方法的开创及发展的主要贡献者之一是英国伦 敦大学的Harvey Goldstein教授及研究者把这种方 法称作“多层分析”。另一主要开拓者美国密歇根 大学的Stephen W.Raudenbush教授和同行把它称为 “分层线性模型结构”。在此,我们按照张雷等人 的叫法称其为“多层线性模型”或“多层模型”。
个体的某事件既受到其自身特征的影响, 也受到其生活环境的影响,即既有个体效应,也 有环境或背景效应(context effect)。
例如,学生(个体)的学习成绩与学生 的勤奋程度有关,还与学校的师资配备有关。
图2:只考虑学校差异忽略学生差异回归直线
HLM数学模型
❖ (3)如果假设不同学校入学成绩对高考 成绩的回归直线截距不同,斜率相同 (平均学习成绩之间存在差异),得到 如图3的结果,从图中结果可以看出,不 同学校学生平均高考成绩之间存在差异。
图3:考虑不同学校平均成绩差异的回归直线
HLM数学模型
多层线性模型简介
❖ (1)只关注个体效应,而忽视组效应 ❖ 只在个体这一层数据上考虑变量间的关系,
那么导致所观测到的效应既包含个体效应, 又包含组效应,从而增大了犯一类错误的概 率,夸大了变量间的关系。 ❖ (2)在组水平上进行分析 ❖ 把数据集中起来, 使其仅在第二层的组间发 挥作用,从而丢失了重要的个体信息。
企业的创新能力与企业自身的创新投入、学 习能力有关,还与企业所属产业的R&D强度有关。
多层线性模型简介
❖ 2、多层数据的传统分析方法 ❖ 个体的行为既受个体自身特征的影响,也受
到其所处环境的影响,所以研究者一直试图 将个体效应与组效应(背景效应或环境效应) 区分开来。 ❖ 个体效应:由个体自身特征所造成的变异。 ❖ 组效应:由个体所处环境所造成的变异。
❖ (4)对73所学校分别做回归分析,得到 如图4的结果,如图4所示,从图中结果 可以看出,不同学校回归直线的截距和 斜率均不同,即:不同学校学生平均高 考成绩之间存在差异,入学学业成绩对 高考成绩的影响强度不同。
图4:考虑不同学校平均成绩差异 和入学对毕业成绩影响程 度差异的回归直线
❖ 在许多研究中,取样往往来自不同层级和单位,这 种数据带来了很多跨级(多层)的研究问题,解决 这些问题的一种新的数据分析方法——多层模型分 析技术。
的观测数据形成了数据结构的第一层,而儿童之间 的个体差异则形成了数据结构的第二层。这样,就 可以探索个体在其发展趋势或发展曲线上的差异。
层次结构数据的普遍性
水平2 水平1
两水平层次结构数据
层次结构数据为一种非独立数据,即某观察值 在观察单位间(或同一观察单位的各次观察间) 不独立或不完全独立,其大小常用组内相关(intraclass correlation,ICC)度量。
❖ 组内分析组间分析的方法较前两种方法更多地考虑到了第一 层数据及第二层数据对变异产生的影响,但无法对组内效应 和组间效应做出具体的解释,也就无法解释为什么在不同的 组变量间的关系存在差异。
HLM数学模型
❖ 例如:对73个学校1905名学生进行调查,目 的是考虑其刚上高中时的入学成绩与三年后 高考成绩之间的关系。 考虑方法:
例如,来自同一家庭的子女,其生理和心理 特征较从一般总体中随机抽取的个体趋向于更为 相似,即子女特征在家庭中具有相似性,数据是 非独立的。
违背了传统回归(OLS)中关于残差相互 独立的假设
采用经典方法可能失去参数估计的有效性 并导致不合理的推断结论。
经典方法框架下的分析策略
经典的线性模型只对某一层数据的问题进行 分析,而不能将涉及两层或多层数据的问题进行 综合分析。
多层线性模型简介
❖ 3、多层线性模型分析方法
❖ 回归的回归方法
❖ Eg:学生成绩(X)
学习动机(Y)
❖
❖
班级教师教学水平(W)
❖ (1)求各个班级学生成绩对学习动机的回归
Yij 0j1jXijrij
多层线性模型简介
❖ (2)求教师教学水平对β0j和 β1j 的回归方程
0j 000W 1 j 0j 1j 101W 1 j 1j
多层线性模型简介
❖ (3)组内分析组间分析
❖ 对相同的数据进行三次计算: ❖ 一是在组内的个体层上进行的分析,称为组内效应
❖ 二是通过平均或整合第一层中的个体数据,得到第二层的组 间数据,称为组间效应
❖ 三是忽视组的特性而对所有的数据进行分析,称为总效应。
❖ 在此基础上,计算组内效应和组间效应在总效应的比例,从 而确定变异来自于组间还是组内。
简单地镶嵌于学校,这时学生代表了数据结构的第 一层,而班级或学校代表的是数据结构的第二层; 如果数据是学生镶嵌于班级,而班级又是镶嵌于学 校,那么就是三层数据结构。
百度文库
多层线性模型简介
❖ (2)组织心理学研究领域 ❖ Eg:雇员镶嵌于不同的组织、工厂 ❖ (3)发展心理学领域 ❖ Eg:纵向研究、重复研究 ❖ 在一段时间内对儿童进行多次观察,那么不同时间
(1)如果用传统的线性回归分析,直接在学生 水平上进行分析,得出入学学业成绩对高考 成绩之间的一条回归直线,如下图1所示,从 图1的结果可以看出,传统回归分析没有区分 不同的学校之间的差异。
图1:不考虑学校之间差异的回归直线
HLM数学模型
❖ (2)如果将数据进行简单合并,用每个学校 学生的平均成绩代替这个学校的成绩,直接 在学校水平上估计入学成绩对高考成绩的影 响,得到一条回归直线,如图2所示,这种方 法忽略了不同学生(个体)之间的差异;
多层线性模型简介
Hierarchical Linear Model (HLM)
主要内容
❖ 一、多层线性模型简介 ❖ 二、多层线性模型基本原理 ❖ 三、多层线性模型HLM软件的应用
多层线性模型简介
❖ 1、多层数据结构的普遍性
❖ 多层(多水平)数据指的是观测数据在单位上具有 嵌套的关系。
❖ (1)教育研究领域 ❖ EG:学生镶嵌于班级,班级镶嵌于学校,或者学生
❖ 这一方法的开创及发展的主要贡献者之一是英国伦 敦大学的Harvey Goldstein教授及研究者把这种方 法称作“多层分析”。另一主要开拓者美国密歇根 大学的Stephen W.Raudenbush教授和同行把它称为 “分层线性模型结构”。在此,我们按照张雷等人 的叫法称其为“多层线性模型”或“多层模型”。