多水平模型简介
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从业类型,1.农业户;2.农业兼业户;3.非农业兼业户;4.非农业户) 水平2解释变量:
地理环境,分为三类:平原、丘陵和山区,引入两个虚拟变量表示:
空模型也称为截距模型(Intercept—only model)或无 条件均值模型(Unconditional means model)。该模 型是最简单的随机效应模型,即单因素随机效应方差分析。 运行该模型的目的是评估组内同质性(Within—group homogeneity)或组间异质性(Between—group heterogeneity)。设本例中的空模型为:
*1)由于多水平模型同时考虑不同水平上的
差异,因此当数据水平结构较多时,多水平 模型结构较一般计量模型结构复杂;
*(2)需要较大的样本量才可以保证多水平
模型估计的稳定性,较小的样本会带来偏差
*多水平模型的局限性
*无条件两水Βιβλιοθήκη Baidu模型
首先建立无条件两水平模型,又称为截距模型(intercept-only model) 或空模型(empty model),是两水平模型建模的基础。其模型形式为:
*多水平模型简介
*社会科学研究中的一个基本概念是,社会是一个具有
分级结构的整体,社会的分级结构自然而然地使由其 所产生的数据呈现水平(层次)结构。在该类数据中, 低一水平(层次)的数据单位嵌套与或聚集在高一水 平(层次)的单位中。
*长期以来用以说明具有多种水平结构的数据的例子是
对学生学习成绩的研究。学生的学习状况不仅与个人 的内在因素(如智力水平)相联系,而且与其所处的 环境相联系,如学习风气、教师的教学经验、学校的 设施等。因此在对学习成绩与个体水平变量(如性别、 智力水平、种族等)关系的研究中,可将学生个体嵌 套在班级里,而将班级嵌套在学校里的形式进行数据
,
*条件两水平模型 *条件两水平模型既是在截距模型中加入了解
释变量,其中既包括一水平解释变量也可能 包括二水平解释变量。设 为因变量, 为一 水平解释变量, 为二水平解释变量,且均为 线性函数形式的关系(可以具有其他函数形 当式只有的一关水系平解)释。变量时模型如下:
水平1: yij i i xij eij
ˆ
2(设定模型)
u0
ˆ
2 u0
(零模型)
*例1:农户的收入函数模型
*为了研究影响西部民族地区农户收入的因素,我们考虑如下变量:
结局测量: y:农户家庭人均纯收入的对数;
水平1解释变量或个体水平解释变量: invest:农户家庭的人均生产性固定资产原值; till:农户家庭的人均耕地数量; Structure:农户家庭的就业结构(调查户按从业劳动力比重计算的
水平2: i 0 u0i i 0 u1i
总模型为:
yij 0 0 xij u0i u1i eij
*当存在二水平解释变量时模型如下:
水平1: yij i i xij eij
水平2: i 0 1wi u0i
i 0 1wi u1i
总模型为:
yij 0 1wi 0 xij 1wi xij u0i u1i xij eij
以定义水平1方差可解释的比例
R1
ˆ
2
(零模型ˆ(2)零 模ˆ(2型设)定模型)
1
ˆ 2 (设定模型) ˆ(2 零模型)
水平2方差可解释的比例
R220
ˆu20 (零模型ˆu20)(零 模ˆu2(0型设)定模型) 1
常重要的问题——跨层交互作用(across—level interactions),即讨论2水平解释变量如何调节水平1 解释变量对结局测量的效应。在多层模型中设定跨层交 互作用相当于将模型中水平1随机系数设定为相应水平2 方程中解释变量的函数:
*跨层交互作用评估
*通过分层抽样得到的样本数据,具有明显的
水平结构,所以也是多水平数据。
*分层数据表
*多水平统计分析模型的产生是社会科学理论
研究和方法论的进步,为研究具有多水平结 构的数据提供了一个方便的分析框架,研究 者可以利用该框架系统分析微观和宏观水平 的效应,检验宏观变量如何调节微观变量的 效应,以及个体水平解释变量是否影响组水 平解释变量的效应。另外,多水平统计分析 模型还可以用来研究纵向数据中被解释变量 随时间变化的发展轨迹,即多水平模型中的 发展模型。
总模型为:
*两水平统计分析模型
*组内相关系数ICC
ICC被定义为组间方差与总方差之比。对于截距模型而
言,其ICC定义为:
ICC
2 u0
(
2 u0
2
)
ICC既能反映组间变异,也能表示组内个体间的相关, 其范围在0到1之间,当ICC值趋于1时表示组间方差相 对于组内方差非常大,相反当ICC值趋于0时表示没有 组群效应,此时两水平模型可简化为固定效应模型。
*用场景变量解释组间变异
* 在模型中纳入水平1解释变量
*till和Structure的方差估计分别为0.002449和0.01518,
对应的Z检验统计量为1.65和2.30,prob(Z)分别为
0.0490和0.0108,说明这两个变量的回归系数是随机
系数。 *水平1随机斜率检验
*在建模的最后,我们需要讨论多层模型分析中的一个非
*空模型
结果表明:各村农户的人均收入增长率存在显著差异。组内相关 系数(ICC):
ICC=0.368表明结局测量中约有36.8%的总变 异是由村之间的差异造成的。
*上述空模型的运行结果表明结局测量y中存在显
著的组间变量( 方差=0.2278,P<0.0001)。我 们在模型中加入2水平的解释变量来解释各村之 间的组间变异。为简洁起见,我们在模型中纳入 一个表示地理位置的2水平解释变量(用D1、D2 两个虚拟变量表示)
* 采个集水,平由(此层形次成)具了 的观3有个察水层数平次据(单结层位次构是)的学的生多结个构水体数平,据第数,2第个据水1
平(层次)的观察数据单位是班级,第3个水平(层次) 的观察数据单位是学校。
*在经济领域相关问题的研究中,国家、省、
地市、县的众多经济指标数据就存在着明显 的水平结构,县级指标数据嵌套于地市数据, 地市嵌套于省份,省份又嵌套于国家,因此 可视为多水平数据,即第1水平的观察单位 是县,第2水平的观察单位是地市,第3水平 的观察单位则是省份,第4水平的观察单位 则是国家。
地理环境,分为三类:平原、丘陵和山区,引入两个虚拟变量表示:
空模型也称为截距模型(Intercept—only model)或无 条件均值模型(Unconditional means model)。该模 型是最简单的随机效应模型,即单因素随机效应方差分析。 运行该模型的目的是评估组内同质性(Within—group homogeneity)或组间异质性(Between—group heterogeneity)。设本例中的空模型为:
*1)由于多水平模型同时考虑不同水平上的
差异,因此当数据水平结构较多时,多水平 模型结构较一般计量模型结构复杂;
*(2)需要较大的样本量才可以保证多水平
模型估计的稳定性,较小的样本会带来偏差
*多水平模型的局限性
*无条件两水Βιβλιοθήκη Baidu模型
首先建立无条件两水平模型,又称为截距模型(intercept-only model) 或空模型(empty model),是两水平模型建模的基础。其模型形式为:
*多水平模型简介
*社会科学研究中的一个基本概念是,社会是一个具有
分级结构的整体,社会的分级结构自然而然地使由其 所产生的数据呈现水平(层次)结构。在该类数据中, 低一水平(层次)的数据单位嵌套与或聚集在高一水 平(层次)的单位中。
*长期以来用以说明具有多种水平结构的数据的例子是
对学生学习成绩的研究。学生的学习状况不仅与个人 的内在因素(如智力水平)相联系,而且与其所处的 环境相联系,如学习风气、教师的教学经验、学校的 设施等。因此在对学习成绩与个体水平变量(如性别、 智力水平、种族等)关系的研究中,可将学生个体嵌 套在班级里,而将班级嵌套在学校里的形式进行数据
,
*条件两水平模型 *条件两水平模型既是在截距模型中加入了解
释变量,其中既包括一水平解释变量也可能 包括二水平解释变量。设 为因变量, 为一 水平解释变量, 为二水平解释变量,且均为 线性函数形式的关系(可以具有其他函数形 当式只有的一关水系平解)释。变量时模型如下:
水平1: yij i i xij eij
ˆ
2(设定模型)
u0
ˆ
2 u0
(零模型)
*例1:农户的收入函数模型
*为了研究影响西部民族地区农户收入的因素,我们考虑如下变量:
结局测量: y:农户家庭人均纯收入的对数;
水平1解释变量或个体水平解释变量: invest:农户家庭的人均生产性固定资产原值; till:农户家庭的人均耕地数量; Structure:农户家庭的就业结构(调查户按从业劳动力比重计算的
水平2: i 0 u0i i 0 u1i
总模型为:
yij 0 0 xij u0i u1i eij
*当存在二水平解释变量时模型如下:
水平1: yij i i xij eij
水平2: i 0 1wi u0i
i 0 1wi u1i
总模型为:
yij 0 1wi 0 xij 1wi xij u0i u1i xij eij
以定义水平1方差可解释的比例
R1
ˆ
2
(零模型ˆ(2)零 模ˆ(2型设)定模型)
1
ˆ 2 (设定模型) ˆ(2 零模型)
水平2方差可解释的比例
R220
ˆu20 (零模型ˆu20)(零 模ˆu2(0型设)定模型) 1
常重要的问题——跨层交互作用(across—level interactions),即讨论2水平解释变量如何调节水平1 解释变量对结局测量的效应。在多层模型中设定跨层交 互作用相当于将模型中水平1随机系数设定为相应水平2 方程中解释变量的函数:
*跨层交互作用评估
*通过分层抽样得到的样本数据,具有明显的
水平结构,所以也是多水平数据。
*分层数据表
*多水平统计分析模型的产生是社会科学理论
研究和方法论的进步,为研究具有多水平结 构的数据提供了一个方便的分析框架,研究 者可以利用该框架系统分析微观和宏观水平 的效应,检验宏观变量如何调节微观变量的 效应,以及个体水平解释变量是否影响组水 平解释变量的效应。另外,多水平统计分析 模型还可以用来研究纵向数据中被解释变量 随时间变化的发展轨迹,即多水平模型中的 发展模型。
总模型为:
*两水平统计分析模型
*组内相关系数ICC
ICC被定义为组间方差与总方差之比。对于截距模型而
言,其ICC定义为:
ICC
2 u0
(
2 u0
2
)
ICC既能反映组间变异,也能表示组内个体间的相关, 其范围在0到1之间,当ICC值趋于1时表示组间方差相 对于组内方差非常大,相反当ICC值趋于0时表示没有 组群效应,此时两水平模型可简化为固定效应模型。
*用场景变量解释组间变异
* 在模型中纳入水平1解释变量
*till和Structure的方差估计分别为0.002449和0.01518,
对应的Z检验统计量为1.65和2.30,prob(Z)分别为
0.0490和0.0108,说明这两个变量的回归系数是随机
系数。 *水平1随机斜率检验
*在建模的最后,我们需要讨论多层模型分析中的一个非
*空模型
结果表明:各村农户的人均收入增长率存在显著差异。组内相关 系数(ICC):
ICC=0.368表明结局测量中约有36.8%的总变 异是由村之间的差异造成的。
*上述空模型的运行结果表明结局测量y中存在显
著的组间变量( 方差=0.2278,P<0.0001)。我 们在模型中加入2水平的解释变量来解释各村之 间的组间变异。为简洁起见,我们在模型中纳入 一个表示地理位置的2水平解释变量(用D1、D2 两个虚拟变量表示)
* 采个集水,平由(此层形次成)具了 的观3有个察水层数平次据(单结层位次构是)的学的生多结个构水体数平,据第数,2第个据水1
平(层次)的观察数据单位是班级,第3个水平(层次) 的观察数据单位是学校。
*在经济领域相关问题的研究中,国家、省、
地市、县的众多经济指标数据就存在着明显 的水平结构,县级指标数据嵌套于地市数据, 地市嵌套于省份,省份又嵌套于国家,因此 可视为多水平数据,即第1水平的观察单位 是县,第2水平的观察单位是地市,第3水平 的观察单位则是省份,第4水平的观察单位 则是国家。