多水平统计模型简介SPSS操作

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

yij ( 00 01xij ) (u0 j u1 j xij eij )
反应变量Y可表达为固定部分 ( 00 x 01 ij ) 与随机
部分 (u0 j u1 j xij ei之j ) 和。模型具有多个残差项,这是
多水平模型区别于经典模型的关键部分。
此模型需估计5个参数,除两个固定系数 00 和 01,
0 j 00 u0 j
00 为平均截距,反映 yij 与 xij 的平均关系,
即当 x 取 0 时,所有 y 的总平均估计值。
u0 j 为随机变量,表示第 j 个学校 y 的平均估
计值与总均数的离差值,反映了第 j 个学校对 y 的 随机效应。
Chongqing Medical University Peng Bin
0 j 00 u0 j 1 j 01 u1 j
yij ( 00 u0 j ) ( 01 u1 j )xij eij ( 00 01xij ) (u0 j u1 j xij eij )
固定效应部分 随机效应部分(残差项)
Chongqing Medical University Peng Bin
多水平模型简介
Multilevel Models
Chongqing Medical University Peng Bin
单水平模型
1,2,...,i,...n个观察对象
yi 0 1xi ei ,
ei
~
N
(0,
2 e
)
模型假设: 正态性、独立性、残差方差齐同性 协变量的影响保持不变
假设不满足时的处理
截距不同,斜率不同
yij 0 j 1 j xij eij
Chongqing Medical University Peng Bin
按学校绘制散点图及拟合线
该模型即为多水平模型
yij 0 j 1 j xij eij
Chongqing Medical University Peng Bin
1 j 01 u1 j
01 表示协变量 x 在所有学校的平均效应估计
值(固定部分),u1 j 表示协变量 x 在不同学校所
产生的特殊效应(随机部分),反映协变量与学 校之间产生的交互效应,即学校间 y 的变异与协 变量 x 的变化有关。
Chongqing Medical University Peng Bin
多水平模型基本结构
yij 0 j 1 j xij eij
0 j 00 u0 j 1 j 01 u1 j
x yij 和 ij 分别为第 j 个
学校中第 i 个学生应变量 观测值和解释变量观测值
00是
0
的平均值,为固定成分
j
,u0
j为0
的随机成分
j
,
服从正态分布
01是1
的平均值,为固定成分
学校1
……
学校k
学生
学生 …… 学生
观测指标: X, Y
学生
普通线性回归,忽略学校
yi 0 1xi ei
Chongqing Medical University Peng Bin
按学校分别拟合
截距不同,斜率相同
yij 0 j 1xij eij
截距相同,斜率不同
yij 0 1 j xij eij
层次结构数据的普遍性
家庭
学校
病人
水平2
水平1
子女Байду номын сангаас
学生
测量1 测量2 测量3
两水平层次结构数据
两水平层次结构:水平1单位在水平2内聚集
层次结构数据为一种非独立数据,即某观察值 在观察单位间或同一观察单位的各次观察间不独 立 或 不 完 全 独 立 , 其 大 小 常 用 组 内 相 关 (intraclass correlation,ICC)度量。
还需估计三个随机参数
2 u0
u21和
。e20 其中
u2即0 为
学校水平的方差成份, 为e学20 生水平的方差成份。
-卫生服务区域的资源、社会经济条件和政策会影响对病 人的服务质量
-高血压发病率可能有地区聚集性,取决于经济文化背景 和居民饮食习惯
2.重复测量结果通常具有强相关
-分子生物学研究中重复测量数据处理中的问题
3.区组设计和多中心试验
-卫生毒理实验研究中同窝动物的相似性 -同中心内病人病情、病种相似性
Chongqing Medical University Peng Bin
1.正态性不满足
-数据变换,增加样本含量
2.方差非齐性
-增加协变量 -数据变换 -广义线性模型或非线性模型
3.独立性不满足
-S.E.的稳健估计 -GEE估计方法 -拟合非独立性来源的模型
Chongqing Medical University Peng Bin
非独立性来源
1.区域环境对反应变量的影响
• 多水平模型将单一的随机误差项分解到与数据 层次结构相应的各水平上,具有多个随机误差 项并估计相应的残差方差及协方差。
• 构建与数据层次结构相适应的复杂误差结构, 是多水平模型区别于经典模型的根本特征
• 多水平模型由固定与随机两部分构成,其随机 部分可以包含解释变量
多水平模型基本结构
假定一个两水平的层次结构数据,学校为水平 2 单位,学生为水平 1 单位,学校为相应总体的 随机样本。
例如,来自同一家庭的子女,其生理和心理 特征较从一般总体中随机抽取的个体趋向于更为 相似,即子女特征在家庭中具有相似性或聚集性 (clustering),数据是非独立的(non independent)。
Chongqing Medical University Peng Bin
忽略多水平层次结构的后果
1.模型中的参数估计值、标准误有偏差 2.残差方差偏大,即模型拟合优度差 3.损失高水平(如水平二:学校)对结果的影响信息
Chongqing Medical University Peng Bin
基本的多水平模型
• 经典模型的基本假定是单一水平和单一的随机 误差项,并假定随机误差项独立、服从方差为 常量的正态分布,代表不能用模型解释的残留 的随机成份
j
,u1
j
为1
的随机成分
j
,
服从正态分布
E(u0 j ) 0, E(u1 j ) 0, E(eij ) 0,
Var(u0
j
)
2 u0
Var(u1
j
)
2 u1
Var(eij
)
2 e0
Chongqing Medical University Peng Bin
多水平模型基本结构
yij 0 j 1 j xij eij
相关文档
最新文档