北京大学医学部医学统计学进阶1第2讲 重复测量资料的方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模型:Yij=μ+αi+βj+εij 其中:Yij表示第i个受试对象组的第j个时间点的观察 值,μ表示总体均数,αi表示受试者间效应, βj表示 个体内(第j时间点)的效应, εij表示各个观察值的 随机误差。
i=1,2,…,n, j=1,2,…,p
变异分解:SS总=SS受试者间+SS受试者内+SS误差
如果球形条件不满足
常有以下两种方法解决:
1. 采用MANOVA(多变量方差分析方法)
2. 对重复测量ANOVA检验结果中与时间有 关的F值的自由度进行调整(调小)
(1)Geenhouse-Geisser 调 整 系 数 (2)Huynh-Feldt 调 整 系 数 (H-F (G-G ) )
' 分 子 自 由 度 1' 1 , 分 母 自 由 度 2 2
6.50
6.00
血糖浓度(mmol/L)
5.50
5.00
4.50
4.00 0 45 90 135 时间(分)
图2 8名受试者在放置不同时间的血滤液所含血糖浓度(mmol/L)平 均值
重复测量资料的方差分析思想:
将 总 变 异 分 解 为 个 体 间 ( between subjects)变异与 个体内(within subject)变 异,其中个体内变异是与重复因素有关的变 量。
2 s11 2 s21 V s2 p1 2 s12 2 s22 s22 p
... s12p 2 ... s2 p 2 ... s pp
上式主对角线元素表示各时间点上的方差,其它元素表示不同时 间点之间的协方差。
协方差阵符合球形性质是指该矩阵主对角 元素相等、非主对角元素(协方差)为零。 协方差相等也表示相关系数相等,即不同 时间点不存在相关。 对于重复测量资料来说,上述条件可适当 放宽,符合Huynh-Feldt条件即可,即 ss2jj+ss2kk-2s2jk=c,其中c为常数。称为协方 差矩阵具备H型结构
分子自由度:0.647×3≈2 b. 分母自由度:0.647×21≈14 Design: Intercept Within Subjects Design: time 查F界值表得调整后的F界值为:F0.05(2,14)=3.74(大于调整前 的F界值) 本例F=51.18>F界值,故P<0.05,不同时间点的血糖浓度有区 别
重复测量资料的方差分析
王海俊 北京大学公共卫生学院
成组设计(单因素)方差分析
例1. 试比较下列各组鼠脾中DNA含量(mg/g)有无差别?
表1. 不同类型白血病鼠脾中DNA含量(mg/g)(脾DNA.sav) DNA含量(mg/g) 正常鼠 自发性白血病鼠 移植白血病鼠 12.3,13.2,13.7,15.2,15.4,15.8,16.9,17.3 10.8,11.6,12.3,12.7,13.5,13.5,14.8 9.8,10.3,11.1,11.7,11.7,12.0,12.3,12.4,13.6
F
P
3 7 21 31
51.187 <0.001
此计算结果和配伍设计的方差分析结果完全一致, 但前面所做球形检验结果表明球形性不满足,所以不 能直接使用,需要调整自由度。
Mauchly's Test of Sphericityb Measure: MEASURE_1 Epsilon Within Subjects Effect time Mauchly's W .106 Approx. Chi-Square 12.818 df 5 Sig. .027 Greenhous e-Geisser .647
SS总 (Yij Y ) 2
i
n i
n
p
ν总=np-1
j
SS受试者间 p(Y i Y ) 2
ν受ቤተ መጻሕፍቲ ባይዱ者间=n-1
ν 受试者内=p-1 ν误差=(n-1)(p-1)
SS受试者内 n (Y j Y ) 2
j
p
SS误差 SS总 SS受试者间 SS总受试者内
第二节 单因素重复测量资料的 方差分析
根据上述例2数据,画出全部8名受试对象的血糖浓 度随时间变化的线图如下:
6.50
6.00
血糖浓度(mmol/L)
5.50 5.00
4.50
4.00 0 45 90 135 时间(分)
图1 8名受试者放置不同时间的血滤液所含血糖浓度(mmol/L)
根据上述例2数据,画出全部8名受试对象的血糖浓度均数随时间 变化的线图如下:
5.38
5.61 5.38 5.00
4.88
5.22 4.88 4.44
配伍设计(双因素)方差分析
模型:Yij=μ+αi+βj+εij 其中:Yij表示第i组的第j个观察值,μ表示总体均数,αi表示 处理因素第i组的效应, βi表示配伍因素第j组的效应, εij表 示各个观察值的随机误差。
变异分解:SS总=SS处理组+SS配伍组+SS误差
受试者编号 j 1 0 5.27 45 5.27 放置时间(分)(i) 90 4.49 135 4.61
2
3 4
5.27
5.88 5.44
5.22
5.83 5.38
4.88
5.38 5.27
4.66
5.00 5.00
5
6 7 8
5.66
6.22 5.83 5.27
5.44
6.22 5.72 5.11
a
Huynh-Feldt .891
Lower-bound .333
Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity matrix. a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in 根据Greenhouse-Geisser系数0.647调整自由度: the Tests of Within-Subjects Effects table.
球形对称的检验
用Mauchly法检验协方差阵是否为H形
H0:资料符合球形要求 计算得到的P值若大于显著性水准α时 ,说明协方差阵的球形性质得到满足。
例2.放置不同时间的血滤液所含血糖浓度(mmol/L)是否有区别?
受试者编号 i 1 0 5.27 45 5.27 放置时间(分)(j) 90 4.49 135 4.61
表3. 配伍组设计方差分析计算表
离均差 平方和 总变异 SS 总
处理间 配伍间
变异 来源
自由度
均方 MS
F
N–1 k–1 b–1
SS 处理 SS 配伍 SS 误差
总
ss
ss
配伍
处理
配伍
处理
配伍
MS
MS
处理
MS
MS
误差
配伍
误差
误差
处理
ss
误差
误差
表4. 配伍组设计方差分析结果
a
Huynh-Feldt .891
Lower-bound .333
Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity matrix. a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of Within-Subjects Effects table. b. Design: Intercept Within Subjects Design: time
如果重复测量数据之间实际上不存在相关性,则一元 和多元方差分析的结果是一致的,这时称数据符合 Huynh-Feldt条件。
第一节 重复测量资料方差分析 对协方差阵的要求
重复测量资料方差分析的条件: 1. 正态性 处理因素的各处理水平的总体均数服从正态分布; 2. 方差齐性 相互比较的各处理水平的总体方差相等; 3. 各时间点组成的协方差阵(covariance matrix)具有球形性 (sphericity)特征(符合Huynh-Feldt条件)。 。
2
3 4 5 6
5.27
5.88 5.44 5.66 6.22
5.22
5.83 5.38 5.44 6.22
4.88
5.38 5.27 5.38 5.61
4.66
5.00 5.00 4.88 5.22
7
8
5.83
5.27
5.72
5.11
5.38
5.00
4.88
4.44
SPSS球形检验结果如下图所示,P=0.027<0.05, 资料不符合Huynh-Feldt条件,不满足球形性要求。
b Mauchly's Test of Sphericity
Measure: MEASURE_1 Epsilon Within Subjects Effect time Mauchly's W .106 Approx. Chi-Square 12.818 df 5 Sig . .027 Greenhous e-Geisser .647
变异 来源
处理间 配伍间 误 差 总变异
离均差 平方和 SS 2.985 2.791 0.408 6.184
自由度
均方 MS 0.995 0.399 0.019
F 51.187 20.509
P <0.001 <0.001
3 7 21 31
本资料用双因素方差分析存在的问题:同一 个体在不同时间点的测量值具有相关性。 (血糖浓度2.sav)
分析步骤(例2资料): 检验假设:令μj为第j时间点反应变量的总体均数, H0: μ1= μ2=…=μp H0: μj≠ μk,至少有一个不等式成立 α=0.05
变异来源 受试者内 受试者间 误 差 总变异 离均差 平方和 SS 2.9852 2.7909 0.4083 6.1844 自由度
均方 MS 0.9951 0.3987 0.0194
Box(1954)指出,若球形性质得不到满足,则方差分析 的F值是有偏的,这会造成过多的拒绝本来是真的无效假设 (即增加了I型错误)。
协方差矩阵的球形性
有n个受试对象,p个测量时间点,设j、k为两个测量时点, s2jk代表协方差阵中的元素。当j=k时为方差,j≠k时为协方差。 则全部方差和协方差按时点顺序排成协方差阵V为:
模型:Yij=μ+αi+εij 其中:Yij表示第i组的第j个观察值,μ表示总体均数,αi表 示第i组的效应,εij表示各个观察值的随机误差。 变异分解:SS总=SS组间+SS组内 或: SS总=SS处理+SS误差
配伍设计(双因素)方差分析
例2. 放置不同时间的血滤液所含血糖浓度是否有区别?
表2. 放置不同时间的血滤液所含血糖浓度(mmol/L) (血糖浓度1.sav)
SPSS输出结果:(血糖浓度2.sav)
Tests of W ithin-Subjects Effects Measure: MEASURE_1 Source factor1 Type III Sum of Sq uares 2.985 2.985 2.985 2.985 .408 .408 .408 .408 df 3 1.940 2.673 1.000 21 13.582 18.708 7.000 Mean Square .995 1.539 1.117 2.985 .019 .030 .022 .058 F 51.187 51.187 51.187 51.187 Sig . .000 .000 .000 .000
表5. 时间 (分) 0 45 90 例2中各时间点血糖浓度的相关系数 0 1.00 0.98 0.84 45 0.98 1.00 0.76 90 0.84 0.76 1.00 135 0.86 0.87 0.80
135
0.86
0.87
0.80
1.00
重复测量资料
重复测量(repeated measure)是指对同一研究对象的 同一观察指标在不同时间(或地点、实验条件等)进行的 多次测量。 同一个体在不同时间的测量常常具有相关性,不满 足一元方差分析对独立性的要求,需要对结果进行校正。