5-SPSS重复测量资料的统计分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
推广到空间(spatial)。 例如:
同一母鼠所生的仔鼠;
同一家庭的不同成员; 同一患者的两个不同膝关节; 同一肿瘤患者的不同肿块; 同一条河流的不同采样点。
2013-8-15 7
Part Ⅰ:Introduction
非独立数据 (non-independent data)
=0 .6517
Mauc hl y 球 形 性 检 验 得 : P =0 .0015 ,, 所 以 应 采 用 G- G 法 或 H- F 法 校 正 结 果
2013-8-15
21
Part Ⅱ:Method 目前常用的统计分析方法(一)
重复测量资料的方差分析
该方法的弊端 球形条件
在很多临床试验中,一般不允许出现交互作用? ? ?
不允许出现缺失值 时间等距
数据平衡
不满足球性检验的资料,当结果与其他方法有差异时,下结论 应慎重。
2013-8-15 22
Part Ⅱ:Method 目前常用的统计分析方法(一)
重复测量资料的方差分析
不等距重复测量资料的统计分析方法: 如果将不等距重复测量设计资料按等距处理,不仅 会损失数据中所蕴涵的关于重复测量因素的信息, 而且会造成变化趋势分析结果的偏性,甚至会出现 错误的分析结论。
outline
Part Ⅰ:Introduction(简介)
What are repeated measurements How are they different
Why are they important
Part Ⅱ:Methods(统计分析方法) Repeated measures ANOVA- General Linear Model
1 21 R 31 41 51
12
1
13 23
1
32 42 52
14 24 34
1
43 53
54
15 25 35 45
1
2013-8-15
16
Part Ⅱ:Method
Part Ⅰ:Introduction
相关结构-2 相邻相关(stationary 1-dependence)
1 1 R0 0 0
1
1
0
0 0
2
1
2
0 0
3
1
3
0
4
0 0 0 4 1
1 R 0 0 0
2013-8-15 8
Part Ⅰ:Introduction
重复测量数据、非独立数据
日益重要
应用广泛
2013-8-15
9
important
Most Reliable
Randomized Controlled Trial Non-randomized Controlled Trial
4 4 4
1
2
3
t t
4 t3 5 t3
1
t t t t t t t t
5
t
5 t4
5 2 5 3 5 4 1
1
2013-8-15
15
Part Ⅰ:Introduction
相关结构-4 非确定相关(unstructured, general structure)
2013-8-15 5
Part Ⅰ:Introduction
重复测量资料的特点
由于重复测量资料不同时点的测量值之间具有相关性,
且随机误差分布于不同的层次,其不同于以往我们所熟 悉的数据形式-独立数据结构。
2013-8-15
6
Part Ⅰ:Introduction
重复测量概念的推广
重复测量的概念不仅仅是时间上(temporal)的,也可以
2013-8-15
12
Part Ⅰ:Introduction
相关结构-1
等相关(exchangeable, compound symmetry)
1 R
2013-8-15
1
1
1
1
13
/CRITERIA=ALPHA (.05)
/WSDESIGN=time /DESIGN=treat
2013-8-15
24
Part Ⅱ:Method 目前常用的统计分析方法(一)
重复测量资料的方差分析
趋势分析(trend analysis) 一般采用正交多项式(polynomial)分析某处理因素 的均数随时间的变化情况。 正交多项式变换的对比方法:将两组资料转变为两 条正交多项式曲线,检验这两条曲线的参数是否来 自同一总体。
将n个患者的几次不同观察均作为因变量,时间以及其他变量作为
自变量,样本含量为 N ki ,拟合线性(或广义线性)模型。将 非独立数据当做独立数据看待,增加假阳性。
2013-8-15 17
Part Ⅱ:Method 目前常用的统计分析方法(一)
重复测量资料的方差分析
一般线性模型(general linear model) 前提条件:
mixed effects mode1s
generalized linear models,GLMs –GEE Multilevel Models for Repeated Measurement Data
2013-8-15 1
Part Ⅰ:Introduction 重复测量资料(repeated measurements)
Cohort Study
Cross-sectional, case-control study Case Series
Case Report
Least Reliable
2013-8-15 10
Widely Use
Annual searches for keyword longitudinal in online citation databases
正态性
方差齐 独立性
协方差阵满足球形条件
不满足球形条件:Greenhouse-Geisser校正系数和HuynhFeldt矫正系数,最小极限矫正系数。
2013-8-15 18
表 1 剂型 (i) 受试者 k 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8
某 药 两 种 不 同 剂 型 在 血 中 的 浓 度 ( g / ml ) 1(0h) 9.73 5.50 7.96 2.37 2.37 6.50 8.34 1.80 14.66 0.84 0.68 2.14 2.30 6.17 2.45 1.58 服 药 后 测 定 时 间 ( j) 2(2h) 3(4h) 4(6h) 54.61 55.91 46.81 50.87 79.90 62.37 23.43 64.10 56.00 18.65 73.10 76.05 55.24 93.35 65.47 32.08 73.45 76.27 132.1 102.0 97.83 5.40 85.80 73.95 29.00 48.88 52.24 25.00 53.80 44.25 17.34 64.56 61.60 14.10 69.77 66.65 53.40 73.83 62.00 25.85 45.80 53.25 53.30 58.80 57.80 44.00 30.30 70.20 5(8h) 47.56 55.03 45.15 60.80 62.37 60.23 92.83 60.14 31.65 32.38 55.80 54.43 57.31 47.95 71.10 67.06
重复测量资料(repeated measurements)
重复测量设计-受试者内设计(within-subject design) 是指同一观察对象的某观察指标在相继的不同时间点上 进行的多次观察。
源自文库
2013-8-15
2
Part Ⅰ:Introduction
重复测量的数据结构1
固定重复时间
1
0
0 0
1
0 0
1
0
0 0 0 1
2013-8-15
14
Part Ⅰ:Introduction
相关结构-3
自相关(autocorrelation)
1 R 2 3 4
1
2
1
2 3
3 2
1
2
2013-8-15
23
Part Ⅱ:Method 目前常用的统计分析方法(一)
不等距重复测量资料的统计分析方法: 应用spss程序 GLM time1…time K BY treat
/ WSFACTOR=time k Polynomial(t1…tk)
/METHOD=SSTYPE(3) /PLOT=PROFILE (time*treat) PRINT=ETASQ HOMOGENEITY
19
胶 囊 型 i=1
片 剂 型 i=2
2013-8-15
2013-8-15
20
表 2
变 异 来 源 离 均 差 平 方 和 df
方差分析表
调 整 概 率 均 方 F P G-G 法 H-F 法
对 象 间 组 间 (剂 型 ) 误 差 对 象 内 组 内 (时 间 ) 剂 型 误 差 合 计
11799.36 2635 .81 9163 .55 54380.62 41880.79 951 .19 11548.64 66179.98
2013-8-15 11
Part Ⅰ:Introduction
重复测量数据、非独立数据组内相关结构
等相关(exchangeable, compound symmetry) 相邻相关(stationary 1-dependence)
自相关(autocorrelation)
非确定相关(unstructured, general structure)
4 3 2
1
1 t2 t1 R t3 t1 t4 t1 t5 t1
t t t t
2 t1
1
3 t2 4 t2 5 t2
t t t t
3 3
1
2
1
t t t t t t
传统方法及其弊端
对平衡的重复测量资料,分别在各时间点上进行分析。孤立地看
待各时点数据,增加I型误差。 将各个体的几次不同观察值相加,得到该个体的一个综合值,再 进行比较分析(aggregated analysis)。人为地减少误差,它忽略了对 不同来源的变异的分析;未考虑观察值在时间上的变化规律,也 未考虑其他协变量与时间的交互作用对结果的影响。损失了很多 信息。
15 1 14 64 4 4 56 79
26 35 .81 654 .54
4 .03
0.0645
10470 .20 237.8 0 206 .12
50.77 1 .15
0.0001 0.3413
<.0001
<.0001
时 间
0.3312
0.3366
ˆ G r e e n h o u s e - G e i s s e r = 0 . 5 1 7 2 , H u y n h - F e l d t
t12 t13 t22 t14 t15 t16 t23 t32 t24
ID4
t41 t42
t43
t44
t45
t46
2013-8-15
4
Part Ⅰ:Introduction
重复测量资料的特点
在相继的不同时间点上进行的多次观察不是随机确定的;
重复测量值之间具有相关性-即数据是非独立的。
独立?! 非独立数据?!
非独立的数据(non-independent data),是指数据中
某观察指标(某变量)在个体与个体之间、或同一个体的 每次观察间不独立或不完全独立。
非独立性的大小可以用组内相关(intra-class correlation)
来度量 。 重复测量资料属于非独立数据中的一种。 常见的非独立数据:纵向数据(Longitudinal data)、多 中心试验数据、遗传学数据等
t1 ID1 ID2 ID3 × × × t2 × … × t3 × × … t4 … × × t5 × × × t6 × × ×
ID4
×
×
×
×
…
…
2013-8-15
3
Part Ⅰ:Introduction
重复测量的数据结构2
不固定重复时间
ID1 ID2 ID3 t11 t21 t31
· · · ·· · · · · · ·
同一母鼠所生的仔鼠;
同一家庭的不同成员; 同一患者的两个不同膝关节; 同一肿瘤患者的不同肿块; 同一条河流的不同采样点。
2013-8-15 7
Part Ⅰ:Introduction
非独立数据 (non-independent data)
=0 .6517
Mauc hl y 球 形 性 检 验 得 : P =0 .0015 ,, 所 以 应 采 用 G- G 法 或 H- F 法 校 正 结 果
2013-8-15
21
Part Ⅱ:Method 目前常用的统计分析方法(一)
重复测量资料的方差分析
该方法的弊端 球形条件
在很多临床试验中,一般不允许出现交互作用? ? ?
不允许出现缺失值 时间等距
数据平衡
不满足球性检验的资料,当结果与其他方法有差异时,下结论 应慎重。
2013-8-15 22
Part Ⅱ:Method 目前常用的统计分析方法(一)
重复测量资料的方差分析
不等距重复测量资料的统计分析方法: 如果将不等距重复测量设计资料按等距处理,不仅 会损失数据中所蕴涵的关于重复测量因素的信息, 而且会造成变化趋势分析结果的偏性,甚至会出现 错误的分析结论。
outline
Part Ⅰ:Introduction(简介)
What are repeated measurements How are they different
Why are they important
Part Ⅱ:Methods(统计分析方法) Repeated measures ANOVA- General Linear Model
1 21 R 31 41 51
12
1
13 23
1
32 42 52
14 24 34
1
43 53
54
15 25 35 45
1
2013-8-15
16
Part Ⅱ:Method
Part Ⅰ:Introduction
相关结构-2 相邻相关(stationary 1-dependence)
1 1 R0 0 0
1
1
0
0 0
2
1
2
0 0
3
1
3
0
4
0 0 0 4 1
1 R 0 0 0
2013-8-15 8
Part Ⅰ:Introduction
重复测量数据、非独立数据
日益重要
应用广泛
2013-8-15
9
important
Most Reliable
Randomized Controlled Trial Non-randomized Controlled Trial
4 4 4
1
2
3
t t
4 t3 5 t3
1
t t t t t t t t
5
t
5 t4
5 2 5 3 5 4 1
1
2013-8-15
15
Part Ⅰ:Introduction
相关结构-4 非确定相关(unstructured, general structure)
2013-8-15 5
Part Ⅰ:Introduction
重复测量资料的特点
由于重复测量资料不同时点的测量值之间具有相关性,
且随机误差分布于不同的层次,其不同于以往我们所熟 悉的数据形式-独立数据结构。
2013-8-15
6
Part Ⅰ:Introduction
重复测量概念的推广
重复测量的概念不仅仅是时间上(temporal)的,也可以
2013-8-15
12
Part Ⅰ:Introduction
相关结构-1
等相关(exchangeable, compound symmetry)
1 R
2013-8-15
1
1
1
1
13
/CRITERIA=ALPHA (.05)
/WSDESIGN=time /DESIGN=treat
2013-8-15
24
Part Ⅱ:Method 目前常用的统计分析方法(一)
重复测量资料的方差分析
趋势分析(trend analysis) 一般采用正交多项式(polynomial)分析某处理因素 的均数随时间的变化情况。 正交多项式变换的对比方法:将两组资料转变为两 条正交多项式曲线,检验这两条曲线的参数是否来 自同一总体。
将n个患者的几次不同观察均作为因变量,时间以及其他变量作为
自变量,样本含量为 N ki ,拟合线性(或广义线性)模型。将 非独立数据当做独立数据看待,增加假阳性。
2013-8-15 17
Part Ⅱ:Method 目前常用的统计分析方法(一)
重复测量资料的方差分析
一般线性模型(general linear model) 前提条件:
mixed effects mode1s
generalized linear models,GLMs –GEE Multilevel Models for Repeated Measurement Data
2013-8-15 1
Part Ⅰ:Introduction 重复测量资料(repeated measurements)
Cohort Study
Cross-sectional, case-control study Case Series
Case Report
Least Reliable
2013-8-15 10
Widely Use
Annual searches for keyword longitudinal in online citation databases
正态性
方差齐 独立性
协方差阵满足球形条件
不满足球形条件:Greenhouse-Geisser校正系数和HuynhFeldt矫正系数,最小极限矫正系数。
2013-8-15 18
表 1 剂型 (i) 受试者 k 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8
某 药 两 种 不 同 剂 型 在 血 中 的 浓 度 ( g / ml ) 1(0h) 9.73 5.50 7.96 2.37 2.37 6.50 8.34 1.80 14.66 0.84 0.68 2.14 2.30 6.17 2.45 1.58 服 药 后 测 定 时 间 ( j) 2(2h) 3(4h) 4(6h) 54.61 55.91 46.81 50.87 79.90 62.37 23.43 64.10 56.00 18.65 73.10 76.05 55.24 93.35 65.47 32.08 73.45 76.27 132.1 102.0 97.83 5.40 85.80 73.95 29.00 48.88 52.24 25.00 53.80 44.25 17.34 64.56 61.60 14.10 69.77 66.65 53.40 73.83 62.00 25.85 45.80 53.25 53.30 58.80 57.80 44.00 30.30 70.20 5(8h) 47.56 55.03 45.15 60.80 62.37 60.23 92.83 60.14 31.65 32.38 55.80 54.43 57.31 47.95 71.10 67.06
重复测量资料(repeated measurements)
重复测量设计-受试者内设计(within-subject design) 是指同一观察对象的某观察指标在相继的不同时间点上 进行的多次观察。
源自文库
2013-8-15
2
Part Ⅰ:Introduction
重复测量的数据结构1
固定重复时间
1
0
0 0
1
0 0
1
0
0 0 0 1
2013-8-15
14
Part Ⅰ:Introduction
相关结构-3
自相关(autocorrelation)
1 R 2 3 4
1
2
1
2 3
3 2
1
2
2013-8-15
23
Part Ⅱ:Method 目前常用的统计分析方法(一)
不等距重复测量资料的统计分析方法: 应用spss程序 GLM time1…time K BY treat
/ WSFACTOR=time k Polynomial(t1…tk)
/METHOD=SSTYPE(3) /PLOT=PROFILE (time*treat) PRINT=ETASQ HOMOGENEITY
19
胶 囊 型 i=1
片 剂 型 i=2
2013-8-15
2013-8-15
20
表 2
变 异 来 源 离 均 差 平 方 和 df
方差分析表
调 整 概 率 均 方 F P G-G 法 H-F 法
对 象 间 组 间 (剂 型 ) 误 差 对 象 内 组 内 (时 间 ) 剂 型 误 差 合 计
11799.36 2635 .81 9163 .55 54380.62 41880.79 951 .19 11548.64 66179.98
2013-8-15 11
Part Ⅰ:Introduction
重复测量数据、非独立数据组内相关结构
等相关(exchangeable, compound symmetry) 相邻相关(stationary 1-dependence)
自相关(autocorrelation)
非确定相关(unstructured, general structure)
4 3 2
1
1 t2 t1 R t3 t1 t4 t1 t5 t1
t t t t
2 t1
1
3 t2 4 t2 5 t2
t t t t
3 3
1
2
1
t t t t t t
传统方法及其弊端
对平衡的重复测量资料,分别在各时间点上进行分析。孤立地看
待各时点数据,增加I型误差。 将各个体的几次不同观察值相加,得到该个体的一个综合值,再 进行比较分析(aggregated analysis)。人为地减少误差,它忽略了对 不同来源的变异的分析;未考虑观察值在时间上的变化规律,也 未考虑其他协变量与时间的交互作用对结果的影响。损失了很多 信息。
15 1 14 64 4 4 56 79
26 35 .81 654 .54
4 .03
0.0645
10470 .20 237.8 0 206 .12
50.77 1 .15
0.0001 0.3413
<.0001
<.0001
时 间
0.3312
0.3366
ˆ G r e e n h o u s e - G e i s s e r = 0 . 5 1 7 2 , H u y n h - F e l d t
t12 t13 t22 t14 t15 t16 t23 t32 t24
ID4
t41 t42
t43
t44
t45
t46
2013-8-15
4
Part Ⅰ:Introduction
重复测量资料的特点
在相继的不同时间点上进行的多次观察不是随机确定的;
重复测量值之间具有相关性-即数据是非独立的。
独立?! 非独立数据?!
非独立的数据(non-independent data),是指数据中
某观察指标(某变量)在个体与个体之间、或同一个体的 每次观察间不独立或不完全独立。
非独立性的大小可以用组内相关(intra-class correlation)
来度量 。 重复测量资料属于非独立数据中的一种。 常见的非独立数据:纵向数据(Longitudinal data)、多 中心试验数据、遗传学数据等
t1 ID1 ID2 ID3 × × × t2 × … × t3 × × … t4 … × × t5 × × × t6 × × ×
ID4
×
×
×
×
…
…
2013-8-15
3
Part Ⅰ:Introduction
重复测量的数据结构2
不固定重复时间
ID1 ID2 ID3 t11 t21 t31
· · · ·· · · · · · ·