多个样本均数比较的方差分析p
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SS总 3.6245 3.0917=0.5328
1 SS处理 (3.07 2 2.17 2 1.57 2 ) 3.0917 0.2280 5
1 SS区组 (1.982 1.502 1.052 0.932 1.352 ) 3.0917 0.2284 3
SS总 SS处理 SS区组 SS误差 总 处理 区组 误差
34
H0: 1 2 3 ,即三种不同药物作用后小 鼠肉瘤重量的总体均数相等 H1:三种不同药物作用后小白鼠肉瘤重量的总体 均数不全相等
0.05
C 6.812 /15 3.0917
分配结果 丙 乙 甲 甲 丙 乙 丙 乙 甲 乙 丙 甲 乙 甲 丙
31
例4-4
某研究者采用随机区组设计进行实
验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,
先将15只染有肉瘤小白鼠按体重大小配成5个区 组,每个区组内3只小白鼠随机接受三种抗癌药 物,以肉瘤的重量为指标,试验结果见表4-9。 问三种不同的药物的抑瘤效果有无差别?
Xi
1.6
1.23
2
方差分析的基本思想
将总变异分解为几个组成部分,其
自由度也分解为相应的几部分。
3
1 .总变异 反映所有测量值之间总的 变异程度。大小用离均差平方和 (sum of squares of deviations from mean,SS)表 示,即各测量值与总均数差值的平方和
SS总 X ij X X ij C
30
例4-3 如何按随机区组设计,分配5个区组的 15只小白鼠接受甲、乙、丙三种抗癌药物?
表4-6 5个区组小白鼠按随机区组设计分配结果
区组号 小白鼠 随机数 序 号 1 1 2 3 4 2 5 6 7 3 8 9 4 5
10 11 12 13 14 15
68 35 26 00 99 53 93 61 28 52 70 05 48 34 56 3 2 1 1 3 2 3 2 1 2 3 1 2 1 3
22
急性黄疸性肝炎病人的退黄天数
中药组 对照组 合 计
5
18
∶
17
∶
22 22 6 11
n
5
x x
x
13.4
67 1051
22.7
136 3162
18.45
203 4213
23
2
3. 计算 SS总 = 4213 (203) 2 / 11 466.727
67 136 203 SS组间 = 5 6 11
120 2.70 324.30
16
分析步骤:
1. 检验假设 H0:四个试验组的总体均数相等,
即: 1 2 3 4
备择假设 H1:四个试验组的总体均数不全
相等。
2. 显著性水准: 0.05
17
3. 计算
C (324.30)2 /120 876.42
SS总 958.52 876.42=82.10
27
方差分析与t检验的关系
当比较两个均数时,从同一资料算得之 F 值与t值有如下关系:
F = t2
可见在两组均数比较时,方差分析 与t检验的效果是完全一样的。
28
第三节 随机区组设计 资料的方差分析
29
随机区组设计 randomized block design
又称为配伍组设计,是配对设计的扩展 。具体做法是:先按影响试验结果的非处理 因素(如性别、体重、年龄、职业、病情、 病程等)将受试对象配成区组(block),再分 别将各区组内的受试对象随机分配到各处理 或对照组。
958.52
安慰剂组 3.53 4.59 4.34 2.66
3.43 102.91
2.72 2.70 1.97 81.46 80.94 58.99
2.4g组 4.8g组 7.2g组
2.42 3.36 4.32 2.34 2.86 2.28 2.39 2.28 0.89 1.06 1.08 1.27
合计
SS误差 0.5328 0.2280 0.2284 0.0764
35
表4-10
变异来源
总变异 处理间 区组间 误 差
方差分析表
SS
0.5328 0.2280 0.2284 0.0764 0.1140 0.0571 0.0096 11.88 5.95 <0.01 <0.05
自由度
14 2 4 8
2 2 2
=234.194
SS组内 = 466.427—234.194=232.233
24
4. 列方差分析表
表7 方差分析表 来源 SS df MS F 总 466.727 10 组间 234.194 1 234.194 9.076 组内 232.233 9 25.804
25
5. 查表作结论
由附表3得界值:
2 i 1 i 1
g
g
( X ij )
j 1
2
ni
C
5
3.组内变异
在同一处理组中,虽然每
个受试对象接受的处理相同,但测量值仍各
不相同,变异称为组内变异(误差)。组内 变异用组内各测量值与其所在组的均数的差 值的平方和表示,表示随机误差的影响。
g ni
SS组内 ( X ij X i )
19
5. 查表作结论
查附表3的F界值表:
F0.01(3, 116)≈3.98,F = 24.93> F0.01(3, 116), 所以P<0.01。 结论:按
0.05 ,拒绝H0,接受H1,认
为四个处理组患者低密度脂蛋白总体均数不相 等,即不同剂量药物对血脂中低密度脂蛋白降 低有影响。
20
F0.05, 1, 9=5.12 本例 F = 9.076> F0.05, 1,9 ,所以P<0.05。 结论:在
0.05 水准处拒绝H0,接受H1,
认为两组病人的退黄天数不同。
26
本例若用t检验 t = 3.012 > t 0.05, 9=2.262, 同样得到 P<0.05。 本例 F = 9.076,F0.05, 1,9 = 5.12
(102.91) (81.46) (80.94) (58.99) SS组间 30 30 30 30
2 2 2 2
876.42 32.16
SS组内 82.10 32.16 49.94
18
4. 列方差分析表
表4-5 方差分析表
变异来源 自由度 总变异 组间 组内 119 3 116 SS 82.10 32.16 49.94 10.72 0.43 24.93 <0.01 MS F P
37
第四节 拉丁方设计资料的方差分析
实验研究涉及一个处理因素和两个控制 因素,每个因素的类别数或水平数相等,可 采用拉丁方设计(latin square design)来安 排试验,将两个控制因素分别安排在拉丁方 设计的行和列上。
38
表4-11 拉丁方设计与试验结果(皮肤疱疹大小,mm2)
家兔编号 (行区组) 1 注射部位编号(列区组) 1 2 3 4 5 6 行区组 合计 424
2 2 i 1 j 1 i 1 j 1
g ni
g ni
C ( X ij ) / N
2 i 1 j 1
4
g ni
2.组间变异
各处理组由于接受处理的
水平不同,各组的样本均数也大小不等,
这种变异称为组间变异。其大小用各组均 数与总均数的离均差平方和表示
ni
SS组间 ni ( X i X )
11
应用条件
在进行多个均数比较时,要求:
1. 正态性 各样本是相互独立的随机样
本,均服从正态分布;
2. 方差齐性 相互比较的各样本的总体 方差相等,即具有方差齐性 。
12
第二节 完全随机设计 资料的方差分析
13
完全随机设计 (completely random design)
完全随机设计是采用完全随机化 的分组方法,将全部试验对象分配到g 个处理组(水平组),各组分别接受 相同的处理,试验结束后比较各组均 数之间的差别有无统计学意义,推论 处理因素的效应。
ni 2 SS组内 = ( xij xi ) = 0.54 i 1 j 1
k
7
总变异的分解
组间变异 组内变异
总变异
8
一般,组间变异大于或等于组内变异
组间变异 MS组间 F 组内变异 MS组内
其中: MS组间 SS组间 / df组间
MS组内 SS组内 / df组内
32
表4-9
区组 1
不同药物作用后小白鼠肉瘤重量(g)
A药 0.82 B药 0.65 C药 0.51
X ij
i 1
g
1.98
2
3 4 5
X ij
j 1 n
0.73
0.43 0.41 0.68 3.07
0.54
0.34 0.21 0.43 2.17
0.23
0.28 0.31 0.24 1.57
14
例4-1 为了研究一种降血脂新药的临床疗效, 按统一纳入标准选择120名患者,采用完全 随机设计方法将患者等分为4组进行双盲试 验。
表4-2 完全随机设计分组结果
编 号 随机数 1 2 3 4 5 6 7 8 9 10 … … 119 120 220 634
260 873 373 204 056 930 160 905 886 958
Xi
70.7
A(73) B(75) C(67) E(61) D(69) F(79)
2
3 4 5 6
B(83) A(81) E(99) F(82) C(85) D(87)
9
理论上,如果处理因素无统计学意义, F =1。 如果F >>1,说明处理因素有统 计学意义。
用 F 统计量比较两个方差的假设检验 称为F检验。F统计量服从F分布,有两个 自由度,即两个均方相应的自由度。
10
本例
MS组间 = 1.97 / 2 = 0.985 MS组内 = 0.54 / 21 = 0.026 F =0.985 / 0.026 = 37.88 查附表3得界值 F0.05, 2, 21=3.47 ,F0.01, 2, 21=5.78 所以 P<0.01,三组总体均数不全相等。
例 为观察中成药青黛明矾片对急性黄疸 性肝炎退黄效果,以单用输液保肝的病人作 对照进行了观察。
急性黄疸性肝炎病人的退黄天数 中药组 对照组 5 18 10 21 14 30 21 23 17 22 22
21
检验步骤:
1. 检验假设 H0: 1 2
备择假设 H1: 1 2 2. 显著性水准: 0.05
1.50
1.05 0.93 1.35 6.81
2 X ij j 1
n
Xi
0.614
2.0207
0.434
1.0587
0.314
0.5451
0.454
3.6245
33
变异wk.baidu.com解
(1) 总变异:反映所有观察值之间的变异。 (2) 处理间变异:由处理因素的不同水平作用和 随机误差产生的变异。 (3) 区组间变异:由不同区组作用和随机误差产 生的变异。 (4) 误差变异:完全由随机误差产生的变异。
MS
F
P
36
查界值表,得 F0.05(2,8)=4.46,F0.01(2,8)= 8.65 今F=11.88>F0.01(2, 8),故P<0.01。
结论:按 0.05 水准,拒绝 H0 ,认为三 种不同药物作用后小白鼠肉瘤重量的总体 均数不全相等,即不同药物的抑瘤效果有 差别。 当g=2时,随机区组设计方差分析与配对设 计资料的t 检验等价,有 t F 。
i 1 j 1
2
6
本例计算求得:
总离均差平方和
SS总 =
( x
i 1 j 1
k ni i 1 j 1
k
ni
ij
x ) = 2.51
2
k
组间离均差平方和
2 2 = 1.97 ( x x ) n ( x x ) SS组间 = i i i i 1
组内离均差平方和
序 号
结果
24
甲
106
丁
39
乙
15
甲
3
甲
114
丁
13
甲
109 108 117
丁 丁 丁
…
…
16
甲
75
丙
15
表4-3
分 组
4个处理组低密度脂蛋白测量值(mmol/L)
测量值
…
… … …
n
2.59 30
2.31 30 1.68 30 3.71 30
Xi
X
X2
367.85
233.00 225.54 132.13
第四章 多个样本均数比较 的方差分析
ANOVA ( Analysis of Variance )
1
三组战士行军后体温增加数(度)
不饮水 1.9 1.8 1.6 1.7 1.5 1.6 1.3 1.4 定量饮水 不限量饮水 1.4 0.9 1.2 0.7 1.1 0.9 1.4 1.1 1.1 0.9 1.3 0.9 1.1 0.8 1.0 1.0 1.2 0.9 合计
1 SS处理 (3.07 2 2.17 2 1.57 2 ) 3.0917 0.2280 5
1 SS区组 (1.982 1.502 1.052 0.932 1.352 ) 3.0917 0.2284 3
SS总 SS处理 SS区组 SS误差 总 处理 区组 误差
34
H0: 1 2 3 ,即三种不同药物作用后小 鼠肉瘤重量的总体均数相等 H1:三种不同药物作用后小白鼠肉瘤重量的总体 均数不全相等
0.05
C 6.812 /15 3.0917
分配结果 丙 乙 甲 甲 丙 乙 丙 乙 甲 乙 丙 甲 乙 甲 丙
31
例4-4
某研究者采用随机区组设计进行实
验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,
先将15只染有肉瘤小白鼠按体重大小配成5个区 组,每个区组内3只小白鼠随机接受三种抗癌药 物,以肉瘤的重量为指标,试验结果见表4-9。 问三种不同的药物的抑瘤效果有无差别?
Xi
1.6
1.23
2
方差分析的基本思想
将总变异分解为几个组成部分,其
自由度也分解为相应的几部分。
3
1 .总变异 反映所有测量值之间总的 变异程度。大小用离均差平方和 (sum of squares of deviations from mean,SS)表 示,即各测量值与总均数差值的平方和
SS总 X ij X X ij C
30
例4-3 如何按随机区组设计,分配5个区组的 15只小白鼠接受甲、乙、丙三种抗癌药物?
表4-6 5个区组小白鼠按随机区组设计分配结果
区组号 小白鼠 随机数 序 号 1 1 2 3 4 2 5 6 7 3 8 9 4 5
10 11 12 13 14 15
68 35 26 00 99 53 93 61 28 52 70 05 48 34 56 3 2 1 1 3 2 3 2 1 2 3 1 2 1 3
22
急性黄疸性肝炎病人的退黄天数
中药组 对照组 合 计
5
18
∶
17
∶
22 22 6 11
n
5
x x
x
13.4
67 1051
22.7
136 3162
18.45
203 4213
23
2
3. 计算 SS总 = 4213 (203) 2 / 11 466.727
67 136 203 SS组间 = 5 6 11
120 2.70 324.30
16
分析步骤:
1. 检验假设 H0:四个试验组的总体均数相等,
即: 1 2 3 4
备择假设 H1:四个试验组的总体均数不全
相等。
2. 显著性水准: 0.05
17
3. 计算
C (324.30)2 /120 876.42
SS总 958.52 876.42=82.10
27
方差分析与t检验的关系
当比较两个均数时,从同一资料算得之 F 值与t值有如下关系:
F = t2
可见在两组均数比较时,方差分析 与t检验的效果是完全一样的。
28
第三节 随机区组设计 资料的方差分析
29
随机区组设计 randomized block design
又称为配伍组设计,是配对设计的扩展 。具体做法是:先按影响试验结果的非处理 因素(如性别、体重、年龄、职业、病情、 病程等)将受试对象配成区组(block),再分 别将各区组内的受试对象随机分配到各处理 或对照组。
958.52
安慰剂组 3.53 4.59 4.34 2.66
3.43 102.91
2.72 2.70 1.97 81.46 80.94 58.99
2.4g组 4.8g组 7.2g组
2.42 3.36 4.32 2.34 2.86 2.28 2.39 2.28 0.89 1.06 1.08 1.27
合计
SS误差 0.5328 0.2280 0.2284 0.0764
35
表4-10
变异来源
总变异 处理间 区组间 误 差
方差分析表
SS
0.5328 0.2280 0.2284 0.0764 0.1140 0.0571 0.0096 11.88 5.95 <0.01 <0.05
自由度
14 2 4 8
2 2 2
=234.194
SS组内 = 466.427—234.194=232.233
24
4. 列方差分析表
表7 方差分析表 来源 SS df MS F 总 466.727 10 组间 234.194 1 234.194 9.076 组内 232.233 9 25.804
25
5. 查表作结论
由附表3得界值:
2 i 1 i 1
g
g
( X ij )
j 1
2
ni
C
5
3.组内变异
在同一处理组中,虽然每
个受试对象接受的处理相同,但测量值仍各
不相同,变异称为组内变异(误差)。组内 变异用组内各测量值与其所在组的均数的差 值的平方和表示,表示随机误差的影响。
g ni
SS组内 ( X ij X i )
19
5. 查表作结论
查附表3的F界值表:
F0.01(3, 116)≈3.98,F = 24.93> F0.01(3, 116), 所以P<0.01。 结论:按
0.05 ,拒绝H0,接受H1,认
为四个处理组患者低密度脂蛋白总体均数不相 等,即不同剂量药物对血脂中低密度脂蛋白降 低有影响。
20
F0.05, 1, 9=5.12 本例 F = 9.076> F0.05, 1,9 ,所以P<0.05。 结论:在
0.05 水准处拒绝H0,接受H1,
认为两组病人的退黄天数不同。
26
本例若用t检验 t = 3.012 > t 0.05, 9=2.262, 同样得到 P<0.05。 本例 F = 9.076,F0.05, 1,9 = 5.12
(102.91) (81.46) (80.94) (58.99) SS组间 30 30 30 30
2 2 2 2
876.42 32.16
SS组内 82.10 32.16 49.94
18
4. 列方差分析表
表4-5 方差分析表
变异来源 自由度 总变异 组间 组内 119 3 116 SS 82.10 32.16 49.94 10.72 0.43 24.93 <0.01 MS F P
37
第四节 拉丁方设计资料的方差分析
实验研究涉及一个处理因素和两个控制 因素,每个因素的类别数或水平数相等,可 采用拉丁方设计(latin square design)来安 排试验,将两个控制因素分别安排在拉丁方 设计的行和列上。
38
表4-11 拉丁方设计与试验结果(皮肤疱疹大小,mm2)
家兔编号 (行区组) 1 注射部位编号(列区组) 1 2 3 4 5 6 行区组 合计 424
2 2 i 1 j 1 i 1 j 1
g ni
g ni
C ( X ij ) / N
2 i 1 j 1
4
g ni
2.组间变异
各处理组由于接受处理的
水平不同,各组的样本均数也大小不等,
这种变异称为组间变异。其大小用各组均 数与总均数的离均差平方和表示
ni
SS组间 ni ( X i X )
11
应用条件
在进行多个均数比较时,要求:
1. 正态性 各样本是相互独立的随机样
本,均服从正态分布;
2. 方差齐性 相互比较的各样本的总体 方差相等,即具有方差齐性 。
12
第二节 完全随机设计 资料的方差分析
13
完全随机设计 (completely random design)
完全随机设计是采用完全随机化 的分组方法,将全部试验对象分配到g 个处理组(水平组),各组分别接受 相同的处理,试验结束后比较各组均 数之间的差别有无统计学意义,推论 处理因素的效应。
ni 2 SS组内 = ( xij xi ) = 0.54 i 1 j 1
k
7
总变异的分解
组间变异 组内变异
总变异
8
一般,组间变异大于或等于组内变异
组间变异 MS组间 F 组内变异 MS组内
其中: MS组间 SS组间 / df组间
MS组内 SS组内 / df组内
32
表4-9
区组 1
不同药物作用后小白鼠肉瘤重量(g)
A药 0.82 B药 0.65 C药 0.51
X ij
i 1
g
1.98
2
3 4 5
X ij
j 1 n
0.73
0.43 0.41 0.68 3.07
0.54
0.34 0.21 0.43 2.17
0.23
0.28 0.31 0.24 1.57
14
例4-1 为了研究一种降血脂新药的临床疗效, 按统一纳入标准选择120名患者,采用完全 随机设计方法将患者等分为4组进行双盲试 验。
表4-2 完全随机设计分组结果
编 号 随机数 1 2 3 4 5 6 7 8 9 10 … … 119 120 220 634
260 873 373 204 056 930 160 905 886 958
Xi
70.7
A(73) B(75) C(67) E(61) D(69) F(79)
2
3 4 5 6
B(83) A(81) E(99) F(82) C(85) D(87)
9
理论上,如果处理因素无统计学意义, F =1。 如果F >>1,说明处理因素有统 计学意义。
用 F 统计量比较两个方差的假设检验 称为F检验。F统计量服从F分布,有两个 自由度,即两个均方相应的自由度。
10
本例
MS组间 = 1.97 / 2 = 0.985 MS组内 = 0.54 / 21 = 0.026 F =0.985 / 0.026 = 37.88 查附表3得界值 F0.05, 2, 21=3.47 ,F0.01, 2, 21=5.78 所以 P<0.01,三组总体均数不全相等。
例 为观察中成药青黛明矾片对急性黄疸 性肝炎退黄效果,以单用输液保肝的病人作 对照进行了观察。
急性黄疸性肝炎病人的退黄天数 中药组 对照组 5 18 10 21 14 30 21 23 17 22 22
21
检验步骤:
1. 检验假设 H0: 1 2
备择假设 H1: 1 2 2. 显著性水准: 0.05
1.50
1.05 0.93 1.35 6.81
2 X ij j 1
n
Xi
0.614
2.0207
0.434
1.0587
0.314
0.5451
0.454
3.6245
33
变异wk.baidu.com解
(1) 总变异:反映所有观察值之间的变异。 (2) 处理间变异:由处理因素的不同水平作用和 随机误差产生的变异。 (3) 区组间变异:由不同区组作用和随机误差产 生的变异。 (4) 误差变异:完全由随机误差产生的变异。
MS
F
P
36
查界值表,得 F0.05(2,8)=4.46,F0.01(2,8)= 8.65 今F=11.88>F0.01(2, 8),故P<0.01。
结论:按 0.05 水准,拒绝 H0 ,认为三 种不同药物作用后小白鼠肉瘤重量的总体 均数不全相等,即不同药物的抑瘤效果有 差别。 当g=2时,随机区组设计方差分析与配对设 计资料的t 检验等价,有 t F 。
i 1 j 1
2
6
本例计算求得:
总离均差平方和
SS总 =
( x
i 1 j 1
k ni i 1 j 1
k
ni
ij
x ) = 2.51
2
k
组间离均差平方和
2 2 = 1.97 ( x x ) n ( x x ) SS组间 = i i i i 1
组内离均差平方和
序 号
结果
24
甲
106
丁
39
乙
15
甲
3
甲
114
丁
13
甲
109 108 117
丁 丁 丁
…
…
16
甲
75
丙
15
表4-3
分 组
4个处理组低密度脂蛋白测量值(mmol/L)
测量值
…
… … …
n
2.59 30
2.31 30 1.68 30 3.71 30
Xi
X
X2
367.85
233.00 225.54 132.13
第四章 多个样本均数比较 的方差分析
ANOVA ( Analysis of Variance )
1
三组战士行军后体温增加数(度)
不饮水 1.9 1.8 1.6 1.7 1.5 1.6 1.3 1.4 定量饮水 不限量饮水 1.4 0.9 1.2 0.7 1.1 0.9 1.4 1.1 1.1 0.9 1.3 0.9 1.1 0.8 1.0 1.0 1.2 0.9 合计