医学统计学 -第08章 方差分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 方差分析的基本思想
看一个例子
例8-1 为研究钙离子对体重的影响作用,某研究者将36 只肥胖模型大白鼠随机分为三组,每组12只,分别给 予高脂正常剂量钙(0.5%)、高脂高剂量钙(1.0%)和高 脂高剂量钙(1.5%)三种不同的饲料,喂养9周,测其 喂养前后体重的差值。问三组不同喂养方式下大白鼠 体重改变是否不同?
• 三种喂养方式体重改变的平均值各不相同,这种变异 称为组间变异
•
是组内均值
X
与总均值
i
X
之差的平方和
360
340
组间变异反映了:
320
三种喂养方式的差异(影响), 300
同时也包含了随机误差。
280
260
240
k ni
220
SS组间
(Xi X )2
200
i1 j
180
X甲
X
X乙
X丙
甲
乙
丙
3、组内变异(SS组内,variation within groups)
0.05
2、根据公式计算SS、MS及F值,列于方差分析表内(计 算过程省略)
变异来源 总变异 组间 组内(误差)
完全随机设计的方差分析表
平方和 SS 自由度
均方MS
47758.32
35
31291.67
2
15645.83
16466.65
33
498.99
F值
31.36
3、确定P值,作出判断
分子自由度=k-1=2,分母自由度=n-k=33,查F 界值表(方差分析用)
表 8-1 三种不同喂养方式下大白鼠体重喂养前后差值(g)
正常钙(0.5%) 高剂量钙(1.0%) 高剂量钙(1.5%)
合计
332.96
253.21
232.55
297.64
235.87
217.71
312.57
269.30
216.15
295.47
258.90
220.72
284.25
254.39
219.46
3.42
2.86
4.23
提出检验假设,确定检验水准
对于处理组 H0:三个处理组总体均数相等 H1:三个处理组总体均数不全相等 =0.05 对于区组 H0:十个区组总体均数相等 H1:十个区组总体均数不全相等 =0.05
根据公式计算结果,并整理成方差分析表
随机区组设计的方差分析表
变异来源
平方和 SS 自由度
总变异
SS 总
总
-
处理组间
SS 组间
组间
MS 组间
组内(误差)
SS 组内
组内
MS 组内
F值 -
MS组间 MS组内 -
第二节、完全随机设计资料的方差分析
❖完全随机设计(completely random design) 是将研究对象随机分配到各处理组,再观 察其实验效应的一种单因素实验设计方法
❖通常采用单因素方差分析(one-way ANOVA)。
X
307.97
ij
292.12
200.87 227.79
247.47 280.75
244.61
237.05
196.01
261.46
216.85
208.24
286.46
238.03
198.41
322.49
238.19
240.35
282.42
243.49
219.56
n i
12
Xi
293.37
12
239.49
• 各种喂养方式内部,体重变
化也各不相同,这种变异称
为组内变异
360
• 组内各个观测值 Xij 与本组内 340
均值 Xi之间差的平方和 • 组内变异反映随机误差
320 300
280
260
k ni
240
SS组内
(Xij Xi )2
220
i1 j1
200
180
X ij X甲
X乙
X丙
甲
乙
丙
总变异、组间变异、组内变异的关系
第六节 多个样本均数的两两比较
• 不拒绝H0,表示拒绝总体均数相等的证据不足 ————>分析终止
• 拒绝H0,接受H1, 表示总体均数不全相等 哪两两均数相等? 哪两两均数不等? ————>需要进一步作多重比较 直接用t检验进行两两均数间的比较,会 增加I类错误。
两两比较的常用方法
• 每个两均数之间的比较: SNK法、Bonferroni法等
• 多个处理组与同一个对照组的比较Dunnett检验 、LSD-t检验等
一、SNK(Student-Newman-Keuls)法
• 最常用方法之一,其检验统计量为q,故 又称为q检验
q
XA XB
MS误差 ( 1 1 )
2 nA nB
MS误差为均方误差
例8.1三组间两两比较
• 将各组的平均值按由大到小的顺序排列
2 12 12
其中,a RA RB 1,如"1 3"对比,则a 3
做出推断结论
判断准则:
如果差F异≥有F α统(v1计,v2)学,意则义P≤,α,认则为按多α个水总准体拒均绝数H不0,全接相受同H1,
如果无F统<计F学α(意v1,v义2),,则还P不>能α,认则为按多α个水总准体不均拒数绝不H全0,相差同异
将结果整理成方差分析表
变异来源
完全随机设计的方差分析表 平方和SS 自由度 均方 MS
• 此时,F值接近于l,就没有理由拒绝H0;反之,F值太大, 则有理由怀疑H0是否成立
• 当H0成立时,F值服从自由度为v1(分子自由度)和v2 (分母自由度)的F分布,因此可以根据F分布表来确定是 否拒绝H0。
从上面可以看出方差分析的思想逻辑:
根据资料设计的类型及研究目的,将总变异 分解为两个或多个部分,每个部分的变异可由某 种因素的作用来解释。通过将某部分的变异与随 机误差进行比较,以判断该部分的变异是否可由 随机误差来解释,以了解相应的因素对结果有无 影响。
SS总 SS组间 SS组内
对应自由度的关系
总 N 1 组间 k 1
k
组内 (ni 1) N k i 1
总 组间 组内
均方(mean square, MS)
• 影响离均差平方和(SS)大小的因素: 1)与变异程度大小有关 2)与其自由度大小有关,即与数据个数有关
• 将各部分离均差平方和除以相应自由度,其比值 称为均方差,简称均方(MS),实质就是方差。
组间均方:MS组间 SS组间 组间 SS组间 (k 1)
组内均方:MS组内 SS组内 组内 SS组内 (n k)
F 值与F分布
• 组间均方与组内均方的比值记为F
F MS组间 MS组内
F 值与F分布
• 如果方差分析的零假设H0:μ1= μ2= μ3成立,即各三种喂养 方式的体重总体改变量相同,即效果一样,则组间变异与 组内变异一样,只反映随机误差作用的大小。
因界值表中无分母自由度33,取=32,得 F0.05(2,32)=3.29。由于F=23.85,F> F0.05(2,32),故 P<0.05,按照0.05的显著性水准,拒绝H0,差别有 统计学意义,可认为三种喂养方式大鼠体重改变 的总体平均值不全相同。
第三节 随机区组设计资料的方差分析
❖随机区组设计(randomized block design) 又称为配伍组设计,是先将受试对象按性 质相同或相近者组成m个组,称为区组或配 伍组,每个区组中有k个受试对象,将其随 机地分到k个处理组中进行实验的一种设计 方法。是配对设计的扩展。
P值 <0.05 <0.05 >0.05
例如,第1组与第2组比较
MS误差 = 498.99,XA = 293.37, XB = 239.49, nA = 12,nB 12,
q1-2
XA XB
MS误差 ( 1 1 )
2 nA nB
余类推。
498.99 239.49 5.91 498.99 ( 1 1 )
对于区组间( B 因素),分子自由度 B =9,分母自由度 e =18,查F 界值表(方 差分析用),F0.05(9,18) =2.46。由于F =0.825,F F0.05(9,18) ,故 P >0.05,按照 = 0.05 的显著性水准,不拒绝H 0(B) ,差别无统计学意义,不能认为 10 个区组的总体均 值不同。
• 例8-2 为探索丹参对肢体缺血再灌注损伤的影响,将30只 纯种新西兰实验用大白兔,按窝别相同分为10个区组。每个 区组的3只大白兔随机接受三种不同的处理,并分别测定松 止血带前及松后1小时后血中白蛋白含量(g/L),算出白蛋白 的减少量如表8-4所示。问三种处理效果是否不同?
表 8-4 区组
1 2 3 4 5 6 7 8 9 10
总变异
19.0385
29
处理组间 A
13.7018
2
区组间 B
1.5577
9
误差
3.7790
18
均方 MS
6.8509 0.1731 0.2099
F值
32.639 0.825
P值
<0.01 >0.05
确定值,做出推断结论
对于处理组(A 因素),分子自由度 A =2,分母自由度 e =18,查 F 界值表(方 差分析用),F0.05(2,18) =3.55。由于F =32.639,F F0.05(2,18) ,P故 <0.05,差别有统计 学意义,按照 = 0.05 的显著性水准,拒绝H 0(A) ,可认为三组种不同的处理效果不 全相同,不同处理对大白兔白蛋白减少量有影响;
m
SS区组 k (X j X )2 j 1
区组 k 1
(4)随机误差SS误差
变异分解
• 四者的关系如下:
SS总 SS处理 SS区组 SS误差 总 处理 区组 误差
方差分析表
变异来源
随机区组设计的方差分析表
平方和SS
自由度
总变异
km
SST
( X ij X )2
i1 j 1
=(n 1)S 2
组别 正常钙 中剂量钙 高剂量钙
均数 293.37 239.49 224.78
例数 12
12
12
秩次 1
2
3
• 根据前面方差分析有:MS误差=498.99
对比组 1–2 1–3 2–3
SNK 法两两比较结果表
q 值 a 值 q 界值(0.05)
5.91 2
2.89
7.52 3
3.49
1.61 2
2.89
随机区组设计资料数据结构
B :区组因素
区组 1 区组 2
… 区组m
随机区组设计方差分析的数据结构
水平 1
A :处理因素
水平 2
…
X 11
X 21
…
X 12
X 22
…
…
…
…
X 1m
X 2m
…
水平 k X k1 X k2 … X km
变异分解
有四种不同的变异
(1)总变异SS总,计算同前 (2)处理组间的变异SS处理,计算同前 (3)区组间的变异SS区组,反映区组间的变异
12
224.78
36(总例数)
252.55(总均数)
S2 i
606.15
350.51
540.31
从这个表,可以看到三种变异:
1364.52 (总方差)
1、全部数据间的变异,总变异 2、三组均数之间的变异,组间变异 3、每组内数据的变异,组内变异
变异分解(离均差平方和SS)
1、总变异(SS总,total variation)
T n 1
均方MS
F值
处理组间 区组间
k
SS A m( X i X ) 2 i 1
m
SS B k ( X j X ) 2 j 1
A k 1 B m 1
MS A SS A A MS B SS B B
FA
MS A MS e
FB
MS B MS e
误差
SSe SST SS A SSB e (k 1)(m 1) MSe SSe e
三种方案处理后大白兔血中白蛋白减少量(g/L)
丹参 2ml/kg
丹参 1ml/kg
生理盐水
2.21
2.91
4.25
2.32
2.64
4.56
3.15
3.67
4.33
1.86
3.29
3.89
2.56
2.45
3.78
1.98
2.74
4.62
2.37
3.15
4.71
2.88
3.44
3.56
3.05
2.61
3.77
第八章 方差分析
Analysis of Variance, ANOVA
两个样本均数 X1, X 2 比较的t检验方法
本章介绍多个样本均数 X1, X 2, X 3, X 4 比较的方差分析方法
方差分析的提出
方差分析由英国统计 学家R.A.Fisher在 1923年提出,为纪念 Fisher,以F命名,故 方差分析又称 F 检验
单因素方差分析的变异分解:
总变异分解为组间变异和组内变异
SS总 SS组间 SS组内
总 组内 组内
F MS组间 MS组内
方差分析步骤(例8.1)
1、提出检验假设,确定检验水准。
H0:三种喂养方式体重改变的总体均数相同, μ1= μ2= μ3 ; H1:三种喂养方式体重改变的总体均数不全相同;
全部测量值大小各异,与
总均值之间的差异称为总变异,360
340
即Xij与 X 之间的差异。
320
它包含不同喂养方式的效 300
应(处理的效应),又包含了 280
随机误差
260
240
k ni
220
SS总
(Xij X )2
200
i1 j1
180
X
甲
乙
丙
2、组间变异(SS组间,variation between groups)