变异数方差分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十章 单向方差分析
One-way analysis of variance
第一节 方差分析的基本思想
将所有测量值间的总变异按照其变异的来 源分解为多个部份,然后进行比较,评价由某
种因素所引起的变异是否具有统计学意义。
华中科技大学 同济医学院 宇传华制作, 2004,10
5
第5页,本讲稿共40页
一、离均差平方和的分解
第13页,本讲稿共40页
二、F 值与F分布
如果各组样本的总体均数相等(H0: 1 2 … k ),
即各处理组的样本来自相同总体,无处理因素的作用,则,组 间变异同组内变异一样,只反映随机误差作用的大小。组间 均方与组内均方的比值称为 F 统计量
F MS组间 MS组内
1
组间
,
2
组内
18
第18页,本讲稿共40页
第二节 实例8.1的方差分析
华中科技大学 同济医学院 宇传华制作, 2004,10
19
第19页,本讲稿共40页
一、 建立检验假设
H0:1 2 3 即4 4个试验组总体均数相等 H1:4个试验组总体均数不全相等
检验水准 0.05
华中科技大学 同济医学院 宇传华制作, 2004,10
20
第20页,本讲稿共40页
表 8-1 不 同 解 毒 药 对 应 的 大 白 鼠 血 中 胆 硷 脂 酶 含 量 (μ /ml)
组号 i
胆 硷 脂 酶 含 量 (Yij)
n i
j Yij
Yi
Y2 j ij
1
23 12 18 16 28 14
6
111 18.5
2233.0
2
28 31 23 24 28 34
F 值接近于 l,就没有理由拒绝 H0;反之,F 值越大,拒绝 H0 的理由越充分。数理统计的理论证明,当 H0 成立时,F 统计量服从 F 分布。
第14页,本讲稿共40页
f
(F)
1
2
2
1/ 2
1
2
2
/ 2F21 1
1
2
2
2
(1F
12
2) 2
1 1, 2 5
1 5, 2 5
1 10,2 10
6
168 28.0
4790.0
3
14 24 17 19 16 22
6
112 18.7
2162.0
4
8 12 21 19 14 15
6
89 14.8
1431.0
合 计 73 79 79 78 86 85 24
480 20.0 10616.0
四种解毒药的解毒效果是否相同?
Si
S1
S2
S3
S4 合计
值 5.99 4.15 3.78 4.71 6.65
7
第7页,本讲稿共40页
1. 总变异: 所有测量值之间总的 变异程度,计算公式
a ni
SS总
Yij Y
2
Y a ni 2 ij
C
i1 j1
i1 j1
N
Yij2 C=(N 1)S 2
i, j
总 N 1
校正系数:
a
(
ni
Yij
)2
N
(Yij )2
C i1 j1
i, j
N
N
第8页,本讲稿共40页
6
168 28.0
4790.0
3
14 24 17 19 16 22
6
112 18.7
2162.0
4
8 12 21 19 14 15
6
89 14.8
1431.0
合 计 73 79 79 78 86 85 24
480 20.0 10616.0
四种解毒药的解毒效果是否相同?
Si
S1
S2
S3
S4 合计
值 5.99 4.15 3.78 4.71 6.65
哪两两均数之间相等? 哪两两均数之间不等?
————>需要进一步作多重比较。
华中科技大学 同济医学院 宇传华制作, 2004,10
25
第25页,本讲稿共40页
控制累积Ⅰ类错误概率增大的方法
采用Bonferroni法、SNK法和 Tukey法等方法
注意:当组数为2时,完全随机设计的方差分
析结果与两样本均数比较的t检验结果等价,对同
一资料,有:
t F
华中科技大学 同济医学院 宇传华制作, 2004,10
24
第24页,本讲稿共40页
第三节 平均值之间的多重比较
不拒绝H0,表示拒绝总体均数相等的证据不 足 ————>分析终止。
拒绝H0,接受H1, 表示总体均数不全相等
中 胆 硷 脂 酶 含 量 (μ /ml) 按 完 全 随 机 化 设 计 方 法 将 N = 24 只 动 物 随 机 等
分成4个组 ( 将 动 物 编 成 1~24 号 , 用 计 算 器 ( 机 ) 对 每
一个动物产生一个随机数,然后按随机数从小到 大的顺序排序,前面 6 个动物分为第一组,紧接着的 6 个 动 物 分 成 第 二 组 , …)
Variation Due to Random Sampling SSW
Commonly referred to as:
Sum of Squares Within, or
Sum of Squares Error, or Within Groups Variation
第12页,本讲稿共40页
均方差,均方(mean square,MS)
试对象接受的处理相同,但测量值仍各不相同,这种变异
称为组内变异,也称SS误差。
用各组内各测量值Yij与其所在组的均数差值的平方和 来表示,反映随机误差的影响。计算公式为
SS组内
a ni
(Yij
Yi )2
i1 j1
a
(ni 1)Si2
i1
组内 N a
第10页,本讲稿共40页
三种“变异”之间的关系
华中科技大学 同济医学院 宇传华制作, 2004,10
2
第2页,本讲稿共40页
例 8 - 1 一 个 因 素 ( f a c t o r ): 解 毒 药 四 个 水 平 ( l e v e l )( a = 4 个 处 理 组 ): A 、 B 、
C 、 空 白 对 照 D, i=1,2,3,4 分 别 代 表 A、 B、 C、 D 每 水 平 有 ni=6 只 大 白 鼠 , 分 别 表 示 为 j=1,2,…,6 应 变 量 用 Yij 表 示 , 即 第 i 组 第 j 号 大 白 鼠 的 血
或 SS总 = ( 2 4 - 1 ) × 6 . 6 5 2 = 1 0 1 6 . 0 总 自 由 度 总 = 2 4 - 1 = 2 3 。
2. 组 间 离 均 差 平 方 和
n
i
SS组间
a i 1
( Y )2 ij j 1 ni
C
1162
6
1682
6
1122
6
892
6
480 2
98.49 99.00 99.17 99.25 99.30
4.24 3.39 2.99 2.76 2.60 25
7.77 5.57 4.68 4.18 3.85
6 234 5859 19.33 99.33 2.49 3.63
16
第16页,本讲稿共40页
F 分布曲线同济医学院 宇传华制作, 2004,10
21
第21页,本讲稿共40页
二、 计算离均差平方、自由度、均方
1 . 总 离 均 差 平 方 和 SS总 = a ni Yij2 C = 1 0 6 1 6 - ( 4 8 0 ) 2 / 2 4 = 1 0 1 6 . 0 。
i1 j1
离均差平方和分解:
SS总 = SS组间 + SS组内,
且 ν总 =ν组间 +ν组内
组内变异 SS 组内:
随机误差
组间变异 SS 组间:处理因素 + 随机误差
第11页,本讲稿共40页
One-Factor ANOVA
Partitions of Total Variation
Total Variation SST
F 分布曲线
15
第15页,本讲稿共40页
F 界值表
5
附表5 F界值表(方差分析用,单侧界值)
上行:P=0.05 下行:P=0.01
分母自由度
υ2
1
分子的自由度,υ1
2
3
4
5
161 200 216 225 230 1
4052 4999 5403 5625 5764
18.51 19.00 19.16 19.25 19.30 2
变异数方差分析
1
第1页,本讲稿共40页
表 8-1 不 同 解 毒 药 对 应 的 大 白 鼠 血 中 胆 硷 脂 酶 含 量 (μ /ml)
组号 i
胆 硷 脂 酶 含 量 (Yij)
n i
j Yij
Yi
Y2 j ij
1
23 12 18 16 28 14
6
111 18.5
2233.0
2
28 31 23 24 28 34
列 于 方 差 分 析 表 中 (见 表 8-2)。
表 8-2 大 白 鼠 血 中 胆 硷 酯 酶 含 量 方 差 分 析 表
变异来源 组间 组内 总
SS 568.33 447.67 1016.00
ν MS F 3 189.44 8.46 20 22.38 23
P 0.00079
华中科技大学 同济医学院 宇传华制作, 2004,10
23
第23页,本讲稿共40页
四、下结论
查 附 表 5 F 界 值 表 , 得 F0.05(3,20)=3.10。 由 于 F> F0.05(3,20), 故 有 概 率 P< 0.05, 根 据 式 (8.5)的 推 断规则拒绝无效假设,接受备择假设。处理因素的 4 个水平中至少有一个组的总体平均值不同于其他 各 组 。 从 表 8 . 1 所 示 的 各 Yi 值 可 见 , 不 同 解 毒 药 物 的效果是不同的。解毒药物 A 和 C 与空白对照组 D 相近。B 组血中胆硷脂酶含量较其他组为高。
组的均数 Y与i 总均数 间Y的差异
3. 组内变异(within group variation ):每组的每个
测量值Yij与该组均数
的差异Yi
下面用离均差平方和(sum of squares of deviations
from mean,SS)反映变异的大小
华中科技大学 同济医学院 宇传华制作, 2004,10
组间变异 组内变异
总变异
华中科技大学 同济医学院 宇传华制作, 2004,10
6
第6页,本讲稿共40页
对于例8-1(完全随机设计)
资料,共有三种不同的变异
1. 总变异(Total variation):全部测量值Yij与总
均数 Y 20间.0的差异
2. 组间变异( between group variation ):各
2.组间变异:各组均数与总均数的离均
差平方和,计算公式为
ni
a
a (
Y )2 ij
SS组间 ni (Yi Y )2
i1
i1
j 1
ni
C
组间 a 1
SS组间反映了各组均数 Y的i 变异程度
组间变异=①随机误差+②处理因素效应
第9页,本讲稿共40页
3.组内变异:在同一处理组内,虽然每个受
变异程度除与离均差平方和的大小有关外, 还与其自由度有关,由于各部分自由度不相等, 因此各部分离均差平方和不能直接比较,须将 各部分离均差平方和除以相应自由度,其比值 称为均方差,简称均方(mean square,MS)。组 间均方和组内均方的计算公式为:
MS组间
SS组间
组间
MS组内
SS组内
组内
=
Variation Due to Treatment SSB
+
Commonly referred to as:
Sum of Squares Among, or Sum of Squares Between, or
Sum of Squares Model, or
Among Groups Variation
24
568.33 。
组间自由度
1 = 4 - 1 = 3 , 组 间 均 方
MS组间 =
568.33 = 1 8 9 . 4 4 3
。
3 . 组 内 离 均 差 平 方 和 SS组内 = 1 0 1 6 . 0 - 5 6 8 . 3 3 = 4 4 7 . 6 7 , SS组内 = ( 6 - 1 ) × 5 . 9 9 2 + ( 6 - 1 ) × 4 . 1 5 2 + ( 6 - 1 ) × 3 . 7 8 2 + ( 6 - 1 ) × 4 . 7 1 2
组内自由度
2=4×(6-1)=20,组 内 均 方
MS组内 =
447.67 = 2 2 . 3 8 。 20
华中科技大学 同济医学院 宇传华制作, 2004,10
22
第22页,本讲稿共40页
三、计算F值
F = 189.44 = 8 . 4 6 分 子 分 母 自 由 度 分 别 为 : 3 , 2 0 22.38
华中科技大学 同济医学院 宇传华制作, 2004,10
3
第3页,本讲稿共40页
ANOVA 由英国统计 学家R.A.Fisher首创,
为纪念Fisher,以F命名 ,故方差分析又称 F 检 验 (F test)。用于
推断多个总体均数有无 差异
华中科技大学 同济医学院 宇传华制作, 2004,10
4
第4页,本讲稿共40页