卫生统计学---方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

c4 0.419 -0.663 -0.663 -0.196 0.740 1.591 0.942 0.810 -1.279 0.410 0.262
c5 0.466 -1.032 -1.032 -0.465 1.752 0.029 -0.694 -0.790 1.067 0.016 -0.017
c6 -1.357 0.151 0.151 0.535 0.850 -1.806 0.942 -1.634 -0.745 0.856 -0.140

ni
2


k SS组内
i 1
ni
( xij
j 1
xi )2

k i 1

ni j 1
xi2j


xij
j 1
ni




组内 N k
2019/12/5
19
ANOVA
• 三种变异的关系:线性可加性
SS总 SS组间 SS组内
Ronald Fisher
2019/12/5
11
ANOVA
• 常用术语:
– 因素:所要检验的对象称为因素(如研究某种 药物的不同剂量疗效,药物即因素)
– 水平:因素的具体表现称为水平(药物的每个 剂量为一个水平)
– 观察值:在每个因素水平下得到的样本值
2019/12/5
12
ANOVA
• 变异的测量:
c10 0.562 0.828 1.446 0.487 0.208 0.603 0.549 0.416 -0.472 1.080 0.571
S 0.970
1.072
1.026
0.844 0.887 1.128 0.995 0.876 0.839 0.510
2019/12/5
7
ANOVA
两两比较的次数:m
ANOVA
• 随机区组设计(randomized block design)又称 配伍组设计,是配对设计的扩展。是将全部受试 对象按某种或某些特征分为若干个区组,使每个 区组内研究对象的特征尽可能接近,每个区组内 的观察对象与研究因素的水平数相等,然后分别 使每个区组内的观察对象随机地接受研究因素某 一水平的处理
2019/12/5
36
ANOVA
• 当随机对照只有两组(即 k 2,1 1),
F
(1, )

t2
,t
2,
检验与F检验等价
F 如: 0.05(1,10)

4.96

2.2282

t2
0.05
2,10
2019/12/5
37
ANOVA
第三节 随机区组设计的方差分析
2019/12/5
38
2019/12/5
25
ANOVA
f(F)
1.0 0.8 0.6 0.4 0.2 0.0
0
1=1, 2=10
1=5, 2=10 1=10, 2=10 1=∞, 2=10
1
2
3
4
5
F
2019/12/5
26
ANOVA
2019/12/5
27
ANOVA
从图中看出:1,2固定, ,F

7.498 23
2019/12/5
35
ANOVA
3. 确定P值,作出统计推断
以1=2、2=21 查F界值表,得 F0.05,(2,21)=3.47, F0.05,(2,21)=5.78, P<0.01。按 = 0.05水准,拒
绝H0,接受H1,差异有统计学意义,可认为不 同粉尘环境影响大鼠的全肺湿重
2019/12/5
5
ANOVA
模拟试验(simulation trial)
• 从标准正态分布总体 N( 0, 1 ) 中随机 抽样,样本含量为10,共抽取10次,得 数据如下:
2019/12/5
6
ANOVA
d#
c1
1
1.803
2
0.839
3 -1.212
4 -1.123
5 -0.545
6 -0.012
2019/12/5
3
ANOVA
表9-1 三组大鼠的全肺湿重(g)
甲组 4.2 3.3 3.7 4.3 4.1 3.3 3.5 4.1 乙组 4.5 4.4 3.5 4.2 4.6 4.2 4.4 4.1 丙组 5.6 3.6 4.5 5.1 4.9 4.7 4.8 4.4
• 研究者对上述资料采用两样本t 检验两两比较得 出结论:


k 2


k
(k 1) 2
例: k 3,
m1

3(3 1) 2

3
k 10,
10(10 1) m2 2 45
2019/12/5
8
ANOVA
c1-c8 c1-c10 c2-c8 c2-c10 c8-c9 c9-c10 t -2.38 -2.43 -2.16 -2.15 2.42 -2.54 P 0.029 0.026 0.044 0.045 0.026 0.021
2019/12/5
30
ANOVA
• 完全随机设计(completely random design) 又称成组设计,按随机化原则将受试对象随 机分配到某一研究因素的多个水平中去,然 后观察实验效应。其目的都是推断不同水平 下各组均数之间的差别是否有统计学意义
2019/12/5
31
ANOVA
表9-3 完全随机设计方差分析计算公式
F

F

F (1 , 2 ) F (1 , 2 )
P P
2019/12/5
28
ANOVA
二、方差分析的应用条件:
① 独立性 ② 正态性 ③ 方差齐性 概括地表达为:任何观察值xij都是独立 地来自具有等方差的正态总体
2019/12/5
29
ANOVA
第二节 完全随机设计的方差分析
SS总 S2(N -1) 0.326 0 (24 -1) 7.498 总 24 1 23
SS组间 ni (xi x )2
i
8(3.8125-4.2458)2 8(4.2375 4.2458)2 8(4.6875 4.2458)2 3.063
Chapter 9
Analysis of Variance, ANOVA
主要内容
方差分析的基本思想和应用条件 完全随机设计的方差分析
outline
2019/12/5
随机区组设计的方差分析 多个样本均数的两两比较
2
ANOVA
• 【例9-1】 为研究煤矿粉尘作业环境对尘肺 的影响,将24只Wistar 大鼠随机分到甲、 乙、丙三个组,每组8只,分别在地面办公 楼、煤炭仓库和矿井下染尘,12周后测量 大鼠全肺湿重(g)
7 -1.287
8 -0.238
9 -0.625
10 -0.293
x -0.272
c2 -0.048 -0.990 0.607 -1.086 -0.136 -1.286 2.050 -1.511 0.345 -0.315 -0.237
c3 1.408 -2.014 -2.014 -0.366 -0.645 0.134 0.890 0.225 0.623 0.319 -0.068
变异来源
SS
ν MS
组间(处理)
ni (xi x )2
i
SS组间
k-1 k 1
组内(误差) SS总 SS组间 或 (ni 1)Si2
i
N-k
SS组内 N k
总变异

x2

( x)2
N
N-1
F
MS 组间 MS 组内
2019/12/5
32
ANOVA
【检验步骤】
1. 建立检验假设,确定检验水准
2019/12/5
17
ANOVA
• 组间变异:各处理组均数之间不尽相同
ni
2
SS组间

k i 1
ni (xi

x )2

k i 1

xij
j 1
ni

k ni
2


xij
i1 j1
N
v组间 k 1
2019/12/5
18
ANOVA
• 组内变异:各处理组内观察值之间不尽相同
15
ANOVA
• 变异的分解:
总变异 组间变异 组内变异
2019/12/5
16
ANOVA
• 总变异:所有观察值之间的变异(不分组)
k
SS总
ni
k
(xij x )2
ni
xi2j


k
ni
2
xij
N
i1 j1
i1 j1
i1 j1
总 N -1
组间变异 组内变异
总变异
总 组间 组内
2019/12/5
20
ANOVA
• 均方MS (mean square): – 组间均方:MS组间 SS组间 组间
– 组内均方: MS组内 SS组内 组内
2019/12/5
21
ANOVA
变异来源 变异分解 自由度分解
T 处理效应 组间变异
5.6 3.6 4.5 5.1 4.9 4.7 4.8 4.3 4.6875
2019/12/5
14
ANOVA
• 变异的来源:
样本均数间存在的差异可能由两种原因所致: ① 随机因素引起的差异:抽样误差、测量误差 ② 处理因素引起的差异:不同的处理引起不同
的作用和效果,导致各处理组之间均数不同
2019/12/5
①乙组和丙组差异无统计学意义
②其余各两组间差异均有统计学意义
2019/12/5
4
Aቤተ መጻሕፍቲ ባይዱOVA
【问题9-1】 (1)该实验属何种设计方案? (2)统计分析方法是否正确?为什么? 【分析】 (1)完全随机设计 (2)不正确:①将多个样本均数的同时比较转化为 多次的两两比较;②多次的两两比较会增大Ⅰ型错 误的概率
c7 1.211 -1.138 -1.138 -1.052 -0.171 0.460 0.168 0.532 1.203 -1.538 0.051
c8 0.077 1.327 1.327 1.042 0.122 -0.836 0.554 0.686 1.435 2.327 0.710
c9 0.464 0.770 -1.632 -0.083 -0.319 -1.173 0.452 -1.101 0.629 -0.184 -0.212
2019/12/5
23
ANOVA
• 若组间变异与组内变异相差不大,F值比较接近于 1,此时我们尚不能认为总体均数之间有差别,若 处理组间的变异明显大于组内变异,则不能认为 组间的变异仅反映随机误差,也就是认为处理因 素有作用(即存在处理效应),接下来,我们通过 查 F 界值表,即可得 P 值,按 P 值大小作出推断 结论
H0: 1= 2 = 3,三组大鼠全肺湿重总体均数相等
H1: 1, 2 ,3不等或不全相等
= 0.05
2019/12/5
1

1 1

2 2 3

3 3 2
(客观实际只可能 是其中一种情况)
1 2 3
33
ANOVA
2. 计算检验统计量
方差:
s2
(x x)2
x2 ( x)2 n
n 1
n 1
2019/12/5
13
ANOVA
一、方差分析的基本思想
表 9-2 三组大鼠的全肺湿重( g )
甲组
乙组
丙组
4.2 3.3 3.7 4.3 4.1 3.3 3.5 4.1
xi 3.8125
4.5 4.4 3.5 4.2 4.6 4.2 4.1 4.4 4.2375
10个样本来自同一标准正态分布N(0,1)总体
则 1 2 3 10
实际上犯I型错误的大小: 6 0.1333 45
2019/12/5
9
ANOVA
第一节 方差分析的基本思想和应用条件
2019/12/5
10
ANOVA
• 方差分析又称变异数分 析,是由英国著名统计 学家Fisher于1928年首 先提出的一种统计方法, 故也称F检验,用于多 个样本均数的比较
组间 3 1 2
SS组内 SS总 SS组间 7.498 3.063 4.435
组内 24 3 21
2019/12/5
34
ANOVA
表9-4 方差分析结果
变异来源 SS
MS F
P
组间 3.063 2 1.532 7.250 <0.01
组内 4.435 21 0.211
2019/12/5
24
ANOVA
• 方差分析的基本思想: 根据资料的设计类型,即 变异的不同来源将全部观察值总的离均差平方和 (即方差)和自由度分解为两个或多个部分,除 随机误差外,其余每个部分的变异可由某个因素 的作用加以解释。通过比较不同变异来源的均方, 借助 F 分布作出统计推断,从而了解该因素对观 测指标有无影响
k-1
E 随机误差 组内变异
N-k
2019/12/5
22
ANOVA
• 如果各样本来自同一总体,即各组之间无差别
(即无处理效应),则组间变异与组内变异均只
反映随机误差,这时若计算组间均方与组内均方
的比值:
F MS组间 MS组内
F 值应接近于 1 ;反之,若各样本均数不是来自
同一总体,组间变异应较大,F 值将明显大于 1
相关文档
最新文档