5方差分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
F分布
方差分析的最终统计推断和假设检验均依靠F分 布,所以适当了解一下F分布的特点十分有益。
F分布是英国统计学 家Fisher和Snedecor(斯内德 克 )提出的。
为了表示对Fisher的尊重, Snedecor将其命名为F分布。
方差分析也主要是由 Fisher推导出来的,也叫F 检验。
F 分布
医学统计学
方差分析
Analysis of Variance
Department of Epidemiology and Biostatistics, NJMU 流行病与生物统计系 南京医科大学
主要内容
问题的提出 方差分析的原理 完全随机设计的方差分析
completely random design 配伍组设计的方差分析
F
MS组间 MS组内
方差分析表
变异来源
SS
v MS
总
67.6685 59
组间
8.2930 2 4.1465
组内(误差) 59.3755 57 1.0417
F 3.98
方差分析的原理
方差比的分布!
FMS组间SS组间k1 MS组内 SS组内nk
F MSBetween MSWithin
~F(1,2)
因素和水平
因素(factors):将试验对象随机分为若干 个组,加以不同的干预,称为处理因素。
在相同的因素下的不同干预,称为不同的水 平(level)。
问题的提出
t检验实例
南京医科大学的学工部门想知道2008年南京市 进入南医大就读的学生中,市区的学生和郊区 的学生成绩是否有差异。
因素:学生所来自的区域
sd
0.913
B(i=2)
5.0 2.0 0.2 0.0 0.5 1.6 0.3 3.0 1.9 1.6 1.0 0.0 2.4 3.0 -0.4 0.7 2.0 1.2 1.6 0.7
20 1.415 1.297
C(i=3)
2.1 -0.7
1.9 1.7 0.2 2.0 1.5 0.9 1.1 -0.2 1.3
?
江苏 X =592.79
浙江 X =569.83
单因素 三水平
问题的提出
一种新的降血脂药,120人分为安慰剂组,用药组1(2.4g),用 药组2(4.8g),用药组3(7.2g)。实验结束后观察血脂水平。
安慰剂组 X =3.43mmol/l
用药组1
X X =2.72mmol/l
?
用药组2 X =2.70mmol/l
1-(1-)k
组数为3, k=3, 1-(1-0.05)k=0.1426 组数为4, k=6, 1-(1-0.05)k=0.2649 组数为5, k=10, 1-(1-0.05)k=0.4013 组数为6, k=15, 1-(1-0.05)k=0.5400
方差分析
方差分析,又称变异数分析。 Analysis of Variance,简写为ANOVA。 由英国统计学家R.A.Fisher提出。 方差分析的起源。 F检验。
j 1
j 1
Baidu Nhomakorabea
j 1
5 9 .3 7 5 5
组间变异 SS组间
Sum of squares between groups
X1
X2
X3
X
n1(X1 X)2 n2(X2 X)2 n3( X3 X )2
S S B e tw e e nn i(X i X )2
S S B e t w e e n 2 0 ( 1 . 8 4 0 1 . 3 9 5 ) 2 2 0 ( 1 . 4 1 5 1 . 3 9 5 ) 2 2 0 ( 0 . 9 3 0 1 . 3 9 5 ) 2 8 . 2 9 3 0
用药组3 X =1.97mmol/l
单因素 四水平
问题的提出
假如每次t检验犯第一类错误的概率是0.05, 那么要完全地进行比较,犯第一类错误的概
率是1-(1-)k。
10.9560.2649
问题的提出
多组间的两两比较为什么不能用 t 检验?
进行一次假设检验,犯第一类错误的概率:
进行多次(k)假设检验,犯第一类错误的概率:
random block design 两两比较 方差分析的正确应用
复习假设检验
提出一个假设 如果假设成立,得到现有样本的可能性
可能性很小(小概率事件),在一次试验中本 不该得到,居然得到了,说明我们的假设有问 题,拒绝之。
有可能得到手头的结果,故根据现有的样本无 法拒绝事先的假设(没理由)
方差分析的基本思想
组内变异(SS组内):抽样误差 组间变异(SS组间) :组间本质差别+抽样误差
如果组间无本质差别,则组间变异=组内变异
或: M MSS组 组间 内SSSS组 组内 间nkk11
方差分析的基本思想
X
X X2 3 X 1
方差分析的原理
包括处理因素不同水平的 效应所导致的变异,也包
2.0 1.4 1.0 0.0 1.5 0.9
1.5 1.7 2.4 3.0 0.9 0.8
2.7 3.0 -0.4 0.7 1.1 -0.3
1.1 3.2 2.0 1.2 -0.2 0.7
0.9 2.5 1.6 0.7 1.3 1.4
方差分析的原理
所有个体的血红蛋白上升值几乎都不同总 变异
不同组间的血红蛋白上升值不同,原因:处 理因素的效应(如果存在的话);随机误差 组间变异
同组内的血红蛋白上升值不一致,原因是不 同个体的个体差异、随机误差组内变异
总变异=组间变异+组内变异
总变异示意图 X
X1
X2
Xij X
X3
X 所有个体的血红蛋白上升值几乎都不同
组间变异示意图 X
X1
X2
Xi X
X3
X 不同组间的血红蛋白上升值不同
组内变异示意图 X
X1
X2
X ij X i
水平:市区,郊区
单因素 两水平
问题的提出
t检验实例
阿卡波糖的降血糖效果。分别给对照组和试验 组服用拜唐平胶囊和阿卡波糖胶囊,观察8周后 血糖下降值的差异。
因素:不同的药物
水平:阿卡波糖,拜唐平
单因素 两水平
问题的提出
t检验的局限性
单因素两水平
问题的提出
江苏、安徽、浙江三省的平均入学成绩
安徽 X =571.23
括总随变机误异差
无法总用的处离理均因差素平所方解和释的 部分变异(随机误差)
尺度
方差分析的原理
包括处理因素不同水平的
效应所导括总致随变的机变误异异差,也包
总的离均差平方和
无法用处理因素所解释的部分变异 (随机误差)
尺度
方差分析表
变异来源 组间 组内 总
SS SS组间 SS组内 SS总
v
MS
k-1 SS组间/v组间 N-k SS组内/v组内 N-1
方差分析的原理
例1 某地用A、B和C三种方案治疗血红蛋白含量不满10g的婴 幼儿贫血患者,
A方案为每公斤体重每天口服2.5%硫酸亚铁1ml, B方案为每公斤体重每天口服2.5%硫酸亚铁0.5ml, C方案为每公斤体重每天口服3g鸡肝粉,
治疗一月后,记录下每名受试者血红蛋白的上升克数,资料 见表1,问三种治疗方案对婴幼儿贫血的疗效是否相同?
差别有统计学意义。认为三种治疗方案治疗 婴儿贫血的效果不等或不全相等。
完全随机设计资料的方差分析
例题2 已知动物烧伤后内脏ATP含量迅速下降, 严重影响生 物体各器官能量的正常代谢,为了解烫伤后不同时期切痂对 肝脏ATP含量影响,将30只雄性大鼠随机分3组, 每组10只: A组为烫伤对照组, B组为烫伤后24小时(休克期)切痂组, C组为烫伤后96小时(非休克期)切痂组, 并在烫伤后168小时活杀,测量其肝脏的ATP含量, 探讨烫 伤后不同时间ATP含量是否有变化?
因素:烫伤后不同时期 水平:A,B ,C
完全随机设计资料的方差分析
烫伤对照组
7.76 7.71 8.43 8.47 10.30 6.67 11.73 5.78 6.61 6.97
1.3
1.1
0.2
0.7
(X3j 0.930)2
0.9 (X2ij011.395)2
0.8 601
-0.3
0.7
1.4
20 0.930
60 1.395
0.780
1.071
总变异 SS总
Sum of squares about the mean of all N values.
2
SST Xij X
X3
同组内的血红蛋白上升值不一致
X
例1 三组血红蛋白增加量(g)
A(i=1)
1.8 1.4
Xij
0.5 1.2 2.3 2.3
3.7 0.7
(X21j011.84(0X)222j01221.4..0415)2
0.5 1.4
1.5 1.7
2.7 3.0
1.1 3.2
0.9 2.5
ni Mean
20 1.840
总变异的分解
SS总=SS组间+SS组内
67.6685=8.2930+59.3755
k n i
k
k n i
(X ij X )2 n i(X i X )2 (X ij X i)2
i 1j 1
i 1
i 1j 1
( X X ) 2 n i ( X i X ) 2 ( X i j X i ) 2
1
.8
.6
.4
.2
0.05
0
0
1
2
3
4
5
3.1588
完全随机设计资料的方差分析
1. H0: 1=2=3 ,即三总体均数相等; H1: 1, 2, 3 不等或不全相等。
=0.05。 2. 计算检验统计量: F=3.98 >3.1588(界值) 3. 对应的概率: P=0.0241(p<0.05) 4. 结论: 在=0.05水准,拒绝H0,接受H1,
1.0
1=1, 2=10
0.8
0.6
1=5, 2=10
0.4
0.2
0.0
0
1
2
3
4
5
F 分布
1.0
0.8 0.6
0.4 0.2
0.0
0
1
1=10, 2=
1=10, 2=1
2
3
4
5
构造检验的统计量(F 分布)
如果均值相等, F=MSt/MSe1
不能拒绝H0
拒绝H0
0
F
F(k-1,n-k)
F 分布
方差分析表
60
2
SST Xij 1.395 67.6685
j1
组内变异 SS组内
Sum of squares within groups
k ni
2
SSwithin Xij Xi
i1 j1
2 0
2 2 0
2 2 0
2
S S w ith in X 1j 1 .8 4 0 X 2j 1 .4 1 5 X 3j 0 .9 3 0
Sir Ronald Aylmer Fisher
Fisher于Rothamsted研究作物产 量时,完善了方差分析的思想
1890~1962
Rothamsted Experimental Station
Sir Ronald Aylmer Fisher
1890: Born in East Finchley, London. 1909: Student at Gonville and Caius College, Cambridge. 1917: Married Ruth E. Guiness. 1919: Started work as a statistician at Rothamsted
变异来源 组间 组内 总
SS SS组间 SS组内 SS总
v
MS
k-1 SS组间/v组间 N-k SS组内/v组内 N-1
F
MS组间 MS组内
方差分析表
变异来源
SS
v MS
总
67.6685 59
组间
8.2930 2 4.1465
组内(误差) 59.3755 57 1.0417
F 3.98
F(2,57)的F分布及界值
方差分析的原理
单因素方差分析:研究的是一个处理因素的 不同水平间效应的差别;
处
理
水平1
因
素
水平2
方差分析的原理
单因素方差分析:研究的是一个处理因素的 不同水平间效应的差别;
水平1
处
理
水平2
因
素
水平k
方差分析的原理
t检验的检验统计量
差别
t X1 X2 s X1 X 2
以抽样误差 作为尺度
Experimental Station. 1933: Chair of Eugenics at University College, London. 1943: Balfour Professor of Genetics, Cambridge University. 1957: President of Gonville and Caius College. 1962: Died Adelaide, South Australia.
因素:治疗方案 水平:A,B,C
例1 三组血红蛋白增加量(g)
A(i=1)
B(i=2)
C(i=3)
1.8 1.4 5.0 2.0 2.1 -0.7
Xij
0.5 1.2 0.2 0.0 1.9 1.3 2.3 2.3 0.5 1.6 1.7 1.1
3.7 0.7 0.3 3.0 0.2 0.2
2.4 0.5 1.9 1.6 2.0 0.7