方差分析(二)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(9 1)
即:SS总=SS处理+SS区组+SS误差 式(9-1)中
i
j
i
j
i
j
i
和 分别表示对i从1到a求和与j从1到n求和。 j
Y ij i j SS总= (Yij Y ) 2= Yij2 N i j i j
2
式中各符号的意义及简化计算公式为:
Yijk i j ( )ij ijk 或Yijk i j ( )ij ijk
式中i=1,2,…,a;j=1,2,…,b;k=1,2,…,n。模型中的
为常数项,相
当于总平均值。 i 及 j 分别代表处理因素A取i水平、处理因B取j水 ( )ij 代表处理因素 A 与 B 处于( ij )组合水平时的交互 平的主效应。
表9-3 护士进行家庭访视所花费的时间(分钟) 因素A 病种(i) 1.心脏病 按A水平合计 2 Si Yijk 1(20岁以上) 2(30岁以上) 3(40岁以上) T Y j k
i ijk j k
因素B:护士年龄组(j) 25
20
24
25
22 27 21 115 2.肿瘤 30 45
H0: i 0; H1: i 0, 至少有一个不等式成立。
(2)处理因素B的假设: H0 : j 0; H1 : j 0, 至少有一个不等式成立。 (3)处理因素间交互作用的假设: H0 : ( )ij 0; H1 : ( )ij 0, 至少对一种(ij)组合成立。 给定假设检验水准 α = 0.05。
30
29 28 30 142 30 29
28
24 25 30 131 39 42 388 10190
30
35 36
31
30 30
36
42 40
176
150
199
525
18793
(续上表)
3.脑血管意外
31
30 40 35 30 166
32
35 30 40 30 167 23
41
45 40 40 35 201 24 534 19366
vB=b-1
A与B交互作用的离均差平方和为:
SS AB
1 1 1 T2 2 2 2 ( Tij ) Ti Tj ; n i j bn i an j N
vAB=(a-1)(b-1)
误差项的离均差平方和
(9-3)
1 SS误差=S ( Tij2 ), 可用减法得到为: n i j
作用。 ijk 代表实验误差,是随机效应。与上述模型相对应,每一观
察值与总平均值之差可写为:
Yijk Y (Y i Y ) (Y j Y ) (Y ij Y i Y j Y ) (Yijk Y ij )
对等式两边取平方并求和可以得到总离均差平方和的分解公式, 其表达式为: SS总=SSA+SSB+SSAB+SS误差
总离均差平方和
2 ( Yij ) Yij 2 i j , 处理组间离均差平方和SS处理= (Y i Y ) j n N i j i
2
Y ( Yij ) ij 2 i j , i ( Y Y ) i 区组间离均差平方和 a N i j j
义。有时研究者只注重处理因素的效应而不大关心区组因素 的效应。这时只要把区组效应从随机误差项中分离开来就达 到了设计者的目的。
表9-2 例9-1资料的方差分析表 变异来源 处理 区组 误差 总 离均差平方和 283.83 3990.31 690.07 4964.21 自由度 2 7 14 23 均方 141.92 570.04 49.29 F 2.88 11.56 P >0.05 <0.01
b
a
n
a
b
表达式中各项的意义及计算公式为:
T2 总离均差平方和 SS总=S N
v总=N-1
处理因素A的组间离均差平方和 vA=a-1
1 T2 2 SS A Ti b n i N
2 1 2 T SS B Tj an j N
处理因素B的组间离均差平方和
4.结核病
20
21
20 20 19 100 按B水平合计 ni T Y
i i k
i k
25
28 30 31 137 20
25
30 26 23 128 20 365 60 9107
20
ijk
557
16613
596
18000
659
22843
1812
57456
2 Si Yijk
处理因素A与B每种组合的合计数列于每个格子下部。从表9-3的边 际值看出,处理因素A中肿瘤与脑血管意外的访视时间较长。处理因 素B有随年龄增长而访视时间增加的趋势。两因素析因实验的方差分 析模型为:
j 与 i 计的方差分析模型中的两个参数 分别提出检验假设。 (1)H0: i 0; H1: i 0, 至少有一个不等式成立。
(2)H1 : j 0; H1 : j 0, 至少有一个不等式成立。
给定Ⅰ类错误概率水准α =0.05。
3.计算各种离均差平方和与自由度将例9-1的有关数据(见表 9-1)代入式(9-2),计算各种离均差平方和及自由度为: SS总=4964.21;v总=24-1=23 SS处理=283.83;v处理=3-1=2
Y
i ij
197.8 196.1 208.1 222.2
5
6 7
86.7
42.0 71.9
91.8
51.8 69.2
94.7
43.2 61.1
3
3 3
273.2
137.0 202.2
8
ni Y
j
51.5
8 500.7 62.6 32783.4
48.6
8 523.4 65.3 35459.1
54.4
5.计算F值
(1)关于处理间变异的F值计算公式为:
布。
MS处理 141.92 F处理 2.88 MS误差 49.29
F处理服从v1=v处理, v2=v误差的F分
(2)关于区组间变异的F值计算公式为:
F区组
布。
MS区组 570.04 11.56 MS误差 49.29
F区组服从v1=v区组, v2=v误差的F分
第二节 两因素析因设计资料的方差分析
凡同时配置两个或两个以上处理因素,这些因素的各水 平 又 具 有 完 全 组 合 的 实 验 , 统 称 为 析 因 设 计 ( factorial design)实验。析因设计实验的方差分析可以同时分析这些 处理因素的效应,以及因素间的交互效应( interaction )。 它可节省受试对象、能够提供较多的信息以及缩小随机误差。
随机区组设计的方差分析
一、随机区组设计方差分析的基本思想 随机区组设计(randomized block design)是事先将全部 受试对象按某种可能与实验因素有关的特征分为若干个区 组(block),使每一区组内的受试对象例数与处理因素的
分组数相等,使每个实验组从每一区组得到一例受试对象。
设共有n个区组,处理因素有a个水平(a个实验组),受试 对象总数为N=n×a。(配对试验设计的扩大)
8 567.0 70.9 42205.0
3
24
154.5
1591.1 66.3 110447.5
ij
i
Y
j
Yij2
令Yij表示第i(i=1,2,…,a)处理组第j(j=1,2,…,n)区组受
试对象的应变量观察值,随机区组设计的方差分析模型:
Yij i j ij或写为Yij i j ij
n×a×b。用i(i=l,2…,a)表示因素A的水平号,j(j=l,2,…b)
表示因素B的水平号,k(k=l,2,…,n)表示在ab每一水平组合的受 试对象号与表示应变量的观察值 例9-2 一项公共卫生调查要了解护士对患不同疾病的病人实行家庭访 视时所花费的时间(分钟)。共有60名护士,按年龄分为3组,病人所 患疾病种类分为4种。资料见表9-3。研究者希望对下列问题取得答案: (1)不同年龄组护士进行家庭访视所花的时间是否不同? (2)病人所患疾病的病种是否对护士的家庭访视时间有显著影响? (3)护士的年龄与病人所患疾病的病种之间是否存在交互作用?
令Tij Yijk , Ti Tij , T j Tij , T Ti T j ,
k 1
n
n
b
a
Hale Waihona Puke Baidu
a
b
j 1
i 1
i 1
j 1
Si (Y ), S j (Y ), S Si S j
j 1 k 1 2 ijk i 1 k 1 2 ijk i 1 j 1
SS区组=3990.31;v区组=8-1=7
SS误差=690.07;v误差=(3-1)(8-1)=14
4.计算相应的均方
SS区组 3990.31 SS处理 283.83 MS处理 414.92,MS区组 570.04 处理 3 1 区组 8 1
MS误差 SS误差 690.07 49.29 误差 3 18 7
2
2
随机误差离均差平方和
SS误差= (Yij Y i Y j Y ) SS总 SS处理 SS区间
2 i j
v总=N-1,v处理=a-1,v区组=n-1,v误差=(a-1)(n-1)
二、方差分析步骤 1.整理和描述资料 参见表9-1的资料整理格式。
2.提出检验假设及给定Ⅰ 类错误概率水准α 对随机区组设
将以上计算结果列于方差分析表中见表9-2。
查附表5:F界值表得F0.05(2,14)=3.74, F0.01(2,14)=6.51。故处理
因素在α =0.05水准上不拒绝无效假设,不同营养素对小鼠 所增体重的差别无统计学意义。区组因素在α =0.05水准上
拒绝无效假设,故窝别对小鼠所增体重的差别具有统计学意
方差分析(二):双向方差分析
上一章介绍的单向方差分析只考虑处理因素的效应和随机效
应两项,是方差分析中最简单的一种。双向方差分析是从纵
横两个方向分析,不仅分析处理因素的效应,还可根据不同 设计分析区组效应、交互作用等,从而得到更多的信息。本
章将介绍关于随机区组设计、析因设计和裂区设计的方差分
析。
第一节
对上式的等号两边取平方后按i与j两个方向求和就得到总离均
差平方和的分解公式为:
(Yij Y )2 (Y i Y Y j Y Yij Y i Y j Y )
i j i j
2
(Y i Y )2 (Y j Y )2 (Yij Y i Y j Y ) 2
SS误差=SS总-SSA-SSB-SSAB;v误差=N-(a-1)-(b-1)-(a-1)(b-1)-1
二、方差分析的步骤
1.整理及描述资料 将实验所得资料按表9-3的格式整理后, 分别求出处理因素A及必理因素 B各水平观察值之和 Ti及Tj, 各组观察值平方和 Si及 Sj,总和 T,总平方和 S等。 2.提出检验假设 对模型中三种效应分别提出检验假设。 (1)处理因素A的假设:
模型中的 为总体平均值, i 为处理因素第i水平效应, 为 第j区组效应,ij 为随机误差项。给定限制条件为:
j
i
i
0, j 0
j
与上述模型相对应,每一观察值与总平均值之差可写为:
Yij Y (Y i Y ) (Y j Y ) (Yij Y i Y j Y )
例9-l 采用随机区组设计方案,以窝作为区组标志,给
断奶后的小鼠喂以三种不同的营养素A、B、和C。四周后检 查各种营养素组的小鼠所增体重(g)。资料列于表9-1第一 部分。
block
区组(j) 1 2 3 4
表9-1 三种营养素喂养四周后 营养素分组(i) 1 (A ) 57.0 55.0 62.1 74.5 2(B) 64.8 66.6 69.5 61.1 3(C) 76.0 74.5 76.5 86.6 按区组求和 nj 3 3 3 3
22析因设计模型 设:因素A有二个水平
a1 a2 b1
因素B有二个水平
b2
因素B a1 b1 a1b1
因素A a2 a2b1
b2
a1b2
a2b2
一、两因素析因实验的方差分析模型
处理因素 A及B分别有 a及b个水平,总共有a×b种组合。在每一种组 合下即每一个格子中配有 n 个受试对象。全部实验受试对象总数 N =