第三篇 区组设计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
y 44
y46 y47
y49 y4,10
5
y 53
y55 y56
y58 y59 y5,10
BIB设计只使用于因子和区组间无交互作用的试验问 题,其统计模型为:
yij ai bj ij,i 1,2, v, j 1,2,,b
其中
yij -第 i 个处理在第 j 个区组中的试验结果
表 3.1.2 试验数据
区组
处理
1
2
3
4
5
1
73 69 73 71 67
2
73 68 74 72 69
3
75 72 74 73 68
4
75 72 77 75 72
例 3.1.3 在化学制剂对布料抗拉强度的试验中,按表 3.1.2
上的数据可算得各平方和及其自由度:
表 3.1.4 方差分析表
来源 平方和 自由度 均方和 F 比
若区组容量<处理个数 v,这样的设计称为随机化不 完全区组设计。
随机化区组设计是应用最为广泛的试验 设计方法之一,贯彻了试验设计的三大原 则,试验的精确度比较高。
随机化区组设计的目的,就是把区组引 起的变异从随机误差的变异中分离出来, 降低了随机误差的大小,提高统计分析的 可靠性。
随机化区组设计应用于单因子试验或复 因子试验均可,可以考察因子间的交互作 用。
•一个BIB设计有五个设计参数v,k,r,b, 。
BIB设计存在的必要条件是:在5个设计参数间同 时有下列三个关系式:
(1) vr bk
(2) r(k 1) (v 1)
(3) b v,r k
5 个参数中,任意确定 3 个,即可计算其余 2 个 参数,至今人们已经找到很多 BIB 设计。
附表 9 对 4 v 10和 r 10给出一些 BIB 设计表。
平衡不完全区组设计(BIB设计)
表3.2.1c 不完全区组设计
区组
处理
1234
1
y11 y12
y14
2
y22 y23 y24
3
y31 y32 y33
4
y 41
y43 y44
要求: •每个区组含有的
处理数相等,都为 3个; •每个处理在不同 区组中出现次数 相等,都为3次; •每对处理在同一 试验中相遇次数 相等,都为2次。
不完全区组设计种类很多,其中应用非常广泛 的设计之一是平衡不完全区组设计(Balanced Incomplete Block Design),简称BIB设计。
平衡不完全区组设计(BIB设计)
在随机化完全区组设计中若去掉部分试验,余下部分试验 就组成一个不完全区组设计。
表3.2.1a 完全区组设计
区组 处理
其中
yij -第 i 个处理在第 j 个区组内的试验结果.
-总均值.
ai -第 i 个处理的效应. b j -第 j 个区组的效应.
ij -试验误差,服从 N (0, 2 ) .
在区组设计中,全部 vb 个观察值的总平方和有如下分解:
vb
ST
( yij y) 2,
fT vb 1
i1 j 1
Cvk b
意指:从v个处理中任取k个放入一个区组,如此区组共有b 个.在这个例子中,具体的设计如下:
区组
处理
1 2 3 4 5 6 7 8 9 10
1
y11 y12 y13 y14 y15 y16
2
y21 y22 y23
y27 y28 y29
3
y 31
y34 y35
y37 y38
y 3,10
4
y 42
这一错误结论是没有重视区组作用而导致的。 所以在试验中,凡是试验条件间有较大差异时,应该运用区组
设计去减少试验误差。
讨论二:可以把区组看作另一个因子
我们的兴趣总是放在 v 个处理间是否有显著差异上,区 组就象一个垃圾桶,把区组平方和从误差中分离出来即可。
若还要关注区组效应的大小,即考察区组间是否存在显 著差异,可把区组也看作一个因子,要检验如下一对假设:
对 照
C
肥沃
设有 v 个处理需要比较,有 n 个试验单元用于试验。 第一步:把 n 个试验单元均分为 k 个组(k=n/v),使 每个组内的试验单元尽可能相似,这样的组称为区组。 第二步:在每个区组内对各试验单元以随机方式实施 不同处理.这样的设计称为随机化区组设计。
若区组容量=处理个数 v,这样的设计称为随机化完 全区组设计。即一般所称的随机区组设计。
试验后收回,分别测量其磨损量,然后进行数据分析。
讨论:若有三种人造物质的鞋底( A1, A2 , A3 ),那就要
采用随机化不完全区组设计。
随机化完全区组设计中设有 v 个处理和 b 个区组,共有
n= vb 次试验,记 察值。
y ij
表示第
i
个处理在第
j
个区组内的观
区组
处理
1
1
y11
2
y 21
v
y v1
( yij Ti Bj y )2,fe (v 1)(b 1)
i1 j1
即有: ST S A S B Se , fT f A f B f e .
表 3.1.3 随机化完全区组设计的方差分析表
来源
平方和
自由度
均方和
F比
处理
SA
1 b
v
Ti 2
i 1
T2
vb
fA v 1
MS A S A / f A
但要注意:
重复数即为区组数 b
误差项自由度 f e = (v 1)(b 1)
可以采用上一章中均值多重比较的方法进行各个处 理效应的均值比较。
随机区组设计统计分析——方差分析
Data yourdata; Input Block$ Treat$ Y @@;
Cards; 数据 ; Proc GLM data = yourdata;
例: 比较两种材质的鞋底( A1, A2 )的磨损程度。
一个人的两只脚是一个合乎情理的区组,因为一个人的 左右鞋的磨损情况是近似相同的,不同人之间的磨损情况 是有差异的。
若有6人参加试验,(假设鞋的尺码相同),则需对每种 材质的鞋各制造3双,每个人随机的从中各选一只左鞋和 右鞋.构成随机化完全区组设计。
第三章 区组设计
§3.1 随机化完全区组设计 §3.2 平衡不完全区组设计 §3.3 格子设计
3.1 随机化完全区组设计
由于试验条件不均匀,比如:试验场地、 人员、设备、试验材料等存在一些差异, 可能会对试验结果造成不良影响。
为解决这样的问题,把全部试验单元分 为若干个区组,使得每个区组内各试验单 元之间的差异尽可能的小,而区组间允许 存在一些差异,这样的试验设计称为区组 设计。划分区组也是试验设计的基本原则 之一。
Class Block Treat; Model Y= Block Treat; Means Treat/duncan; Run;
3.2 平衡不完全区组设计(BIB设计)
在随机区组和拉丁方等设计中,任一个区组中 都包含着所有的试验处理,这种区组称为完全区组。
在科学试验中,由于受到试验条件的限制,有 时一个区组中无法容纳全部的试验处理,而只能容 纳其中一部分,这种区组称为不完全区组。这样的 区组设计称为不完全区组设计。
例 3.1.1 有4种杀虫剂 A1, A2 , A3 , A4 ,为了比较4种
杀虫剂对棉田中害虫的杀虫效果高低,特选了 20 块田,每 种杀虫剂重复 5 次试验.如何安排试验呢?
•随机化设计:将 20 块田随机的安排 20 个处理.
评论:20 块棉田试验单元间总有差异,如害虫多少, 植物长势,土地肥沃程度等.这些差别对杀虫效果会带来 影响,从而对比较产生干扰.
附表 9 BIB 设计表( 4 v 10 和 r 10)
例3.2.1 附表9索引第一行给出设计1,其设计方案如下:
v=4,k=2,r=3,b=6, =1
组Ⅰ
组Ⅱ
组Ⅲ
(1)1,2 (2)3,4
(3)1,3 (4)2,4
(5)1,4 (6)2,3
其中阿拉伯数字1,2,3,4表示处理,(1),(2),…,(6)
将v个处理安排到b个区组的一个不完全区组设计称 为平衡不完全区组设计,该设计满足下列三个条件:
1.每个区组都含k个不同处理,k称为区组容量。 2.每个处理都在r个不同区组中出现,r称为处理重 复数。
3.任一对处理在 个不同区组中相遇, 称为相遇
数。 从这个定义可以看出: •一个BIB设计中的v个处理可以得到公平的比较。
(区组)和 B1
均值
B1
2
…
y12
…
y 22
…
yv2
…
B2
…
B2
…
b (处理)和 均值
y1b
T1
T1
y2b
T2
T2
y vb
Tv
Tv
vb
Bb
T yij
i1 j 1
Bb
y T /vb
在 v 个处理和 b 个区组场合的统计模型如下:
yij ai b j ij,i 1, ,2, v, j 1,2,, b
v
b
vb
b (Ti y)2 v (B j y)2
( yij Ti B j y) 2
i 1
j 1
i1 j 1
v
处理平方和: S A b (Ti y)2,f A v 1
i 1 b
区组平方和: S B v (B j y)2,f B b 1
j 1
vb
误差平方和: Se
料进行改进。
讨论一:假如不设立区组,则区组平方和并入误差平方和.数据仍 然可按单因子方差分析处理,所得方差分析表如下:
表 3.1.5 把区组从设计中剔除后的不正确分析
来源 平方和 自由度 均方和 F 比
处理 37.8
3
12.6 1.97
误差 102.0
16
6.38
总和 139.8
19
对给定 =0.05,F0.95 (3,16) 3.24 ,4 种处理间没有显著差异,
表示区组.罗马数字Ⅰ,Ⅱ,Ⅲ表示重复号。根据以上符号
可写出这个BIB设计如下:
区组
处理
123456
1
y11
y13
y15
2
y 21
y 24
y 26
3
y32 y33
y 36
4
y 42
y44 y45
例3.2.2 附表9索引第四行给出一个*设计,它的参数分别为:
v=5,k=3,r=6,b=10, =3
附表9中的带*设计可自行列出BIB设计,该设计中三个参数v, k,b间有一个组合关系:
A1
A2
A4
A2
A3
A3
A4
A1
A3
A2
A4
A1
A2
A4
A1
A2
A3
A3
A1
A4
特点:每个处理在每个区组内仅出现一次;每个区组内各种
处理也仅出现一次,且其次序是随机的.
某作物品种比较试验,有8个品种(含对 照),设3次重复。
区组Ⅰ
ECF
A
对 照
D
B
G
贫瘠
区组Ⅱ
G
B
对 照
D
F
C
E
A
区组Ⅲ
DAE
GBF
假如此种差异很微小,实施随机化设计是妥当的. 假如此种差异不可忽略,就要采取随机化区组设计.
•随机化区组设计:分二步进行 第一步, 将 20 块棉田按差异大小排序,将害虫最多的4
块棉田分为第1个区组,将害虫最少的4块棉田分为第5个
区组,其它按序入组.
第二步,在1个区组内随机的实施一种杀虫剂.
区组 1 区组 2 区组 3 区组 4 区组 5
1
2
3
4
1
y11 y12 y13 y14
2 y21 y22 y23 y24
ຫໍສະໝຸດ Baidu
3
y31 y32 y33 y34
4 y41 y42 y43 y44
表3.2.1b 不完全区组设计
区组 处理
1
2
3
4
1
y11 y12 y13
2
y21 y22
y 24
3
y31 y32 y33 y34
4
y 42
y 44
注:减少总试验次数是件好事,但还要按一定要求来组织 不完全区组设计。
处理 37.8
3
12.6 14.13
区组 91.3
4
22.83 ——
误差 10.7
12
0.89
总和 139.8
19
在显著性水平 =0.05,查其临界值 F0.95 (3,12) 3.49 ,由 于 F>3.49,故拒绝 H 0 ,即四种化学制剂对新型布料的抗拉强度
的影响有显著差异,提高新型布料的抗化学试剂能力,还需对布
F MS A MS e
区组
SB
1 v
b
B
2 j
j 1
T2 vb
f B b 1 MSB SB / f B
误差 Se ST S A S B fe (v 1)(b 1) MS e Se / fe
总和
ST
v i 1
b
yi2j
j 1
T2
vb
fT vb 1
——
例 3.1.3 化学制剂对布料有侵蚀作用,会降低其 抗拉强度。现开发出一种能抗化学制剂的新型布料, 为考察其抗侵蚀作用,特选定 4 种化学制剂和 5 匹 布。考虑到布匹间的差异,特在每匹布的中部切取 4段布料组成一个区组,用随机化完全区组设计安 排试验。
H 0:b1 b2 bb 0 H1:诸bi中至少有一个不为零 在此假设下,检验统计量为:
F MS B MS e
尽管对此检验的合理性存在着争论,但使用 F 检验也未 尝不可,把检验结果作为一种参考也是有价值的。
讨论三:多重比较
随机化完全区组设计中,若处理为固定效应,并且 方差分析确认处理间有显著差异,不论区组效应是否是 随机的,都应对处理效应施行多重比较。