巢式嵌套设计的方差分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
巢式嵌套设计的方差分
析
本页仅作为文档封面,使用时可以删除
This document is for reference only-rar21year.March
巢式嵌套设计的方差分析
嵌套设计被称为巢式设计(nested design)或系统分组(hierarchal classification)的资料,有些教科书上称这类资料为组内又分亚组的分类资料。
根据因素数的不同,套设计可分为二因素(二级)、三因素(三级)等套设计。
将全部k个因素按主次排列,依次称为1级,2级… k级因素,再将总离差平和及自由度进行分解,其基本思想与一般方差分析相同。
所不同的是分解法有明显的区别,它侧重于主要因素,并且,第i级因素的显著与否,是分别用第i级与第i+1级因素的均方为分子和分母来构造F统计量,并以F测验为其理论根据的。
嵌套试验设计应用:
(1)情形一
受试对象本身具有按其隶属关系进行分组再分组的各种因素。
比如:选取某种植物3个品种(A),在每一株内选取两片叶子(B)(嵌套在植株因素下的第二个因素),用取样器从每一片叶子上选取同样面积的两个样本(两次重复),称取湿重。
不是把B因素的2个水平简单地看作是与A因素3个水平的全面组合,而是分别嵌套在A1、A2、A3三个水平之下,相当于B因素有6个水平,但它们所产生的离差平和中又包含了A因素的作用,一般来说,它大于模型所提供的总误差,用它作为度量A因素作用大小的误差项,是严格考核A因素的一种措施。
部数据之总和为T,全部数据之平方和为W,校正数为C,Qi为系统分组分到第i级因素时,各小组数据之和的平方均值的和。
W=∑2ijk x C=nab T2 Q1=nb1∑2..i T Q2=n1∑2.ij T
(2)情形二
受试对象本身并非具有分组再分组的各种分组因素,而是各之间在专业上有主次之分。
区分嵌套设计与析因设计的关键是看因素之间的地位是否平等,因素的地位平等则属于析因设计,不平等则属于嵌套设计。
比如:为了研究某种抗菌药的效果,对小白鼠进行试验。
考虑3个试验因素,因素A(用此抗菌药与否)可分为A1(对照组不用抗菌药)、A2(试验组用抗菌药);因素B(小白鼠代次)可分为B1(第1代)、B2(第2代)、B3(第3代);
因素C(性别)可分为C1(雄性)、C2(雌性)。
让第1代小白鼠被这种细菌感染,按雌雄分别统计对照组和试验组小白鼠的存活率,让存活的小白鼠分别在各自的组内(指对照组和试验组)生产第二代,对于第2代重复上面的试验,……, 3因素各水平搭配下都重复2次试验,每次都有足够数量的小白鼠(因为观测指标是存活率),有人进行了如下的设计并收集到如下的试验数据。
由专业知识得知:3因素的主次顺序为A→B→C。
试分析3因素对小白鼠存活率的影响。
方差分析表:
样本含量为nab,全部数据之总和为T,全部数据之平和为W,校正数为C=
T2,Qi
nabc
为系统分组分到第i级因素时,各小组数据之和的平方均值的和。
注意:由于在嵌套设计中,两个因素之间不能自由交错地组成各种处理组合,因而,不能考察因素之间地交互作用。
所以,凡是交互作用比较重要的试验,都不应采用这种设计。
进行嵌套设计的方差分析的过程:nested、anova或GLM,过程nested过程更简单一些,但它受数据中读取分组变量先后顺序的影响很大,应先用SORT过程按因素重要程度进行排序整理;过程anova或GLM不需要排序整理,且容易进行均值比较。
平衡资料用过程nested、anova或GLM三种过程做结果是一样的;若不是平衡资料,必须用过程GLM。
例1选取某种植物3个品种(Plant),在每一株内选取两片叶子(Leaf)(嵌套在植株因素下的第二个因素),用取样器从每一片叶子上选取同样面积的两个样本(两次重复),称取湿重。
对以上结果进行方差分析。
(固定效应Plant+随机效应Leaf)
解: SAS程序如下:
Data Nested;
Input plant $ leaf wt @@;
Cards;
a 1 a 1
b 1 b 1
c 1 c 1
a 2 a 2
b 2 b 2
c 2 c 2
;
Class plant leaf ;
Model wt = plant leaf(plant);
Test H = plant E = leaf(plant);
Means plant / Duncan E = leaf(plant);
Run;
Proc Sort;
By plant leaf;
Run;
Proc Nested;
Class plant leaf;
Var wt;
Run;
输出结果见示例。
例2在室内用4种培养液培养某植物,每种培养液培养3盆,每盆4株,一个月后测定其株高生长量(mm)。
试对以上结果进行方差分析。
(固定效应+随机效应)
Data amm;
Do a =1 to 4;
Do b = 1 to 3;
Do rep = 1 to 4;
Input y @@;
Output;
End;
End;
End;
Cards;
50 55 40 35 35 35 30 40 45 40 40 50
50 45 50 45 55 60 50 50 55 45 65 55
85 60 90 85 65 70 80 65 70 70 70 70
60 55 35 70 60 85 45 75 65 65 85 75
;
Proc Sort;
By a b rep;
Run;
Class a b;
Var y;
Run;
Proc anova; /*均数的多重比较 */
Class a b;
Model y=a b(a);
Test h=a e=b(a);
Means a /duncan e=b(a);
Run;
结果:
例3为了研究某种抗菌药的效果,对小白鼠进行试验。
考虑3个试验因素,因素
A(用此抗菌药与否)可分为A1(对照组不用抗菌药)、A2(试验组用抗菌药);因素B(小白鼠代次)可分为B1(第1代)、B2(第2代)、B3(第3代);因素C(性别)可分为C1(雄性)、C2(雌性)。
让第1代小白鼠被这种细菌感染,按雌雄分别统计对照组和试验组小白鼠的存活率,让存活的小白鼠分别在各自的组内(指对照组和试验组)生产第二代,对于第2代重复上面的试验,……, 3因素各水平搭配下都重复2次试验,每次都有足够数量的小白鼠(因为观测指标是存活率),有人进行了如下的设计并收集到如下的试验数据。
由专业知识得知:3因素的主次顺序为A→B→C。
试分析3因素对小白鼠存活率的影响。
DATA abc;
DO r=1 to 2;
DO a=1 to 2;
DO b=1 to 3;
DO c=1 to 2;
INPUT p @@;
y=ARSIN(SQRT(p/100));
OUTPUT;
END;
END;
END;
END;
CARDS;
28 33 15 26 26 18 56 62 48 66 70 49
19 27 11 22 20 11 51 60 44 61 65 55
;
PROC SORT;
BY a b c r;
RUN;
PROC NESTED;
CLASS a b c;
VAR y;
RUN;
PROC GLM;
CLASS a b c;
MODEL y=a b(a) c(a b);
TEST H=a E=b(a);
TEST H=b(a) E=c(a b);
Means a/duncan E=b(a);
RUN;
例4 鸡的试验《试验统计学》P134-区靖祥。