双因素的方差分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
双因素的多重比较方法
生物工程 10212575 陈晓穗
摘要:本文首先扼要地介绍了多重比较的方法种类,其次引用了一个实例具体地展示了无交叉相互作用的双因素的多重比较方法。
关键词:最小显著差数法 最小显著极差法 双因素 多重比较
1.前言
用方差分析检验样本的差异是否显著后,获得了显著或极显著的结论。
此时人们便想进一步的了解具体到哪些平均数间有显著差异,哪些不显著。
这就有必要进行两两地比较平均数,以判断这两组数据的显著差异性。
统计学把多个平均数两两间互相比较称为多重比较。
多重比较常有的方法有:最小显著差数法和最小显著极差法。
2.多重比较法 2.1 多重比较法的种类 2.1.1 最小显著差数法
最小显著差数法,简称LSD 。
它其实只是t 检验的一个简单变形,并未对检验水准做出任何校正,只是在标准误的计算上充分利用了样本信息, 为所有组的均数统一估计出了一个更为稳健的标准误,其中MS 误差是方差分析中计算得来的组内均方,它一般用于计划好的多重比较。
由于单次比较的检验水准仍为α,因此可认为LSD 法是最灵敏的。
此法的基本作法是:在F 检验显著的前提下,先计算出显著水平为α的最小显著差数αLSD ,然后将任意两个处理平均数的差数的绝对值
.
.j i x x -与其比较。
若
.
.j i x x ->LSDa 时,则.i x 与.j x 在α水平上差异显
著;反之,则在α水平上差异不显著。
最小显著差数由..)(j i e x x df a a S t LSD -=计算。
式中)(e df t α为在F 检验中误差自由度下,显著水平为α的临界t 值,..j i x x S -为均数差异标准误,由n MS S e x x j i /2..=-算得。
其中e MS 为F 检验中的误差均方,n 为各处理的重复数。
当显著水平α=0.05和0.01时,从t 值表中查出)(05.0e df t 和
)(01.0e df t ,代入式得:
.
.
.
.
)(01.001.0)(05.005.0j
i e j
i e x x df x x df S t LSD S t LSD --==
2.1.2 最小显著极差法
最小显著极差法,简称LSR 。
该法特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)k 的不同而采用不同的检验尺度,以克服LSD 法的不足。
这些在显著水平α上依秩次距k 的不同而采用的不同的检验尺度叫做最小显著极差。
该法常用的有q 检验法和新复极差法两种。
2.1.2.1 q 检验法
q 检验法(q test)此法是以统计量q 的概率分布为基础的。
q 值由下式求得:
x S q /ω=。
式中,ω为极差,n MS S e x /=为标准误,q 分布依赖于误差自
由度df e 及秩次距k 。
利用q 检验法进行多重比较时,为了简便起见,不是将由
x S q /ω=式算出的q 值与临界q 值),(k df a e q 比较,而是将极差与x k df a S q e ),(比
较,从而作出统计推断。
x k df a S q e ),(即为α水平上的最小显著极差。
当显著水平α=0.05和0.01时,从q 值表中根据自由度e df 及秩次距k 查出),(05.0k df e q 和
),(01.0k df e q 代入x k df a a S q LSR e
),(=式得
x
k df k x k df k S q LSR S q LSR e e ),(01.0,01.0),(05.0,05.0==
2.1.2.1新复极差法
新复极差法与q 检验法的检验步骤相同,唯一不同的是计算最小显著极差时需查
SSR 表而不是查q 值表。
最小显著极差计算公式为x k df a k
a S SSR LSR e ),(,=
其中式中),(k df e SSR α是根据显著水平α、误差自由度e df 、秩次距k ,由SSR 表查得的临界SSR 值,n MS S e x /=。
α=0.05和α=0.01水平下的最小显著极差
为:
x k df k x k df k S SSR LSR S SSR LSR e e ),(01.0,01.0),(05.0,05.0==
3 双因素的多重比较
在单因素中,只需要两两均值地比较即刻得出具体哪些组具有显著性差异。
但在双因素中,则需要更复杂的计算过程,其中需要用到以上介绍到的各种多重比较方法。
分别比较A 因素与观测值和B 因素与观测值的显著性差异。
以下引用网上的一个实例作出具体的步骤说明。
【例】 为研究IBA 激素对银杏生长发育的影响,现有4个不同品系银杏根系,各种3株,随机分别施用不同剂量的激素,然后在相同条件下试验,并测得它们根系的生长量,见下表。
各品系银杏不同剂量激素的根系生长量(cm) 品系(A )
IBA 激素剂量(mg/100g)(B )
合计x i..
平均.i x
B 1(0.2)
B 2(0.4) B 3(0.8) A 1 106 116 145 367 122.3 A 2 42 68 115 225 75.0 A 3 70 111 133 314 104.7 A 4 42 63 87 192 64.0 合计x .j 260 358 480 1098 平均j x .
65.0
89.5
120.0
获得以上的数据,首先需要进行双因素的方差分析。
①、对品系A 提出的假设为
▪ H 0A : μA1 =μA2 =μA 3 =μA 4 ▪ H 1A : μA1、μA2、μA 3、μA 4不全相等
②、对剂量B 提出的假设为
▪ H 0B : μB1 =μB2 =μB 3
▪ H 1B : μB1、μB2、μB 3、不全相等 计算各项平方和与自由度:
0000.100467)34/(1098/..22=⨯==ab x C
0000
.60740000.1004670000.1065410000.100467)480358260(4
116667.64570000.1004676667.1069240000
.100467)192314225367(3
1
10000.130750000.1004671135420000
.100467)8763116106(2222
.22222.22222
=-=-++=-==-=-+++=-==-=-++++=-=
∑∑∑∑C x a SSB C x b SSA C x SST j
i ij
6
2311,21313
141,1113413333
.54360700006667.64570000.13075=--=--==-=-==-=-==-⨯=-==--=--=B A T e B A T df df df df b df a df ab df SSB SSA SST SSE 列出方差分析表,进行F 检验:
资料的方差分析表
变异来源 平方和 自由度 均方 F 值 A 因素(品系) 6457.6667 3 2152.5556 23.77** B 因素(剂量)
6074.0000 2 3037.0000 33.54**
误差 543.3333 6 90.5556
总变异 13075.0000
11
根据df 1=df A =3,df 2=df e =6查临界F 值,F 0.01(3,6)=9.78;根据df 1=df B =2,df 2=df e =6查临界F 值,F 0.01(2,6)=10.92。
因为A 品系的F 值23.77>F 0.01(3,6),P <0.01,差异极显著,拒绝H 0A ,接受
H 1A ;B 剂量的F 值33.54>F 0.01(2,6),P <0.01,差异极显著拒绝H 0B ,接受H 1B 。
说明不同品系和不同IBA 激素剂量对银杏根系的发育均有极显著影响,有必要进一
步对A 、B 两因素不同水平的平均测定结果进行多重比较。
多重比较:
(1)不同品系的根系平均生长量比较 各品系平均数多重比较表见表6-23。
表1 各品系根系平均生长量多重比较(q 法)
品系 平均数.i x .i x -64.0
.i x -75.0
.i x -104.7
A 1 122.3 58.3** 47.3** 17.6 A 3 104.7 40.7** 29.7**
A 2 75.0 11.0
A 4 64.0
在两因素单独观测值试验情况下,因为A 品系每一水平的重复数恰为B 剂量的水平数b ,故A 品系的标准误b MS S e x i /.=,此例b =3,MS e =90.5556,故
4941.53/5556.90/.===b MS S e x i
根据df e =6,秩次距k =2,3,4,q 值表中查出α=0.05和α=0.01的临界q 值,与标准误
4941.5.=i x S 相乘,计算出最小显著极差LSR ,结果见表6-24。
表2 q 值及LSR 值
df e
秩次距k
q 0.05 q 0.01 LSR 0.05 LSR 0.01 6
2
3.46 5.24 19.01 28.79 3
4.34 6.33 23.84 34.78 4
4.90
7.03
26.92
38.62
将表1中各差数与表2中相应最小显著极差比较,作出推断。
检验结果已标记在表6-23中。
结果表明,A 1、A 3品系与A 2、A 4品系的根系平均生长量均有极显著的差异;但A 1与A 3及A 2与A 4品系间差异不显著。
(2)不同IBA 激素剂量的根系平均生长比较 B 剂量各剂量水平平均数比较表见表6-25。
表3 不同IBA 激素剂量的根系平均生长量多重比较(q 法)
IBA 激素剂量
平均数j x . j x .-65.0 j x .-89.5
B 3(0.8) 120.0 55.0** 30.5**
B 2(0.4) 89.5 24.5*
B 1(0.2) 65.0
在两因素单独观测值试验情况下,B 剂量每一水平的重复数恰为A 品系的水平数a ,故B 因素的标准误a MS S e x j /.=,此例a =4,MS e =90.5556。
故
7580.44/5556.90/.===a MS S e x j
根据df e =6,秩次距k =2,3查临界q 值并与j x S .相乘,求得最小显著极差LSR ,见表6-26。
表4 q 值与LSR 值
df e
秩次距 q 0.05 q 0.01 LSR 0.05 LSR 0.01 6
2
3.46
5.24
16.46
24.93
3
4.34
6.33
20.65
30.12
将表3各差数与表4相应最小显著极差比较,作出推断。
结果表明,施用IBA 激素剂量为0.8 mg的根系生长量极显著大于剂量为0.4 mg和0.2mg的根系生长量,而后两种剂量的根系生长量间也有显著差异。
这里介绍的双因素多重比较的方法只适用于两个因素无相互交叉作用的情况。
参考文献:
[1]薛茜,刘万里,尔西丁,马金凤,曹明芹. 常用多重比较方法. 中国医院统计. 2008年3月第15卷第1:29-31
[2] 惠凤莲.论多重比较的几种方法. 统计与信息论坛. 1997 年第4 期:29-33
[3]百度文库/view/4c4b891655270722192ef755.html。