第9章方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第九章 方差分析
前面介绍了两个样本均数比较的t 检验,本章介绍多个样本均数比较的F 检验。

方差分析(analysis of variance, ANOV A )是上世纪20年代发展起来的一种统计方法,由英国著名统计学家R. A. Fisher 提出,又称F 检验,是通过对数据变异的分析来推断两个或多个样本均数所代表总体均数是否有差别的一种统计推断方法。

第一节 方差分析的基本思想和应用条件
一、方差分析的基本思想
方差分析的基本思想是把全部观察值间的变异按研究目的、设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。

例9.1 为研究大豆对缺铁性贫血的恢复作用,选取已做成贫血模型的大鼠36只,随机等分为3组,每组12只,分别用三种不同的饲料喂养:不含大豆的普通饲料、含10%大豆饲料和含15%大豆饲料。

喂养一周后,测定大鼠红细胞数(×1012/L ),试分析喂养三种不同饲料的大鼠贫血恢复情况是否不同?
表9.1三种不同饲料喂养的大鼠红细胞数(×1012/L)
普通饲料 10%大豆饲料 15%大豆饲料
合计
X
4.78 4.65 6.80 4.65 6.92
5.91 3.98 4.44 7.28 4.04
6.16
7.51 3.44 5.99 7.51 3.77 6.67 7.74 3.65 5.29
8.19 4.91 4.70 7.15 4.79 5.05 8.18 5.31 6.01 5.53 4.05 5.67 7.79 5.16 4.68 8.03 i n
12 12 12 36 (n ) i X ∑
52.53 66.23 87.62 206.38(X ∑) i X
4.38
5.52 7.30 5.73 (X ) 2
i
X ∑
234.278 3
373.285 1
647.731 2
1 255.294 6(2
X ∑)
表9.1是按完全随机设计获得的36个数据(X ),其中包含以下三种变异: 1. 总变异 36只大鼠喂养一周后测定红细胞数X 各不相同,即X 与总均数
X 不同,这种变异称为总变异(total variation)。

该变异既包含了三种不同饲料(即
处理因素)的影响,又包含了随机误差(即大鼠的个体差异和测量误差)。

总变异用
MS 总即所有数据的均方(mean square)来表示。

2()SS X X =-∑总, 1N ν=-总 (9.1)
SS MS ν=

总总
(9.2)
2. 组间变异 三种(k =3)不同的饲料喂养后,大鼠红细胞数的均数各不相同,即与总均数的不同,这种变异称为组间变异(variation between groups)。

它反映了三种不同饲料的影响,同时也包括了随机误差。

组间变异用组间均方
表示。

2() i i SS n X X -∑组间=,11 k νν=-=组间 (9.3)
SS MS ν=
组间
组间组间
(9.4)
3. 组内变异 各组内大鼠红细胞数X 大小各不相同,即每组观察值X 与本组的样本均数的不同,这种变异称为组内变异(variation within groups)。

组内变异仅反映随机误差,又称误差变异。

组内变异用组内均方表示。

2()ij i i
j
SS X X SS SS SS =-=-∑∑组间组内组内总 或 2N k νν==-组内 (9.5)
SS MS ν=
组内
组内组内
(9.6)
若各样本所代表的总体均数相等,即各样本来自于同一总体,在本例指三种不同饲料的处理效应相同,各组均值相等,组间变异和组内变异一样,只反映随机误差作用大小。

如果仅有随机误差,则MS 组间=MS 组内。

一般地,MS 组间/MS 组内比值服从分子自由度为1ν,分母自由度为2ν的F 分布(F distribution)。

MS F MS =
组间
组内
(9.7) 从理论上讲,如果处理效应相同,则1F =或1F ≈(由于随机误差的影响)。

i X i X X MS 组间i X MS 组内
相反,各处理效应不同,即三个总体均数不全相同时,>MS MS 组间组内,>1F 。


F 值要大到多少才有统计学意义?F 值这一统计量有其抽样分布的规律,根据其分布可以获得某F 值所对应的P 值,然后就可以根据规定的检验水准α作出统计推断的结论。

综上所述,方差分析就是把全部数据的总变异分解成两个或多个组成部分,不同设计类型的总变异分解有所不同,其中都包括随机误差部分,分别将各部分的变异的均方与随机误差均方进行比较,通过F 值及相应的P 值来判断均数间的差别是否具有统计学意义。

二、方差分析的应用条件
进行方差分析时,数据应满足两个基本条件: 1. 各样本是相互独立的随机样本,均服从正态分布
当样本含量较小时,资料是否来自正态分布的总体难以进行直观判断,常需根据专业经验或进行正态性检验来判断;当样本含量足够大时,无论资料是否来自正态分布总体,数理统计的中心极限定理均保证了样本均数的抽样分布近似服从正态分布。

如果总体极度偏离正态,需作数据转换,改善其正态性或选用其它的统计分析方法。

2. 各样本的总体方差相等
各样本的总体方差相等,即方差齐性(homogeneity of variance)。

方差齐性的判断通常采用方差齐性检验(homogeneity of variance test),检验多个样本所代表的总体方差是否不等可利用的方法有Bartlett χ2检验和Levene 检验。

这里介绍Levene 检验。

Levene 检验法由Levene. H 于1960年提出,它可用于检验两总体或多个总体的方差齐性。

用于多总体方差齐性检验时,所分析的资料可不具有正态性。

该法是将原始观测值ij X 转换为相应的离差ij z ,然后按式(9.8)进行单因素方差分析,以相应自由度查F 界值表得出结论。

2
122
()() , 1 , (1)()
νν-∑-==-=--∑∑-i i ij i N k n z z F k N k k z z (9.8)
式中i N n =∑,k 为样本数。

离差ij z 计算方法有如下4种:
(1)ij ij i z X X =- (2)2()ij ij i z X X =- (3)ij ij i z X M =- (4)22
(2)()(1)(1)(2)
i i ij i i ij i i i W n n X X W n S z n n +----=
--
其中i X 表第i 组的算术均数、i M 表第i 组的中位数、W 一般取0.5。

第二节 完全随机设计资料的方差分析
完全随机设计是将受试对象随机分配到各处理组,再观察其实验效应。

各组样本含量可以相等,也可不等。

完全随机设计是最常见的单因素两水平或多水平的实验设计方法。

完全随机设计资料的方差分析又称单因素方差分析(one-way ANOV A)。

例9.1就是一个完全随机设计的例子,即将同质的受试对象随机地分配到各处理组,再观察其实验效应。

一、离均差平方和与自由度的分解
完全随机设计方差分析的总变异分为组间变异和组内变异两部分:
, SS SS SS ννν=+=+总组间总组间组内组内 (9.9)
方差分析计算公式见表9.2。

表9.2 完全随机设计方差分析表
变异来源 SS
ν
MS
F
组间变异 2)(X X
n i
i
-∑
k –1 SS ν组间组间 MS MS 组间组内
组内变异
SS SS -总组间
N –k
SS ν组内组内
二、完全随机设计资料方差分析的基本步骤
以例9.1资料说明方差分析的基本步骤: 1. 建立检验假设,确定检验水准
0H :三个总体均数相等,即三种不同饲料喂养的大鼠红细胞数均数相同
1H :
三个总体均数不全相等,即三种不同饲料喂养的大鼠红细胞数均数不全相同
0.05α=
2. 计算检验统计量
1639.7236
38.2062946.1255)(2
2
2
2
=-=-
=-=∑∑∑N
X X X X SS )(总
136135N ν=-=-=总
2)(X X n SS i i -=∑组间
222
12 4.38-5.7312 5.52-5.73127.30-5.7351.9780()()()=⨯+⨯+⨯=
1312k ν=-=-=组间
51.9780
25.98902
SS MS ν=
=
=组间
组间组间
72.163951.978020.1859组内总组间=-=-=SS SS SS
36333N k ν=-=-=组内
20.1859
0.611733
SS MS ν=
=
=组内
组内组内
25.9890
42.48650.6117
组间组内=
==MS F MS
方差分析结果见表9.3。

表9.3 例9.1资料的方差分析表
3. 确定P 值,作出统计推断
根据分子自由度、分母的自由度2ν查F 界值表(附表4)得P 值。

本例12ν=,
233ν=。

因F 界值表中2ν无33,在保守的原则下取不大于33且与其最接近者2
ν=32得:0.05(2,32)0.01(2,32)3.30, 5.34F F ==,P <0.01。

按α=0.05水准,拒绝0H ,差别有统计学意义,可以认为喂养三种不同饲料的大鼠红细胞数的总体均数不全相

同。

至于三个样本所代表的总体均数两两之间的比较,还需运用本章第四节介绍的多个均数间两两比较的方法进行比较。

第三节 随机区组设计资料的方差分析
随机区组设计又称配伍组设计,通常是将受试对象按性质(如动物的窝别、性别、体重等非实验因素)相同或相近者组成b 个区组(又称配伍组),再将每个区组中的受试对象分别随机分配到k 个处理组中。

随机区组设计的方差分析属于无重复数据的两因素方差分析(two-way ANOV A)。

例9.2 利用随机区组设计研究不同温度对家兔血糖浓度的影响,某研究者进行了如下实验:将24只家兔按同窝别配成6个区组,每个区组4只,分别随机分配到温度为15℃、20℃、25℃、30℃的4个处理组中,测量家兔的血糖浓度值(mmol/L),结果如下表9.4所示。

分析4种温度下测量家兔的血糖浓度值是否不同?
表9.4 四种温度下测量家兔的血糖浓度值(mmol/L )
窝别
温度(℃)
j n
j X
15
20 25 30 2 110.10 83.17 100.78 140.62 4 108.67 3 100.15 110.30 120.55 120.49 4 112.87 4 74.20 82.43 100.66 110.31 4 91.90 5 80.57 97.90 115.76 103.56 4 99.45 6
102.77 81.20 90.30 138.54 4
103.20
i n 6 6 6 6 24(N ) i X ∑
550.01 537.30 618.19 726.28 2 431.78(X ∑)
91.67
89.55 103.03
121.05
101.32 (X )
(2
i X ∑)
51 470.998 7
48 829.183 8
64501.0337 89 092.9434 253 894.1596(2X ∑)
一、离均差平方和与自由度的分解
表9.4按随机区组设计获得的24个数据X 可以看到以下4种变异: 1. 总变异为24只家兔血糖浓度值X 大小各不相同,即X 与总均数X 的不同。

该变异来自三个方面:4种温度的影响、6个窝别的影响和随机误差,总变
i X
异的量化值用MS 总表示。

2. 处理组变异(variation between treatments)为4种温度下家兔血糖浓度值的样本均数i X 各不相同,即i X 与总均数X 的不同。

它反映了4种温度(4k =)的影响,同时还包括随机误差,其大小可用处理组均方MS 处理表示。

2() 1 i i SS n X X k ν- =-∑处理处理=, (9.10)
SS MS ν=
处理
处理处理
(9.11)
3. 区组变异(variation between blocks)为6个不同窝别家兔血糖浓度值的样本均数j X 各不相同,即j X 与总均数的不同。

它既反映了6个区组(6b =)不同的影响,同时也包括随机误差,其大小可用区组均方MS 区组表示。

2()1j j SS n X X b ν-=-∑区组区组=, (9.12)
SS MS ν=
区组
区组区组
(9.13)
4. 误差变异 随机区组设计的总变异中扣除处理组变异和区组变异后剩余的变异为误差变异,可以认为完全由随机误差造成的,其大小用误差均方MS 误差表示。

SS SS SS SS νννν =--=--处理处理总总误差区组误差区组, (9.14)
MS SS ν=
误差误差
误差
(9.15)
在例9.2资料中:若所代表的总体均数相等,也就是4种温度下血糖浓度
值相同,处理组变异和误差变异一样,只反映随机误差作用大小,则=M
S M S
处理
误差

由于随机误差的影响,1F ≈;相反,不同温度的作用不同,即4种温度下总体均数不全相同时,>MS MS 处理误差,>1F 。

若j X 所代表的总体均数相等,也就是6组窝别血糖浓度值相同,区组变异和误差变异一样,只反映随机误差作用的大小,则MS MS =区组误差,由于随机误差的影响,1F ≈;相反,不同区组的作用不同,即6个区组总体均数不全相同时,>MS MS 区组误差,>1F 。

通过F 界值表(附表4)或用统计软件得到相应的P 值,然后根据所取的检验水准α作出推断结论。

综上,随机区组设计方差分析的总变异分为处理组变异、区组变异和误差三
X i X
部分:
, SS SS SS SS νννν=++=++处理处理总总区组误差区组误差 (9.16)
计算公式见表9.5。

表9.5 随机区组设计方差分析表
变异来源 SS
ν
MS
F
处理组 2
)(X X n i
i
-∑ k –1
SS ν处理处理
MS MS 处理误差 区 组 2
)(X X n j
j -∑
b –1
SS ν区组区组
MS MS 区组误差
误 差
SS SS SS --处理总区组
ννν--总处理区组
SS ν误差误差
二、随机区组设计资料方差分析的基本步骤
以例9.2资料说明其分析的步骤: 1. 建立检验假设,确定检验水准 处理组:
0H :4个处理组的总体均数全相等,即4种温度下家兔血糖浓度值相同 1H :
4个处理组的总体均数不全相等,即4种温度下家兔血糖浓度值不全相 同 区组:
0H :6个区组的总体均数全相等,即不同窝别家兔血糖浓度相同 1H :6个区组的总体均数不全相等,即不同窝别家兔血糖浓度不全相同
0.05α=
2. 计算检验统计量
2
2
2
2
2 431.7825
3 894.15()()7496.0776
24
96X SS X X X N
-=-=-
==∑∑∑总() 124123
N ν=-=-=总 2()i i SS n X X =-∑处理
2222
550.01101.32537.30101.32618.19101.32726.2816()6()6()0.61()32=⨯+⨯+-+⨯-⨯-- 3743.114
= 13k ν=-=处理
3743.1144
1247.70483
SS MS ν=
=
=处理
处理处理
2
()j j SS n X X =-∑区组
22291.86101.32108.67104()4()1.32103.20101.42()3=⨯+⨯+⋅⋅⋅+-⨯--1490.7372=
1615b ν=-=-=区组
1490.7372
298.14745
SS MS ν=
=
=区组
区组区组
7496.07763743.11442262.2260
1490.7372SS SS SS SS --=--==处理区组误差总
233515νννν=--=--=处理
区组误差总 2262.2260
150.815115
SS MS ν=
=
=误差
误差误差
1247.7048
1508.2.81511
73MS F MS =
==处理处理误差 298.1474
1501.81.976951
MS F MS =
==区组区组误差
方差分析结果见表9.6。

表9.6 例9.2资料的方差分析表
变异来源 SS
ν
MS
F
P
总变异 7 496.077 6 23
处理组(温度) 3 743.114 4 3 1 247.704 8 8.273 1 <0.01 区 组(窝别)
1 490.737
2 5
2 98.147 4 1.976 9 >0.05 误 差
2 262.226 0
15
150.815 1
3. 确定P 值,作出统计推断
根据处理组F 值分子的自由度ν处理,分母的自由度ν误差;区组F 值分子的自由度ν区组,分母的自由度ν误差,查F 界值表(附表4),得到处理组和区组的P 值。

根据表9.6,按α=0.05水准,区组间不拒绝0H ,尚不能认为不同窝别家兔血糖浓度值不同;处理组间拒绝0H ,差异具有统计学意义,可以认为4种温度下家兔血糖浓度值不全相同。

4个总体均数中具体哪些不同,还需要运用多个均数间的两两比较方法进一步分析。

第四节多个均数的两两比较
例9.1和例9.2,经方差分析后得到不同处理组间的<0.01
P,按0.05
α=水准,
拒绝
H,说明处理组总体均数不全相等,若要具体比较哪两个总体均数不同则需进一步作两两比较。

方差分析后均数的两两比较能否运用前面介绍的t检验?现通过一个统计模拟回答该问题:从已知正态总体N(12, 62)中随机抽样,共抽取了10组(10
k=)样
本,每组样本的样本含量15
i
n=,每组样本均可算出其均数和标准差,得表9.7的结果。

表9.7 随机抽取10个样本(15
i
n=)的均数和标准差
样本编号k 1 2 3 4 5 6 7 8 9 10 X14.44 10.05 13.98 10.36 10.45 13.58 11.18 13.00 10.21 9.97 S 5.86 7.28 4.55 5.40 5.51 7.32 6.15 5.12 4.68 5.32
10个样本每两组进行t检验,比较次数为
(1)10(101)
45 222
k k k
m
⎛⎫--
====

⎝⎭。

实验结果表明:若0.05
α=,则在45次t检验中,发现4次有统计学意义,结果见表9.8。

表9.8 45次比较中4次有统计学意义的结果
比较组1与9 1与10 3与9 3与10
t 2.19 2.19 2.24 2.22
P0.037 0.037 0.033 0.035
理论上10个样本均来自同一正态总体N(12, 62),应无统计学差异。

进行两样本均数t检验,规定允许犯I型错误的概率为0.05
α=,本实验犯I型错误的概率为:4450.09
≈,大于0.05,因此多个均数两两之间比较进行t检验,会增大I型错误。

多个均数多重比较的方法较多,本章介绍常用的SNK法和Dunnet-t 法。

一、SNK法
在探索性研究中,研究设计时通常未考虑均数多重比较问题,经方差分析得出有统计学意义的结论后,才决定对每两个均数都进行比较,这时可采用SNK
法(Student-Newman-Keuls)。

目的是比较每两个样本均数所代表的总体均数是否不同,其检验统计量为q ,又称q 检验。

e , =A B
A B
X X X X X X q S νν--=
=
(9.17)
式中分子为任意两个对比组A 、B 的样本均数之差,分母是差值的标准误,式中A n 和B n 分别为A 和B 两样本的例数,e MS 为前述方差分析中算得MS 组内或
MS 误差。

例9.3 对例9.1资料三组总体均数进行两两比较。

1. 建立检验假设,确定检验水准
0H :任意两对比组的总体均数相等 1H :任意两对比组的总体均数不等
0.05α=
2. 计算检验统计量
首先将3个样本均数由大到小排列,并编组次:
组别
15%大豆饲料
10%大豆饲料
普通饲料 i X
7.30 5.52 4.38 组次
1
2
3
3个样本均数的多重比较共需作3次比较,q 检验结果见表9.9。

表中第1列为所有对比组;第2列为两对比组均数之差,如第1行其值为7.30–4.38=2.92;第3列为两均数之差标准误,如第1
0.23=;第5列a 为对比组内包含的组数:3个样本均数由大到小排列时,组次1与2或2与3相比,比较组内包含组数是2个即2a =,组次1与3相比,比较组内包含组数是3个即3a =。

表9.9 例9.1资料的SNK 法检验计算表
对比组 A 与B (1) 两均数之差A B X X - (2)
两均数之差 标准误 A
B
S -
(3) q
(4)=(2)/(3) 对比组内包含组数
a (5)
q 界值
P
(8) 0.05
(6) 0.01 (7) 1与3
2.92
0.23
12.70 3
3.49
4.45
<0.01
1与2 1.78 0.23 7.74 2 2.89 3.89 <0.01 2与3
1.14
0.23
4.96
2
2.89
3.89
<0.01
3. 确定P 值,作出统计推断
以MS e 的自由度33ν=e (取30)和a 查q 界值表(附表5)。

本例查q 界值表得
(0.05,30)q 和(0.01,30)q 的界值,列于表9.9中,将第(4)栏算得的q 值与相应q 界值进行比较得各组的P 值。

可以认为喂养三种不同饲料的大鼠红细胞数之间的差别均有统计学意义,总体均数各不相同。

二、Dunnett-t 检验
在设计阶段根据研究目的或专业知识进行某些均数间的两两比较,常用于事先有明确假设的证实性研究,如多个处理组与对照组的比较,某一对或某几对在专业上有特殊意义的均数间的比较等,这时可采用Dunnett-t 检验。

其公式为
e =T C
T C
D X X X X X X t S νν--=
=
(9.18)
式中T 代表多个处理组,C 为对照组;分子为任意处理组与对照组样本均数的差值;分母是差值的标准误;T n 和C n 分别为处理组与对照组的样本例数。

例9.4 对例9.2资料,问20℃、25℃和30℃(均为实验组)分别与15℃(对照组)的家兔血糖浓度值总体均数是否不同?
1. 建立检验假设,确定检验水准
0H :任一实验组与对照组的总体均数相同 1H :任一实验组与对照组的总体均数不同
0.05α=
2. 计算检验统计量
7792.150=e MS 12346n n n n ====
09
.7)6
1
61(7792.150)11(
=+=+=-C T e X X n n MS S C T 表9.10 例9.2资料的Dunnett-t 检验计算表
对比组
(1) 均数差值 (2) 标准误 (3) D t
(4)=(2)/(3) Dunnett -t 界值
P
15℃与20℃
-2.12
7.09
-0.30
2.61
>0.05
15℃与25℃ 11.36 7.09 1.60 2.61 >0.05 15℃与30℃
29.38
7.09
4.14
2.61
<0.01
3. 确定P 值,作出统计推断
根据D t 的绝对值,以e MS 的自由度e 15ν=和实验组数13a k =-=(不含对照组)查Dunnett-t 界值表(附表6.2)得P 值,列于表9.10中。

按α=0.05水准,20℃、25℃组分别与15℃组相比,差别均无统计学意义,尚不能认为20℃与15℃组、25℃与15℃组家兔的血糖浓度值的总体均数不同;30℃与15℃组的差别有统计学意义,可以认为30℃与15℃组家兔的血糖浓度值的总体均数不同。

第五节 其他常见设计资料的方差分析
一、交叉设计资料的方差分析
交叉设计可分为两阶段交叉设计和多阶段交叉设计,医学实际工作中应用较多的是前者。

本节介绍两阶段交叉设计的方差分析。

例9.5 某医师研究A 、B 两种药物对失眠患者改善睡眠的效果,将12名患者按交叉设计方案随机分为两组,观察两种药物、两个阶段睡眠时间增加量(小时),每个阶段治疗两周,间隔两周。

第一组患者为A→B 顺序,即第一阶段服用A 药,第二阶段服用B 药;第二组为B→A 顺序,即第一阶段服用B 药,第二阶段服用A 药。

结果见表9.11。

表9.11 失眠患者睡眠时间增加量(小时)
n 个体X 个体个体
A →
B 1 2.7 1.6 2 4.3 2.15 2 3.1 2.1 2 5.2 2.60 3 2.9 1.6 2 4.5 2.25 4 2.2 2.3 2 4.5 2.25 5 2.6 2.3 2 4.9 2.45 6 1.6 3.1 2 4.7 2.35 合计 15.1 13.0
B →A 7 2.7 2.7 2 5.4 2.70 8 1.9 1.7 2 3.6 1.80 9 1.8 2.6 2 4.4 2.20 10 1.4 2.3 2 3.7 1.85 11 2.5 2.9 2 5.4 2.70 12 2.4 2.0 2 4.4 2.20
合计
12.7
14.2
n 阶段
12 12
X ∑阶段 27.8 27.2 X 阶段
2.32
2.27 n 处理 A n =12
B n =12
X ∑处理 A X =∑29.3
B X =
∑25.7
X 处理
A X =2.44
B X =2.14
(一)离均差平方和与自由度的分解
表9.11按两阶段交叉设计获得的24个数据X 中包含四种变异,总变异分解为处理的变异、阶段的变异、个体间的变异和误差四部分,总自由度也作相应分解:
SS SS SS SS SS =+++处理总阶段个体误差 (9.19)
ννννν=+++处理总阶段个体误差
方差分析计算公式见表9.12。

表9.12 两阶段交叉设计资料方差分析计算表
变异来源 SS
ν
MS
F
2

-)(X X 处 理 2)(X X n
-∑处理处理
1 /1SS 处理 /MS MS 处理误差
阶 段 2
)(X X n -∑阶段
阶段 1
/1SS 阶段 /MS MS 阶段误差
个 体 2)(X X n
-∑个体个体
1n -
/(1)SS n -个体
/MS MS 个体误差
误 差
SS SS SS SS ---处理总阶段个体
/(2)SS n -误差
(二) 交叉设计资料方差分析的基本步骤
以例9.5说明两阶段交叉设计资料方差分析的具体步骤: 1. 建立检验假设,确定检验水准 处理
0H :A 、B 两种药物对失眠患者改善睡眠的效果相同 1H :A 、B 两种药物对失眠患者改善睡眠的效果不同 阶段
0H :两阶段药物对失眠患者改善睡眠的效果相同
2n -
1
H:两阶段药物对失眠患者改善睡眠的效果不同
个体
H:患者个体间药物改善睡眠的效果相同
1
H:患者个体间药物改善睡眠的效果不同
0.05
α=
2. 计算检验统计量
利用统计软件SPSS21.0,得到方差分析的结果,详见表9.13。

表9.13 表9.11资料的方差分析表
变异来源SSνMS F P 总变异 5.898 3 23
药物0.540 0 1 0.540 0 1.554 0 0.24 阶段0.015 0 1 0.015 0 0.043 2 0.84 个体 1.868 3 11 0.169 8 0.488 6 0.87 误差 3.475 0 10 0.347 5
3. 确定P值,作出统计推断
通过计算F值时分子的自由度ν
处理、ν
阶段
、ν
个体
,分母的自由度ν
误差
查附表
4(F界值表),获得处理效应、阶段效应和个体效应的P值;本例是利用统计软件直接得到P值。

由表9.13可知,按α=0.05水准,均不拒绝
H,尚不能认为两处理因素间、两阶段间和个体间的总体均数不同。

二、析因设计资料的方差分析
析因设计是将两个或多个实验因素的各水平进行全面组合,对各组合都进行实验,从而探讨各实验因素的单独效应(simple effect)、主效应(main effect)以及各因素间的交互效应(interaction effect)。

所谓交互作用是指两个或多个受试因素间的效应互不独立,当某一因素的水平发生变化时,另一个或多个因素不同水平的效应也相应地发生变化。

例9.6 为研究某降血糖药物对糖尿病及正常大鼠心肌磺脲类药物受体SUR1的mRNA的影响,某研究者进行了如下实验:将24只大鼠随机等分成4组:两组正常大鼠,另两组制成糖尿病模型,糖尿病模型的两组分别进行给药物
和不给药物处理,剩余两组正常大鼠也分别进行给药物和不给药物处理,测得各组mRNA 吸光度值(%),结果见表9.14。

表9.14 4种不同处理情况下吸光度值(%)
正常大鼠(1a )
糖尿病大鼠(2a ) 合 计
使用药物 (1b )
不使用药物
(2b )
使用药物 (1b )
不使用药物
(2b )
X
30 51 31 52 28 34 38 45 34 38 42 46 37 29 20 40 40 24 29 50 33
29 33 60
i n
6 6 6 6 24n =i X ∑
202 205 193 293 X ∑=893
i X
33.67 34.17 32.17 48.83 37.21X =
A n 12 12
B n
12 12 A X ∑
407 486 B X ∑
395 498 A X
33.92
40.50
B X
32.92
41.50
本例为析因设计中最简单的两因素且每个因素只有两个水平的2×2析因设计:即A 因素有两个水平,B 因素有两个水平。

在本例的11b a 、21b a 、12b a 和22b a 四种处理中,每个组合均有6个实验数据。

(一) 单独效应、主效应和交互效应
为说明单独效应、主效应和交互效应,将表9.14数据的均数整理成表9.15。

表9.15 例9.6资料吸光度均数(%)的差别
B 因素 A 因素
平均 12a a -
正常大鼠(1a )
糖尿病大鼠(2a )
使用药物(1b ) 33.67 32.17 32.92 1.50 不使用药物(2b )
34.17 48.83 41.50 -14.66 平均
33.92 40.50 37.21 -6.58 12b b -
-0.50
-16.66
-8.58
1. 单独效应是指其它因素水平固定时,同一因素不同水平的效应之差。

如表9.15所示,A 因素固定在1水平时,B 因素的单独效应为33.6734.170.50-=-;
A 因素固定在2水平时,
B 因素的单独效应为32.1748.8316.66-=-。

同理,B 因素固定在1水平时,A 因素的单独效应为33.6732.17 1.50-=;B 因素固定在2水平时,A 因素的单独效应为34.1748.8314.66-=-。

2. 主效应是指某一因素单独效应的平均值。

如B 因素为1水平和2水平时,A 的单独效应分别为1.50和-14.66,两者的平均值为-6.58,即为A 因素的主效应;同理B 因素的主效应为-8.58。

3. 交互效应是指两个或多个因素间的效应互不独立的情形。

如果A 因素的水平变化时,B 因素的单独效应也发生变化,我们就认为A 、B 两个因素存在交互效应。

两因素间的交互效应称为一阶交互效应,三因素间交互效应称为二阶交互效应,以此类推。

AB 两因素的交互效应的计算公式为:
1212AB BA 1
(B B )21
(A A )2
a a
b b ==-=-交互效应交互效应
时的单独效应时的单独效应时的单独效应时的单独效应 (9.20) 例9.6中,
11
AB BA [0.50(16.66)] [1.50(14.66)]8.08
22
=---=--=交互效应交互效应=
图9.1 2×2析因设计交互作用示意图
20
25 30 35 40 45 50 55 糖尿病大鼠(2a )
1) )
2b 正常大鼠(1a )
图9.1是2×2析因设计交互效应示意图。

如果1a 时B 因素的单独效应2
1b b -等于2a 时B 因素的单独效应21b b -,图中两条直线平行;1a 时B 因素的单独效应21b b -不等于2a 时B 因素的单独效应21b b -,图中两条直线相交。

在实际研究工作中,如果图中两条直线几乎平行,我们就可以认为AB 两个因素不存在交互效应。

相反,如果图中两条直线与平行相去甚远,则说明A 、B 两因素可能存在交互效应。

至于是否确实存在交互效应,需要通过假设检验进行判断。

(二) 离均差平方和与自由度的分解
析因设计方差分析的总变异分为处理和误差两部分。

2×2析因设计的处理变异包含了A 因素、B 因素的主效应以及A 、B 的交互效应;同样,自由度也可作相应的分解:
()A B AB SS SS SS SS SS SS SS =+=+++处理总误差误差 (9.21)
A B AB ()ννννννν =+=+++处理总误差误差
2×2析因设计的方差分析计算公式见表9.16。

表9.16 2×2析因设计方差分析计算表
变异来源 SS
ν
MS
总变异 2

-)(X X 1N - 处理
2
)(X X n i
i
-∑
1k -
A 2)(X X n A
A -∑ 1 A A /SS ν A /MS MS 误差
B 2
)(X X n B
B -∑
1 B B /SS ν B /MS MS 误差
AB A B SS SS SS --处理 1
AB AB /SS ν
AB /MS MS 误差
误差 SS SS -处理总
N k -
/SS ν误差误差
(三) 析因设计资料方差分析的基本步骤
析因设计资料的方差分析步骤: 1. 建立检验假设,确定检验水准 AB 交互作用
0H :是否药物治疗对糖尿病和正常大鼠吸光度值影响相同 :是否药物治疗对糖尿病和正常大鼠吸光度值影响不同
1H
因素A
0H :糖尿病和正常大鼠吸光度值的总体均数相等 :糖尿病和正常大鼠吸光度值的总体均数不相等 因素B
0H :使用药物和不使用药物治疗吸光度值的总体均数相等 :使用药物和不使用药物治疗吸光度值的总体均数不相等
0.05α=
2. 计算检验统计量
利用统计软件SPSS21.0,得到方差分析的结果,详见表9.17。

变异来源 SS
MS
F
P
总变异 2 173.958 3 23
处 理
1 094.125 0 3
A 260.041 6 1 260.041 6 4.816 3 0.04
B 442.041 6 1 442.041 6 8.187 2 0.01 AB 392.041 8 1 392.041 8 7.261 1
0.01 误 差
1 079.833 3
20
53.991 7
3. 确定P 值,作出统计推断
以计算F 值时分子自由度ν1、分母自由度ν2查F 界值表(附表4)获得相应P 值;利用统计软件可以直接得到P 值。

首先判断A 因素和B 因素交互效应AB 的P 值,05.001.0<<P ,按α=0.05水准,拒绝0H ,表明两个因素间存在交互效应,可以认为是否药物治疗对糖尿病和正常大鼠吸光度值影响不同。

当存在交互作用时,单纯研究某个因素的作用是没有意义的,必须在另一个因素的不同水平下研究该因素的作用大小。

如果交互作用无统计学意义,可直接采用表9.17对A 、B 两因素的假设检验结果。

三、重复测量资料的方差分析
重复测量资料(repeated measurement data)是同一受试对象的同一观察指标在不同时间点上进行多次测量所获得的资料,常用来分析该观察指标在不同时间点
1H 1H。

相关文档
最新文档