第九章+方差分析

合集下载

第九章方差分析

第九章方差分析

四、方差分析中的符号



K=处理条件或组数 n或nj =每一个组的被试数 N=总被试数
方差分析的符号
X或X ij 各组的每一个原始得分 X 或 X j 各组的平均分 X T 总平均分
X 或 X 各组数据求和
i 1
n
X或 X 所有组数据求和
j 1 i 1
k
n
五、方差分析的基本原理:综合的F检验 (一)综合虚无假设 (二)方差的可分解性
六、方差分析的基本过程与步骤
平方和
自由度 均方 F值 查F值表进行F检验并做出决断 方差分析表
七、方差分析的基本假定
八、方差分析中的方差齐性检验 九、与方差分析有关的实验设计问题
在B2水平上,A1与A2均值差异的F检(A的主效应)
方差分析与两样本平均数t、Z检验有何异同?
t、Z-test 方差分析 相同点 平均数差异显著性检验、总体呈正态或近似正态分布、 各组方差齐性、等距或等比数据 不同点 一个或两个平均数差异检验 多个平均数差异检验 利用平均数的差 利用平均数的方差与误 差方差 利用统计量F 利用统计量t、 Z
第二节 单因素完全随机设计的方差分析
一、各实验处理组样本容量相同
二、各实验处理组样本容量不同
三、利用样本统计量进行方差分析
第三节 单因素随机区组设计的方差分析 一、单因素随机区组设计的基本模式
二、单因素随机区组设计的方差分析过程
三、单因素重复测量实验设计的方差 分析
第四节 多因素完全随机设计的方差分析
三、方差分析中的几个概念 因素:实验的自变量。
单因素、二因素、多因素
水平:某一因素的不同情况。 处理:由因素与水平构成的各种组合情况。

第九章(一)方差分析

第九章(一)方差分析

nj
r
nj
2 ( X ij X j )( X j X )
j 1 i 1
nj
数理统计
续(三个平方和的关系)
由于
2 ( X ij X j )( X j X ) 2 ( X j X ) ( X ij X j )
j 1 i 1 j 1 r i 1 r nj r nj
是否成立。而备选假设则为
H1 : 1 , 2 , 3
和4 不全相等
3.上述假设的检验方法就是方差分析
数理统计
二、方差分析原理 1.两类误差及两类方差
⑴.每个水平为一个总体;
⑵.每个水平的一组观察值为总体的一个随机样本, 同一水平下样本观察值之间的差异称为随机误差,用组内 方差来表示; ⑶.不同水平下样本观察值之间的差异可能是由于不
问饮料的颜色是否对销售量产生影响。
表 9-1 超市 1 2 3 4 5 该饮料在五家超市的销售情况 无色 26.5 28.7 25.1 29.1 27.2 粉色 31.2 28.3 30.8 27.9 29.6 橘黄色 27.9 25.1 28.5 24.2 26.5 单位:箱 绿色 30.8 29.6 32.4 31.7 32.8
同水平引起的,这种误差称为系统误差,但也包含随机误
差。不同水平样本观察值之间差异用组间方差来表示,即
组间方差包括随机误差,也包括系统误差。
数理统计
2.方差的比较
⑴.如果不同水平对试验结果没有不同影响,那么组 间方差中只包括随机误差,这时,组间方差与组内方差应 该相近,组间方差与组内方差之比接近 1; ⑵.如果不同水平对试验结果有不同影响,那么组间 方差除了随机误差之外还包括系统误差,这时,组间方差 就会大于组内方差,组间方差与组内方差之比就会大于 1; ⑶.方差分析就是通过这种方差的比较,作出接受原 假设或拒绝原假设的判断。

第九章 方差分析

第九章  方差分析

第九章方差分析前面介绍了两个样本均数比较的t检验,那么多个样本均数的比较应该采用什么方法?方差分析(analysis of variance, ANOV A)是20世纪20年代发展起来的一种统计方法,由英国著名统计学家R.A.Fisher提出,又称F检验,是通过对数据变异的分析来推断两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。

本章首先介绍方差分析的基本思想和应用条件,然后结合研究设计类型分别介绍各类方差分析方法。

第一节方差分析的基本思想和应用条件一、方差分析的基本思想方差分析的基本思想是把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。

例9.1 为研究大豆对缺铁性贫血的恢复作用,某研究者进行了如下实验:选取已做成贫血模型的大鼠36只,随机等分为3组,每组12只,分别用三种不同的饲料喂养:不含大豆的普通饲料、含10%大豆饲料和含15%大豆饲料。

喂养一周后,测定大鼠红细胞数(×1012/L),试分析喂养三种不同饲料的大鼠贫血恢复情况是否不同?表9.1 喂养三种不同饲料的大鼠红细胞数(×1012/L)普通饲料10%大豆饲料15%大豆饲料合计X 4.78 4.65 6.80 4.65 6.92 5.913.984.447.284.04 6.167.51 3.445.997.51 3.776.677.743.65 5.298.194.91 4.707.154.795.058.185.316.01 5.534.055.677.795.16 4.688.03in12 12 12 36 (n)i X ∑ 52.53 66.23 87.62 206.38(X ∑)i X4.385.52 7.30 5.73 (X ) 2i X ∑ 234.2783373.2851647.73121255.2946(2X ∑)表9.1按完全随机设计获得的36个数据(X )中包含以下三种变异: 1. 总变异 36只大鼠喂养一周后测定红细胞数X 各不相同,即X 与总均数X 不同,这种变异称为总变异(total variation)。

第九章 方差分析ppt课件

第九章 方差分析ppt课件
SSW/dW f MW S 14.71/5 1 9410 .4111
(3)计算F值。
精选PPT课件
18
(4) 确定显著性水平和F临界值 取α=0.05,查F分布表得 F0.05(3,14) 3.34。由于计
算的F=3.52> F0.05(3,14) 3.34,P<0.05,所以拒绝原假
设,接受备择假设,认为各组平均数中至少有一对不
精选PPT课件
25
计算自由度: dBfk 14 13;
dW fk n k4 5 4 1;6
df T df B df W =16+3=19
求均方:
MS B
SS B df B
370122.3 3

MSW
SSW dfW
35622.25 16
(3)计算F值:
FMBS12.325.50 MW S 22.25
1、提出假设 2、计算平方和与自由度 3、计算F值 4、确定显著性水平并查F临界值表 5、列方差分析总表
精选PPT课件
3
一、方差分析的逻辑思想
1、方差分析是一种综合的检验方法
方差分析是对引起方差变化的各种因 素进行统计分析,检验引起各样本差异 的主要原因(或因素),并与理论值比 较,以判断其显著性。
首先将总体变异分解成样本组间变异 和由抽样误差等其它原因产生的组内变 异,然后分析变异各组成部分的关系。
如果样本组间变异比抽样误差等其它 原因产生的变异显著地大,则认为样本 组间有本质性的差异,否则,认为样本 组间无本质差异。
精选PPT课件
6
在方差分析中,观测值之间的差异情 况用离差平方和表示,符号为SS。方差分析首先 是把总体平方和分解为组间平方和和组内平方和, 即:

第九章 方差分析

第九章  方差分析

第九章方差分析方差分析是从方差的角度,研究各有关因素对试验结果影响大小的有效方法.从数理统计的角度来看,方差分析是通过比较总体方差的各种估计量之间的差异,来分析等方差的正态总体是否具有相同的均值.称之为方差分析的原因,是在显著性检验中所用统计量的分子、分母都是总体方差的估计量.试验中,将要考察的指标称为试验指标或响应值,试验指标值的全体构成我们所关注的总体;影响试验指标的条件称为因素,因素所处的状态称为该因素的水平.如果试验仅考虑一个因素,则称为单因素试验,否则称为多因素试验.可能有多个因素影响试验指标,但总是取少数重要因素进行研究.在方差分析中,通常取1-3个因素进行研究.因素的水平可以是数量化的,也可以是定性的.例如要研究几个不同的小麦品种间产量的差异时,考虑的因素是品种,而每个水平便是一个小麦品种,是定性的水平;而在研究氮肥施用量对小麦产量的影响时,水平(氮肥施用量)则是数量化的.方差分析只研究各个水平对试验指标的影响是否显著,并不给出各水平的影响程度.因此,方差分析是定量地估计各因素对试验指标的影响的工具.9.1 单因素方差分析先看一个实例.例1 在饲养条件尽可能相同的条件下,检验某种激素对羊羔增重的效应.选用3个剂量进行试验,加上对照(不用激素)在内,每次试验要用4只羊羔,若进行4次重复试验,则共需要16只羊羔.一种常用的试验方法,是将16只羊羔随机分配到16个试验单元.这种方法被称为完全随机设计,在试验单元间的试验条件很一致的情况下,这种设计最为有效.经过200天的饲养后,各羊羔的增重数量(单位:kg)见表9.1.表9.1 各羊羔的增重数量(kg/每头/每200d)- 204 -- 205 -本例中,试验指标是羊羔的增重数量,只有1个因素——激素,为单因素试验.激素的4个剂量(含对照)构成因素的4个水平.单因素方差分析用于分析单因素试验中,各个水平对试验指标的影响是否显著.为叙述单因素方差分析问题,再看一个实例.例 2 一批由同种原料织成的同一种布,用不同染整工艺处理,然后进行缩水率试验,考察染整工艺对缩水率的影响,在其它条件尽可能相同时,测得缩水率(%)如表9.2所示.的染整工艺处理后,缩水率的全体构成的集合,假定2~(,)X N μσ.所考察的因素是染整工艺A ,5种不同的染整工艺A 1,A 2,…A 5为因素的5个水平,假定水平i A 下的样本来自相互独立且等方差的正态总体2~(,)(1,2,5)i i X N i μσ= ,它们都是总体X 的特款.就该批布中的任意4块分别考察5个水平上的缩水率,看作是4次重复试验.令i i αμμ=-,则αi 反映了水平A i 对缩水率的影响.由于x ij 是来自2~(,)i i X N μσ的样本,于是i j i i j i i j x μεμαε=+=++ (i =1,2,…,5;j =1,2,…,4).这里,εij 表示观测过程中各种随机影响引起的随机误差;εij 相互独立,服从均值为0,方差为σ2(未知)的正态分布.考察五个水平对缩水率的影响是否差异显著,即要检验假设012345:0H ααααα===== (9.1)一般地,设总体2~(,)X N μσ,因素A 有k 个水平A 1,A 2,…,A k .今对第i 个总体进行n i 次重复观测(i =1,2,…,k ),得到表9.3中的观测数据.- 206 - 表9.3 单因素方差分析数据表假定水平i A 下的样本来自相互独立、方差相同的正态总体2~(,)i i X N μσ(1,2,)i k = .令i i αμμ=-,则αi 反映了水平A i 对试验指标的影响.于是有i j i i j i i j x μεμαε=+=++(1,2,,;1,2,,)j i k j n == (9.2)其中,εij 表示试验观测过程中各种随机影响引起的误差;εij 相互独立,服从均值为0,方差为σ2(未知)的正态分布.称(9.2)为单因素方差分析的数学模型.令n = n 1 + n 2 + … + n k , (9.3)表示观测数据总数,不难证明111,0.kki i ii i n n μμα====∑∑单因素方差分析是要考察各个水平对试验指标影响的差异是否显著.因此,要检验的统计假设为012:0k H ααα==== (9.4)即检验观测数据x ij 是否来自k 个相同的总体.记11,in i ij i i j ix x x x n ⋅⋅⋅===∑, (9.5) 1111,in kkij i i j i x x x x x n⋅⋅⋅⋅⋅======∑∑∑, (9.6) 则i x ⋅为总体A i 的样本均值,x 为总样本的均值.(9.5)式与(9.6)式中的圆点表示已经求过和的指标,下同.令211()in k t ij i j S x x ===-∑∑, (9.7)211()in ke ij i i j S x x ⋅===-∑∑, (9.8)- 207 -21()kA i i i S n x x ⋅==-∑. (9.9)称S t 为总离差平方和,它反映了观测数据总的变异程度;显然,i x ⋅是i μ的无偏估计,又ij ij i x εμ=- ,于是ij ij i e x x ⋅=-是误差εij 的无偏估计.因此,称S e 为误差平方和或组内平方和,它反映了随机误差εij 对试验指标影响的总和;S A 是水平i A 的平均i x ⋅与总平均x 的离差平方和,其中系数i n 是对水平i A 上观测次数的体现.因此,A S 反映了因素A 的各水平i A 的均值间的差异程度,称A S 为因素平方和或组间平方和.由于2112112211111122111111()[()()]()2()()()()()2()()(ii ii iiiin kt ij i j n kij i i i j n n n kk k ij i ij i i i i j i j i j n n n kk kij i i i ij i i j i j i j i S x x x x x x x x x x x x x x x x x x x x x x x ==⋅⋅==⋅⋅⋅⋅======⋅⋅⋅⋅=======-=-+-=-+--+-=-+-+--=∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑221111)()iin n kkj i i i j i j x x x ⋅⋅====-+-∑∑∑∑于是有平方和分解公式:S t =S A +S e . (9.10) 其意义在于将因素平方和S A 与误差平方和S e 从总平方和S t 中分解出来.在各ij ε相互独立地服从N (0,σ2)分布的前提下,当假设(9.3)成立时,模型(9.2)变为i j i j x με=+(1,2,,;1,2,,)i i k j n == (9.11)即所有观测数据来自同一正态总体N (μ, σ2) ,于是由第六章(6.10)式知22/~(1)t S n σχ-.令21(),1,2,,in i ij i j S x x i k ⋅==-=∑- 208 -则/(1)i i S n -是来自总体i X 的样本方差,于是2/i S σ服从自由度为1i n -的χ2分布.而S e /σ2 =(S 1 + S 2 + …+S k ) /σ2,由12,,,k X X X 的独立性假定,知S 1,S 2,…,S k 相互独立.由χ2分布的可加性,知22/~()e S n k σχ- (9.12)至于A S 的分布性质,我们不假证明地给出如下定理: 定理1 (1) A S 与e S 相互独立;(2) 当假设(9.4)成立时,22/~(1)A S k σχ-.若用t f ,A f ,e f 分别表示t S ,A S ,e S 的自由度,由上述讨论得到t A e f f f =+ (9.13)称(9.13)为自由度分解公式.为了检验假设(9.4),取)/()1/(k n S k S F e A --=(9.14)当假设(9.4)成立时,由(9.12)及定理1,有~(1,)F F k n k -- (9.15)给定显著性水平α(0<α<1),查F 分布表得到自由度为(k -1, n -k )的F 分布临界值F α(k -1, n -k ),从样本算出F 统计量的值F 0,据F 0的大小作如下推断:若F 0 >F α(k -1, n -k )则拒绝假设(9.4),认为某些水平(并非全部)对试验指标的影响有显著差异;若F 0 ≤F α(k -1, n -k )则接受假设(9.4),认为各水平对试验指标的影响无显著差异.通常将单因素方差分析过程归结为如表9.4所示的单因素方差分析表. 为简化计算,还可以对所有观测数据同时加、减或同时乘、除一个非零常数.不难证明,对所有观测数据x ij 同时加、减一个任意常数不影响各平方和的值,同时乘、除以一个非零常数不影响F 统计量的值.即对原始数据x ij 做变换,0ijij x ax b a '=+≠后再进行方差分析,其结果不变.1 23 4计算得到:S A = =208,S e = 646,S t = S A + S e = 854.S A的自由度为k―1=3,S e的自由度为n―k =12.据此,列方差分析表如表9.5.由(9.13)式算出的F值为1.2879,查表得临界值F0.05(3,12)=3.49,从样本算出的F值1.2879远比5%显著水平要求的F值3.49小,因此认为各个处理间没有显著差异.值得注意的是,这并不证明4个处理间没有差异,可能存在真实的差异,但是在所选取的概率水平上,试验没有足够的灵敏度,未能检测出差异.单因素方差分析可在表(9.3)上计算.现对例2进行表格化计算.为便于计算,将表9.2中的各观测数据同减去5,在表9.6中表格化计算(9.14)和(9.15)式右端各项.注意到k i- 209 -- 210 -55.54,34.37,A e S S ==89.91.t A e S S S =+= 据此得到如表9.7所示的方差分析表.0.01F =6.07>4.89,故拒绝假设(9.1),认为染整工艺对缩水率的影响极显著.在方差分析中,仍用* *表示极显著(a≤0.01时显著),用*表示0.01<a≤0.05时显著.在单因素方差分析中,各水平上观测次数n 1,n 2,…,n k 可以不相等.但在实际问题中,多取n 1 = n 2 =…n k ,因为选择同样大小的样本有如下优点:(1)与方差相等的假设的偏离不会过大,方差相等的检验比较容易;(2)F 检验时出现的第二类错误变小;(3)均值的其它比较(参阅§9.3)较为简单.9.2 双因素方差分析在双因素方差分析中,假定试验指标受两个变异因素A 、B 的影响,并假定行因素A 有m 个水平A 1,A 2,…,A m ,列因素B 有r 个水平B 1,B 2,…,B r .在每对组合水平(A i , B j )上做一次试验,得到m ×r 个试验结果x ij (i =1,2,…,m ; j =1,2,…,r ).所有ij x 独立,实验数据见表9.8.假定总体2~(,)X N μσ,2~(,)ij ij x N μσ,则11m rij i jmr μμ==∑∑ (9.16) 再假定组合水平(A i , B j )下的效应可以用A i 下的效应i α和B j 下的效应j β之和来表示,即ij i j μμαβ=++其中- 211 -110,0mriii j αβ====∑∑(正负效应相互抵消). 表9.8 双因素方差分析观测数据表1111,,r m A Biij j ij j i r m μμμμ====∑∑则A i μ和B j μ分别表示水平i A和j B 上的总体均值,且有 ,A i i αμμ=-.B j j βμμ=-类似于单因素方差分析,可将双因素方差分析的线性模型表示为(1,2,,;1,2,,)ij i j ij x i m j r μαβε=+++== . (9.17)这里,εij 表示其它随机因素引起的随机误差,εij 相互独立,服从均值为0,方差为σ2(未知)的正态分布.双因素方差分析的检验假设为01120212:0(9.18):0(9.19)m r H H αααβββ====⎧⎨====⎩仍用n = m ×r 表示观测数据总数,记11,(1,2,,)ri ij i i j x x x x i m r ⋅⋅⋅====∑ (9.20)11,(1,2,,)mj ij j j i x x x x i r m⋅⋅⋅====∑ (9.21) 111,m rij i j x x x x n⋅⋅⋅⋅====∑∑ (9.22)- 212 - 21()mA i i S r x x ⋅==-∑ (9.23)21()rB j j S m x x ⋅==-∑ (9.24)211()mre ij i j i j S x x x x ⋅⋅===--+∑∑ (9.25)211()mrt ij i j S x x ===-∑∑ (9.26)则i x ⋅为水平A i 上的样本平均,j x ⋅为水平B j 上的样本平均,x 为总体平均.S A 是因素A 的水平A i 上的样本平均i x ⋅与总体平均x 的离差平方和,若因素A 对响应值影响显著,则至少有一个离差平方(i x ⋅-x )2 较大,从而S A 较大;而当因素A 的影响不显著时S A 较小.因此,S A 反映了因素A 对试验结果的影响.同样,S B 反映因素B 对试验结果的影响.将模型(9.17)写成μμμμμμμμε+--=-+-+-=Bj A i ij B j A i ij ij x x )]()([于是,ij ij i j e x x x x ⋅⋅=--+是εij 的估计值.因此,S e 为误差平方和,它反映了其它随机因素对试验结果的影响.通过简单的推导可以证明下列平方和分解公式:S t = S A + S B + S e , (9.27)定理 2 (1) A S ,B S ,e S 相互独立,且()22/~(1)(1)e S m r σχ--,()22/~1t S mr σχ-;(2) 当假设01H 成立时,22/~(1)A S m σχ-; (3) 当假设01H 成立时,22/~(1)A S m σχ-; 证明略.若用t f ,A f ,B f ,e f 分别表示t S ,A S ,B S ,e S 的自由度,则由定理2得到- 213 -t A B e f f f f =++ (9.28)称(9.28)为自由度分解公式.由定理2,有()/(1)~1,(1)(1)/(1)(1)A A e S m F F m m r S m r -=----- (9.29)显然,F A 越大说明因素A 对试验结果的影响越大.对给定的显著性水平α,查F 分布表得自由度为(m ―1, (m ―1)(r ―1))的F 分布临界值F α,若从样本由(9.29)式算出F A >F α,则拒绝假设H 01,认为因素A 对试验结果有显著影响;否则认为因素A 的影响不显著.类似地,可使用统计量()/(1)~1,(1)(1)/(1)(1)B B e S r F F r m r S m r -=----- (9.30)对因素B 进行显著性检验.若从样本由(9.30)式算出F A >F α,则拒绝假设H 02,认为因素B 对试验结果有显著影响;否则认为因素B 的影响不显著.上述讨论可归结为如表9.9所示的方差分析表.表9.9 双因素方差分析表例3 将土质基本相同的一块耕地分成均等的五个地块,每块又分成均等的四个小区.有四个品种的小麦,在每一地块内随机分种在四个区上,每小区的播种量相同,测得收获量如下表(单位:kg ),试以显著性水平α1=0.05, α2=0.01考察品种和地块对收获量的影响是否显著.解 为计算简单起见,每一收获量均减去32,列表计算.- 214 -注意到m =4,r =5,n =20,经计算得到S A = 134.65, S B = 14.10, S t = 175.03, S e = 26.28,查表得临界值F 0.05(4, 12)=3.26,F 0.01(3, 12)=5.95.由于F B <F 0.05(4, 12),故认为地块不同对收获量无显著影响.由于F A >F 0.01(3, 12),故认为品种不同对收获量影响极显著.9.3 多重比较当假设(9.4)被拒绝后,只能表明在显著水平α下,至少有两个子体的均值间差异显著,并不表示k 个均值之间两两的差异都显著.通常要进一步检验该因素在各水平上的均值两两之间的差异是否显著,以确定哪些水平对响应值有重要影响.我们称这种差异性检验为多重比较.多重比较的方法很多,而且每种方法都有各自的优、缺点.这里,我们介绍适用范围较广的两种方法.一种是Scheffe 方法(S 法),另一种是Tukey 方法(T 法).在进行所有两个均值的同时比较时,如果每次比较的冒险率(犯第一类错误的概率)为α,则S 法和T 法全体冒险率均为α.如果用t 检验进行所有两个均值的同时比较,当均值个数大于2时,尽管每拒绝1个假设所犯的错误都是α,但同时拒绝2个假设所犯的错误是221(1).ααααα+-=-->如果对7个均值进行两两比较,要比较2721C =次.给定拒绝每个假设(i j μμ=,- 215 -1≤i <j ≤7)的冒险率0.10α=,要拒绝所有21个假设,即判明7个均值互不相等所犯的错误将是211(1)0.89α--≈!显然,在使用t 检验进行所有两个均值的同时比较时,全体的冒险率随均值个数的增加而增加.因此,t 检验只能适用于随机抽出的两个均值的比较,并不适用于所有的两个均值的同时比较. 9.3.1 S 法仍用e f 表示误差平方和S e 的自由度,/e e e MS S f =表示均方误差,假定观测数据满足方差分析的基本要求.在单因素方差分析中,Scheffe (1953)给出用于检验假设H 0:μi = μj (1≤i <j ≤k )的统计量i j D S α= (9.31)其中),1()1(e f k F k S --=αα.当||i j i j x x D ->时,则拒绝假设H 0 :μi =μj ,认为水平A i 与水平A j 在显著水平α下差异显著;否则认为A i 与A j 差异不显著.对于双因素方差分析,我们可以分别对每个因素作单因素方差分析,进而进行多重比较.也可以按下述步骤进行近似的S 检验:1 若检验假设A j A i H μμ=:0,则使用统计量ij D S = (9.32) 其中),1()1(e a f m F m S --=α.当||i j ij x x D ⋅⋅->时,则拒绝A j A i H μμ=:0,否则接受H 0.2 若检验假设B j B i H μμ=:0,则使用统计量ij D S α= (9.33) 其中),1()1(e f r F r S --=αα.- 216 - 当||i j ij x x D ⋅⋅->时,则拒绝B j B i H μμ=:0,否则接受H 0.比如在例2中,k = 5, n 1 = n 2 = … = n 5 = 4, f e = 15, MS e = 2.29.取α=0.05,查表得F 0.05(4,15)=3.06.于是由(9.32)及(9.33)得24.1206.34205.0=⨯=S ,)51(74.3)4141(29.224.12≤<≤=+⨯⨯=j i D ij .12||0.025 3.74x x -=<,故μ1与μ2差异不显著. 15|| 3.925 3.74x x -=>,故μ1与μ5差异不显著.14|| 3.35 3.74x x -=<,但与临界值3.74较接近,虽在显著水平0.05下认为μ1与μ4差异不显著,却能看出二者间存在真实的差异.类似地,可对其中任二均值进行比较. 9.3.2 T 法在用T 法进行k 个水平上的均值μ1,μ2,…,μk 之间的两两比较时,要求各水平上的重复数相同,即n 1 = n 2 = … = n k ,并且还要求2cov(,),,1,2,,;i j x x b i j k i j σ==≠ .即i x 与j x 的协方差不依赖于i 和j .T 法所使用的统计量是(,e T q k f α= (9.34) 其中(,)e q k f α是自由度为(,)e k f 的t 化极差分布的上侧α分位点.(,)e q k f α可以从“多重比较的q 表”中查到.S 法无论水平重复数是否相同都适用,T 法只适用于水平重复数相同的情况;在进行所有均值间的两两比较时,T 法比S 法灵敏度高,能检出较小的差异.因此,在水平重复数相同时应当用T 法.9.4 双因素等重复试验的方差分析在双因素试验中,除考察因素A 和B 对试验结果的影响外,还应考虑A 、B- 217 -的各水平的搭配情况对试验结果的影响,称此为A 与B 的交互作用,并把它设想为某一因素,记为A B ⨯.为考虑交互作用A B ⨯,对因素A 、B 的各水平的每一搭配(A i ,B j )都进行l (l ≥2)次重复观测,得到表9.10中的观测数据.表9.10 双因素等重复试验数据记n mrl =,1111m r lijk i j k x x n ====∑∑∑11,,1,2,,;1,2,,.lij ijk ij ij k x x x x i m j r l ⋅⋅⋅=====∑111,,1,2,,.r li ijk i i j k x x x x i m rl⋅⋅⋅⋅⋅⋅=====∑∑ 111,,1,2,,.mlj ijk j j i k x x x x j r ml⋅⋅⋅⋅⋅⋅=====∑∑双因素等重复试验的方差分析计算量较大.其基本原理也是将总的偏差平方和作如下分解:- 218 - 211122111122111()()()()()m r lt ijk i j k mrlmijk ij i i j k i rm rj ij i j j i j e A B A BS x x x x rl x x ml x x k x x x x S S S S ===⋅⋅⋅====⋅⋅⋅⋅⋅⋅⋅===⨯=-=-+-+-+--+=+++∑∑∑∑∑∑∑∑∑∑ (9.35)其中各偏差平方和的表达式如下:2111()m r le ijk ij i j k S x x ⋅====-∑∑∑21()mA i i S rl x x ⋅⋅==-∑21()rB j j S ml x x ⋅⋅==-∑211()m rA B ij i j i j S k x x x x ⨯⋅⋅⋅⋅⋅===--+∑∑e S 为误差平方和,反映了随机误差对试验指标的影响;A S 和B S 分别为因素A 和B 的偏差平方和,分别反映了因素A 和B 对试验结果的影响程度,A B S ⨯为A 与B 的交互作用A B ⨯的偏差平方和.当假设“H A :因素A 对试验结果无显著影响”成立时()/(1)~1,(1)/[(1)]A A e S m F F m mr l S mr l -=---当假设“H B :因素B 对试验结果无显著影响”成立时()/(1)~1,(1)/[(1)]B B e S r F F r mr l S mr l -=---当假设“H AB :交互因素AB 对试验结果无显著影响”成立时()/[(1)(1)]~(1)(1),(1)/[(1)]A B B e S m r F F m r mr l S mr l ⨯--=----检验过程可归纳在如表9.11所示的方差分析表中.立性和等方差性.从理论上讲对上述假定都要通过样本进行统计检验.有关独立性问题,通常是通过试验设计来解决.至于正态性和等方差性,可以根据第八章进行拟合优度检验和Bartlett 检验,还可以对原始数据进行适当的变换,使之满足正态性和等方差性.习 题 九1. 某灯泡厂用四种不同配料方案制成的灯丝,生产了四批灯泡.在每批灯泡中随机地其中(1,2,3,4)i t i =表示第i 批灯泡的寿命.试问(1) 四种灯丝生产的灯泡的使用寿命有无显著差异(0.05α=)? (2) 用S 法比较任意两批灯泡平均寿命之间的差异性(0.05α=).2. 设有三种型号的设备制造同一产品,对每种型号的设备各观测其5天的日产量,数x i 表示第i种型号的设备的日产量.问不同型号的设备生产能力之间是否其中(1,2,3)i有显著差异?3. 为了解3种不同饲料对猪生长影响的差异,用3个品种的猪进行全面搭配试验,3个月后测得9头猪的体重增加量(单位:kg)如下表:试分析饲料之间及猪的品种之间对猪的体重增加有无显著差异.4. 一种火箭使用了四种燃料、三种推进器作射程试验,对于燃料与推进器的每一种搭试检验燃料和推进器对火箭射程是否有显著影响,以及两个因素的交互作用对火箭射程是否有显著影响.- 220 -。

第九章 方差分析

第九章 方差分析

3。计算各部分变异的均方 在方差分析中 ,方差也称为均方,是各部分的离均差平 方和除以其相应的自由度,用MS表示。基 本公式为:MS=SS/ν。 4。计算统计量F值 F值是指两个均方之比。 一般是用较大的均方除以较小的均方。故 F值一般不会小于1。
5。确定P值,推断结论 根据分子ν1,分母 ν2,查F界值表(方差分析用),得到F 值的临界值(critical value),即:如 果F≥F界值,则P≤0.05,在α=0.05水准 上拒绝H0,接受H1。可以认为各样本所代表 的总体均数不全相等。如果想要了解哪两 个样本均数之间有差异,可以继续进行各 样本均数的两两比较。

结论:拒绝H0。四个行业的服务质量有显著差异
用Excel分析
选一批单元格输入原始数据; 选中数据区域,“工具”→“数据分析”;
1.输入数据表;选“工具”→“数据分析 ”→“……‖
1.输入数据表;选“工具”→“数据分 析”→“单因素方差分析”
―单因素方差分析”对话框中:输入区 域,行,输出区域
Ar
X r1 ... X rnr
列和Ti X ij
j 1
ni
T 1
T2
...
Tr
总和 Ti
i 1
r
列平均X i Ti ni
(水平组内平均值)
X1
X2
...
Xr
r
(总平均值)
1 r X ni X i n i 1
其中诸
ni 可以不一样, ni n
i 1
单因素方差分析表
3.处理
处理——指按单因素的各个“水平”条 件或多因素的各个“水平”的组合条件进行 的重复实验。 例如,要研究性别因素对智力发展的影 响,可以从同龄学生中各抽取男女学生50名 参加智力测验。性别因素所分成的两个水平 (男和女)即两种处理。

重复测量数据方差分析

重复测量数据方差分析

74.4
77.0
75.2 77.4
82.6
80.4
81.2 79.6
68.6
65.0
63.2 63.4
79.0
77.0
73.8 72.5
69.4
66.8
64.4 60.8
72.6
71.0
68.2 70.2
72.4
72.6
72.8 72.6
75.6
73.4
73.4 72.2
80.0
78.0
76.4 74.8
7.90
9.75 8.02
经检验处理组与对照组的差值 d 方差不齐(F S12 / S22 6.58 , P 0.01),不符合两均数比较 t 检验的前提条件。
设置对照旳前后测量设计
前后测量数据间存在明显差别时,并不能阐明这种差 别是由前后测量之间施加旳处理所产生,还是因为存 在于前后两次测量之间旳时间效应所致。
比较
表9-2 两种措施对乳酸饮料中脂肪含量旳测定成果(%)
编号
1 2 3 4 5 6 7 8 9 10
哥特里-罗紫法
0.840 0.591 0.674 0.632 0.687 0.978 0.750 0.730 1.200 0.870
脂肪酸水解法
0.580 0.509 0.500 0.316 0.337 0.517 0.454 0.512 0.997 0.506
受试 对象j
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
剂型 k
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
服药后测定时间i(周)

心理统计学课件第九章 方差分析

心理统计学课件第九章 方差分析

ij
Xj
X
2 k n j 1 i 1
Xt

2
SST SSW SSB
总平方和,表示实验中产生的总变异,即 把所有被试的数值作为一个整体考虑,是 用所有被试的因变量的值计算得到的 组间平方和,表示由于不同的实验处理而 造成的变异,可以用两个平均数之间的离 差表示。 组内平方和,表示有实验误差或个体差异 造成的变异。
n2Fra bibliotekX n
2

组内平方

SSW X 2
2 X
n

总平方和
SST X
2
X
n
2
6、列方差分析表
变异来源 平方和 自由度 方差 F 值 概率
组间变异
组内变异
SSB
SSw
dfB
dfw
MSB
MSw
F
MS B MSW
P
总变异
SST
dfT
SSB
2 X
第九章 方差分析
第一节 方差分析的基本原理及步骤 第二节 完全随机设计的方差分析
方差分析
方差分析又称为变异分析(analysis of variance,ANOVA),是由斯内德克 (George Waddel Snedecor)提出的一种 方法。 探讨一个因变量和一个或多个自变量之间 关系的一种检验方法。 主要功能:分析实验数据中不同来源的变 异对总变异的贡献大小,从而确定实验中 的自变量是否对因变量有重要影响。

第二节 完全随机设计的方差分析
各实验处理组样本容量相同 各实验处理组样本容量不同 利用样本统计量进行方差分析

一、各实验处理组样本容量相同

第九章----方差分析

第九章----方差分析

若组间变异明显大于组内变异, 则不能认为组 间变异仅反映随机误差的大小, 处理因素也在起 作用。根据计算出的检验统计量F值, 查界值表 得到相应的P值, 按所取检验水准α作出统计推断 结论。
检验统计量F值服从F分布。
F<Fα,(ν组间, ν组内),则P > α, 不拒绝H0, 还不能认 为各样本所来自的总体均数不同;
1、各样本是相互独立的随机样本, 且来自 正态分布的总体;
2、相互比较的各样本的总体方差相等, 即 具有方差齐性。 独立性、随机性、正态性、方差齐性
五、方差分析的用途
1、用于进行两个或多个样本均数的比较; 2、分析两因素或多因素间的交互作用; 3、用于回归方程的线性假设检验。
六、方差分析的优点
1、不受比较组数的限制,可比较多组均数; 2、可同时分析多个因素的作用; 3、可分析因素间的交互作用.
一、多个样本均数间的比较能否用 t 检 验或 u 检验?为什么?
原因:
五个样本均数进行比较, 每次两个均数作一次 t 检验, 共需作10(C52=10)次 t 检验。若每次比 较的检验水准α=0.05, 则每次比较不犯Ⅰ型错误 的概率为(1-α)=0.95。当这些检验独立进行 时, 则10次比较均不犯Ⅰ型错误的概率为0.9510= 0.5987, 此时犯Ⅰ型错误的概率, 即总的检验水准 α变为1-0.5987=0.4013比0.05大的多。犯Ⅰ型错 误的概率增大, 可能将原本无差别的两个总体推 断为有差别, 误判为有统计意义。因此多重比较 不宜用的 t 检验或 u检验作两两比较。
已知各组均数、标准差和样本含量时F值 的简便计算方法。
当原始数据未知, 只知各组均数、标准差和 样本含量时, 可进行如下计算, 分两种情况: 1、各组样本含量ni相等; 2、各组样本含量ni不等。

现代心理与教育统计学第九章:方差分析

现代心理与教育统计学第九章:方差分析

(五)查F分布临界值做出判断 当dfB=2, dfW=9,设定p=0.01, 查表F0.01(2,9)=8.02,检验值是F=48.44>8.02,p<0.01。
F0.01(2,9)=8.02
(六)陈列方差分析表
变异来变源异来平源方和平方自和由度自由度均方 均方 F F p 组间 组间258.67258.672 2 129.34129.3448.4448.44*0*.01 组内 组内 24 24 9 9 2.67 2.67
组内变异区组变异msr误差变异mse由此总变异的构成由原来的两个部分演变为三个部分总变异组间或处理变异区组变异误差变异组间设计下自变量各水平下被试随机区分而在单因素组内把每个水平下被试进行了等级划分形成了组内效应区组效应
第九章 方差分析
第一节 方差分析基本原理及步骤 第二节 完全随机设计的方差分析
目 录
第三节 随机区组设计的方差分析
第四节 事后检验
第一节 方差分析基本原理及步骤
➢ 补充: 自变量(前因变量);自变量水平 因变量(后果变量) 组间(被试间)实验设计(自:男,女。因:红色反应时) 组内(被试内)实验设计(自:红,绿。因:男红绿反应时) 混合实验设计(自:男,女;红,绿。因:男女红绿反应时) 实验组、对照组
SB S n X2 nX k2(2470 444 0 6 4 0)4 (5 3 2 2 4 0 8)2
79 6240 20 5 .68 7 12
SW S X 2 n X 2 8 1 76 9 22 4
(二)自由度的分解 总自由度为总容量减去1。本例有12个数据,所以:
思考: 1.如果想要分析A总体和B总体平均数的差异,可以用什么方法

方差分析 (共72张PPT)

 方差分析 (共72张PPT)

2.总体变异的构成
总体变异 组间变异: 组内变异:组内变异理论上要求齐性,实际计算取其 均值
3.方差的基本公式
一般总体方差称方差,样本方差称均方 能使变量发生变异的原因很多,这些原因我们都将其称为变异
因素或变异来源。
方差分析就是发现各类变异因素相对重要性的一种方法
方差分析的思路就是:把整个试验(设有 k 个总体)的样本资料作 为一个整体来考虑。
原理是变异的可加性。
即每一个数据与数据的总体平均数差的平方和,可以分解为每一组数 据各自的离差平方和与由各组数据的平均数组成的一组数据的
离差平方和两部分。前者表达的是组内差异,即每组数据中 各个数据之间的差异,也就是个体差异,表达的是抽样误差或 随机误差程度;后者表达的是组间差异,即各组平均数之间的差 异,表达的是实验操纵的差异程度,实验操纵即指自变量的操 纵,这两部分差异之间相互独立。
3、这种两两比较会随着样本组数的增加而加大犯Ⅰ型错的差异显著性检验,若两两比较推 断正确的概率为95%,则所有比较都正确的概率为6=0.74,则降低
了推断的可靠性。
• 几个常用术语:
1、试验指标(experimental index) 为衡量试验结果的好坏或处理效应的高低 ,在试验中具体测
(1).计算平方和:
组间平方和
SB SX n2X n2 71 .5 6 65 8 .1 7 8 20 8 .47
¨ 组内平方和
SW SX 2X n2 7 6 7 41 4 .5 6 4 45 7 .5 7 8
¨ 总平方和
SS T X 2X n2
764414252 876.396
23
(2).计算自由度
因此,方差分析可以帮助我们抓住试验的主要矛盾和技术关键,发 现主要的变异来源,从而抓住主要的、实质性的东西。

方差分析

方差分析

• 例题:探讨噪音对解决数学问题的影响作用。
噪音是自变量,划分为三个强度水平:强、中、 弱。因变量是解决数学问题时产生的错误频数。 随机抽取12名被试,再把他们分到强、中、无 三个实验组。每组被试接受数学测验时戴上耳 机。强噪音组、中噪音组的被试通过耳机分别 接受100、50分贝的噪音; 无噪音组的被试 则没有任何噪音。数学测验完后,计算每位被 试的错误频数。
查F值表进行F检验并作出决断
• 注意:
• 1.确定显著性水平 • 2.明确用单侧检验还是双侧检验
方差齐性检验
• 哈特莱最大F比率法:找出要比较的几个组内 方差中的最大值与最小值代入下式:
F max
S 2 S
2
max min
• 然后查F max临界值表,当算出的 F max小于表中相 应的临界值,就可认为要比较的样本方差两两 之间均无显著差异。
SSB MSB df B
SSW MSW df w
自由度的计算
• 组间自由度
• 组内自由度 • 总自由度
df B =k-1 df w =N-k
dfT
=N-1
• dfT = df B + df w
两个均方值之比为F统计量:
SSB / (k 1) MSB F SSW / (N k ) MSWE0.05来自SE X MS
n
E
• 4 用标准误乘以q的临界值就是对应于某 一个r值的两个平均数相比较时的临界值。
• 临界值,又称阀值,英文称 critical value,是指一个效应能 够产生的最低值或最高值。临界 值在数据分析中常常用来判定差 异情况 。
4、把5个平均数两两之间的差异与相应的 比较。但用这些差数与 q .SE 比较时一定要注意对应 于哪个r值。 例如: X E - X C =4.5,这时r=4-2+1=3,当r=3时 q0.05.SE X =3.49×1.738=6.06,因此应该将4.5与6.06 相比较。

第九章方差分析-PPT精选文档60页

第九章方差分析-PPT精选文档60页

§1 单因子方差分析
§1.1 基本概念
为了考察某个因素 A 对试验指标(即随机变量 X)
的影响,在试验时,保持其他因素不变,而仅让因素 A
改变,这种试验称为单因子(单因素)试验. 设试验结
果如下表:
水平
观测值
A1
x11
x12
...
x1n1
A2
x21
x22

x2n2





Ar
xr1
xr2

xrnr
• 为了今后方便起见,把参数的形式改变一下,并



1 n
r i1
nii
r
nni i1
i i , i 1,2,...,r,
称μ为一般平均,αi为因子A的第i 个水平的效应.
• 在这样的改变下,单因子方差分析模型中的数 据结构式可以写成:
X i j i i,j i 1 ,2 ,.r ;.j .1 ,2 ,,.n i..,
SA
2
~
2(r 1)
且SA与SE相互独立.
由于SA反映的是因子不同水均平值之间的差
异程度,故当假设H0 :1 2 ...r 0为真时,
SA的值不应太大 ,从而
F SA /(r 1) SE /(nr)
也不应太大,当F值过大时,可以认为假设 H0不真.
§1.4 检验过程
由此,可 当H0知 :12...n0为真 , 时
(X i jX i.2 ) (X i. X ) 2 2 (X i jX i.(X )i. X )
i 1j 1
i 1j 1
i 1j 1
r ni

教育与心理统计学第九章:方差分析

教育与心理统计学第九章:方差分析
如果组间平方和越大,组内平方和就会越小,各组平均数之间的显著性 差异的可能性就越大。
自由度的相关公式:
组间自由度dfB=k-1 组内自由度dfw=k(n-1) 总自由度 dfT=nk-1=dfB+dfw
在方差分析中,总是在进行单侧检验。 即F=MSB/MSW F>1,不同的实验处理之间有显著性差异 F<1,不同的实验处理之间差异不大,即实验处理基
第九章 方差分析
第一节 方差分析的基本原理及步骤 第二节 完全随机设计的方差分析 第三节 随机区组设计的方差分析 第四节 事后检验
第一节 方差分析的基本原理及步骤
方差分析(analysis of variance,ANOVA):探讨一个因 变量和一个或多个自变量之间的关系。主要目的在于 分析实验数据中不同来源的变异对总变异的贡献大小, 从而确定试验中的自变量是否对因变量的影响。
例题:9—6
当区组效应显著,说明实验设计采用随机区组设计是成 功的;当区组效应不显著,说明划分区组不成功的。
第四节 事后检验
在方差分析中,F检验的结果中表明差异不显著,说 明实验中的自变量对因变量没有显著影响。如果差异 显著,表明几个实验处理组的两两比较中至少有一对 平均数的差异达到了显著性水平。
两因素被试内设计,其中三名被试
组内设计(被试内设计、随机区组设计、重复测量设 计)——每个被试都要接受所有自变量水平的实验处 理。
(实验设计安排格式)
被试内设计的优点:①被试内设计需要的被试较少, 实验设计方便、有效。②被试内设计比组间设计更敏 感。③心理学的某些领域需要使用被试内设计,即被 试内设计适用于研究练习的阶段性。 ④被试内设 计消除了被试的个体差异对实验的影响。
方差分析主要处理两个以上平均数之间的差异检验问 题。

第九章 方差分析

第九章  方差分析

§3 随机区组设计的方差分析
SSw = SSR + SSE SST = SSB + SSw = SSB + SSR + SSE 自由度: dfT = dfB + dfw = dfB + dfR +dfE dfT =nk-1; dfB =k-1; dfR =n-1; dfE =(n-1)(k-1) 三个均方: MSB = SSB /dfB ; MSR= SSR /dfR; MSE= SSE /dfE 两个F值:F= MSB / MSE ; F= MSR / MSE

强(A) 中(B) 无(C)
k= 3
16 n= 14 4 12 10 Xj 13
4 5 5 6 5
1 2 2 3 2 Xt = 6.6 7
§1 方差分析的基本原理及步骤
1 方差分析的基本原理 利用方差的可加性原则 强(A) (方差的可分解性). 16 1.1总变异(总平方和)及 其分解 n= 14 4 12 10 Xj 13 噪 音
一种是利用样本统计量进行计算:
一种是利用原始数据计算:
§1 方差分析的基本原理及步骤
第三步,计算自由度 第四步,计算均方 第五步,计算F比值 第六步,查F值表进行F检验并做出决策(单侧检验) 如果F>F临界值,拒绝原假设,不同组平均数中至 少有一对有显著差异,因而自变量对因变量作用显 著. 如果F<F临界值,接受原假设,不同组平均数之间 无显著差异,因而自变量对因变量作用不显著. 第七步,陈列方差分析表
§1 方差分析的基本原理及步骤
1.3 F比值 F=MSb/ MSw 呈F分布, dfb = k-1 ,dfw = k(n-1)
§1 方差分析的基本原理及步骤

L2-第九章 方差分析

L2-第九章 方差分析

总 N 1 24 1 23
SS处理 ni X i X X i ni C
2 2 i
550.012 537.30 2 618.19 2 726.282 246398.0820 6 6 6 6 3742.5521
在实际运用中,往往将上述过程总结为如下的方差分析
表。
二、方差分析的应用条件 进行方差分析时,数据应满足以下两个应用条件: 1. 各样本是相互独立的随机样本,均服从正态分布。 当样本含量较小时,资料是否来自正态分布的总体难 于进行直观判断和检验,常常根据过去的经验;当样 本含量较大时,无论资料是否来自正态分布总体,数
变异、区组的变异和随机误差三个部分。
数理统计可以证明它们有如下的数量关系。
SS总 SS处理 SS区组 SS误差
总 处理 区组 误差
具体计算公式见下表:
二、随机区组设计资料方差分析的基本步骤 随机区组设计资料的方差分析步骤概括如下: ①. 建立假设 对于处理组 H0:4个总体均数全相等 H1:4个总体均数不等或不全相等 对于区组 H0:6个总体均数全相等 H1:6个总体均数不等或不全相等
bk个格子中,每个格子仅有一个数据Xij(i=1,2,3,,k; j=1,2,3,,b), 而无重复,因此其方差分析属无重复数据 的双向(因素)方差分析(two-way ANOVA)。
一、离均差平方和与自由度的分解 从该例数据表可以看出,随机区组设计资料的总变异 可以分解为:除处理的变异、随机误差外,还可分离 出区组变异。 区组变异 为6个不同窝别家兔血糖浓度值的样本均数
X j 各不相同,即 X j 与总均数 X 的不同。它既包含6个
区组的差异,也包含随机误差,其大小可用区组均方

第九章 方差分析

第九章 方差分析
MS组间 176.7612 / 2 88.3806
2015/11/10
3.组内变异:各组内各测量值Xij与其所
在组的均数的差值的平方和,反映随机误差 的影响.
SS组内 SSW SS E ( X ij X i ) (ni 1) S
2 i 1 j 1 i k ni 2 i
引例
某医生为研究一种四类降糖新药的疗效, 以统一的纳入标准和排除标准选择了60名2 型糖尿病患者,按完全随机设计方案将患 者分为三组进行双盲临床试验。问治疗4周 后,餐后2小时血糖下降值的三组总体平均 水平是否不同?
2015/11/10
不能……原因有二:
多次重复使用 t 检验,会使犯第一类
错误的概率增大。下一页
16.3 11.8 14.6 4.9 8.1 3.8 6.1 13.2 16.5 9.2
-0.6 5.7 12.8 4.1 -1.8 -0.1 6.3 12.7 9.8 12.6 19 5.8000 18.1867
组进行双盲临床试验。问治疗4周后,餐后2小
时血糖下降值的三组总体平均水平是否不同?
2015/11/10
干预前
干预后 高剂量
i=1 低剂量 i=2 对 照 i=3
糖尿病患者
随 机 分 组
І组 П组 Ш组
MS组间 MS组内
组间误差=随机误差
组间误差=随机误差 MS MS ? +干预因素
组间 组内
ni
Xi
Si
方差分析基本思想
可根据下表的公式和前面表9-1下半部分数据来计算
也可用统计软件包如SAS或SPSS等进行计算,直接
获得表9-4的方差分析表。
表 9-4 df 变异来源 59 总变异 2 组 间 组 内(误差) 57
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2011-2-7 16
表 9-1 高剂量组 (i=1) 5.6 9.5 6.0 8.7 9.2
Xij
三组患者 4 周后血糖的下降值(mmol / L) 低剂量组 (i=2) 对照组 (i=3) 2.0 5.6 7.0 7.9 4.3 6.4 7.0 5.4 3.1 12.4 0.9 7.0 3.9 1.6 6.4 3.0 3.9 2.2 1.1 2.7 7.8 6.9 1.5 9.4 3.8 7.5 8.4 12.2 6.0 合计
不全相等, 值将明显大于1 如果 µ1 , µ 2 ,L , µ k 不全相等,F 值将明显大于1。 界值( 用F界值(单侧界值)确定 值。 界值 单侧界值)确定P
2011-2-7 27
三、变异分解
C=
(∑X)2 N
完全随机设计资料的方差分析表
变异来源 总变异 自由度 N-1 k-1 SS MS F
α = 0.05
2011-2-7 29
2 . 计算检验统计量 :
可根据下表的公式和前面表9-1下半部分数据来计算 可根据下表的公式和前面表 下半部分数据来计算 也可用统计软件包如SAS或SPSS等进行计算,直接 或 等进行计算, 也可用统计软件包如 等进行计算 获得表9-4的方差分析表。 获得表 的方差分析表。 的方差分析表
v 间 = 3−1 组
M 组间 =176.7612/ 2 =88.3806 S
2011-2-7 21
3.组内变异:各组内各测量值Xij与其所 组内变异:
在组的均数的差值的平方和,反映随机误差 在组的均数的差值的平方和,反映随机误差 的影响. 的影响.
SS组内 = SSW = SSE = ∑∑ Xij − Xi )2 = ∑ ni −1 Si2 ( ( )
2011-2-7
返回
9
二、方差分析的几个名词和符号
什么是方差? 什么是方差? 方差 离均差 离均差平方和SS 离均差平方和 方差( 均方( ) 方差(σ2 S2 )均方(MS) 标准差: 标准差:S 自由度: 自由度: ν 关系: 关系: MS= SS/ ν
2011-2-7 10
各种符号的意义
Xij第i 个组的第 个观察值 个组的第j i=1,2,…k j=1,2,…ni ni第i 个处理组的例数 ∑ni=N Xi =第i组的均数 第 组的均数 X=总的均数 总的均数
2011-2-7
12
四、应用条件
1)各样本是相互独立的随机样本 )各样本是相互独立的随机样本 2)各样本来自正态总体 )各样本来自正态总体 3)各处理组总体方差相等,即方差齐 )各处理组总体方差相等,
2011-2-7
13
第二节
完全随机设计资料的 方差分析
2011-2-7 14
一、完全随机设计 completely random design
2011-2-7
32
注意: 注意:
方差分析的结果拒绝H 接受H 方差分析的结果拒绝 0,接受 1,不能 说明各组总体均数间两两都有差别。 说明各组总体均数间两两都有差别 。 如果 要分析哪些两组间有差别, 可进行多个均 要分析哪些两组间有差别 , 数间的多重比较(见本章第五节) 数间的多重比较(见本章第五节)。当k=2 时 , 完全随机设计方差分析与成组设计资 料的t 检验等价, 料的 检验等价,有 t = F 。
2011-2-7
11
三、方差分析的基本思想
根据变异的来源,将全部观察值总的离均差平 根据变异的来源,将全部观察值总的离均差平 方和及自由度分解为两个或多个部分 分解为两个或多个部分, 方和及自由度分解为两个或多个部分,除随机 误差外, 误差外,其余每个部分的变异可由某些特定因 素的作用加以解释。 素的作用加以解释。 通过比较不同来源变异的方差( 通过比较不同来源变异的方差(也叫均方 MS),借助 分布做出统计推断,从而判断某 ),借助 分布做出统计推断, ),借助F分布做出统计推断 因素对观察指标有无影响。 因素对观察指标有无影响。
∑X2 −C
组 间
∑ni (Xi − X)
i
2
SS组间
ν组间 ν组内
M 组间 S M 组内 S
组 内
N-k
SS总 −SS组间
SS组内
2011-2-7
28
四、分析步骤
1. 建立检验假设,确定检验水准 建立检验假设,确定检验水准:
H0:µ1 = µ 2 = µ 3 即3组总体均数相等 组总体均数相等 H1:3组总体均数不等或不全相等 组总体均数不等或不全相等
20 5.4300 2.3843
60(N) 6.859( X 18.4176(S²)
17
)
Si
总变异
组间
组内
二、列举存在的变异及意义
1、全部的 个实验数据之间大小不等, 、全部的60个实验数据之间大小不等 个实验数据之间大小不等, 存在变异(总变异)。 存在变异(总变异)。 2、各个组间存在变异:反映处理因素之 、各个组间存在变异: 间的作用,以及随机误差。 间的作用,以及随机误差。 3、各个组内个体间数据不同:反映了观 、各个组内个体间数据不同: 察值的随机误差。 察值的随机误差。 思考:各种变异的表示方法? 思考:各种变异的表示方法?
第九章 方差分析
analysis of variance, ANOVA
2011-2-7 1
方差分析由 R.A.Fisher(英)首创, 英 首创 首创, 又称F检验 又称 检验 缩写: 缩写:ANOVA
2011-2-7
2
讲授内容 方差分析的基本思想及应用条件 完全随机设计资料的方差分析 随机区组设计资料的方差分析 析因设计的方差分析 重复测量资料的方差分析 多个样本均数间的多重比较
2011-2-7
5
处理因素和 处理因素和水平
研究者对研究对象人为地施加某种干预措施, 研究者对研究对象人为地施加某种干预措施, 称为处理因素(factor)或实验因素; 或实验因素; 称为处理因素 或实验因素 处理因素所处的不同状态称为水平(level)。 。 处理因素所处的不同状态称为水平 处理因素的水平数≥2,即实验的组数。 处理因素的水平数 ,即实验的组数。
2011-2-7
31
3. 确定 值,作出推断结论: 确定P值 作出推断结论:
本例: 本例:ν1=3−1=2,ν2=60−3=57。因附表 中ν2无57, , 。因附表3中 , 故取最接近者ν 水准, 故取最接近者 2=60, 得P<0.01。按α=0.05水准,拒绝 。 水准 H0,接受 1,有统计学意义。 接受H 有统计学意义。 可以认为2型糖尿病患者经药物 新药和标准药物 可以认为 型糖尿病患者经药物(新药和标准药物 治 型糖尿病患者经药物 新药和标准药物)治 小时血糖的总体平均水平不全相同, 疗4周,其餐后 小时血糖的总体平均水平不全相同, 周 其餐后2小时血糖的总体平均水平不全相同 即三个总体均数中至少有两个不同。 即三个总体均数中至少有两个不同。
第一节
基本思想及应用条件
2011-2-7 4
一、为什么要学方差分析? 为什么要学方差分析?
概述:在进行科研时, 概述:在进行科研时,有时要按实验设计将 所研究的对象分为多个处理组施加不同的干 处理因素, 施加的干预称为处理因素 处理因素至 预,施加的干预称为处理因素,处理因素至 少有两个水平。 少有两个水平。
检验, 多次重复使用 t 检验,会使犯第一类 错误的概率增大。 错误的概率增大。下一页 脱离了原先的实验设计, 脱离了原先的实验设计,将多个样本 均数地同时比较转变为两个均数的多 次比较。 次比较。
2011-2-7 8
例如,有4个样本均数,两两组合数 4 检验做6次比较 次比较, 为 ( ) = 6 ,若用 t 检验做 次比较,且每次比 2 较的检验水准定为α=0.05, 则每次比较不犯 较的检验水准定为 , 次均不犯Ⅰ ) 次均不犯 Ⅰ类错误的概率为(1-0.05),6次均不犯Ⅰ 类错误的概率为( 类错误的概率为 (1-0.05)6,这时,总的检验 这时, 远比0.05大。因 水准变为 1-(1-0.05)6 = 0.26 ,远比 大 此 , 样本均数间的多重比较不能用两样本均 检验。 数比较的 t 检验。
映处理因素的作用和随机误差的影响
如果有 个总体均数有 如果有——k个总体均数有差别 个总体均数 如果无 个总体均数无 如果无——k个总体均数无差别 个总体均数
SS组间 = SSB = ∑ni (Xi − X)
i= 1
k
2
ν组间 = k −1
2011-2-7 20
SS组间 = 21(9.1952−6.8650)2 +19(5.8000−6.8650)2 +20(5.4300−6.850)2 =176.7612
i= j= 1 1 i k ni
v组内 = v2 = N −k
2011-2-7 22
SS组内 = (21−1 ×17.6305+(19−1 ×18.1867+(20−1 ×12.3843 ) ) ) = 909.8723
v组内 = v2 = 60−3
M =909.8723/57 =15.9627 S
2011-2-7 18
1.总变异 1.总变异: 所有测量值之间总的变异程度
SS总 = SST = ∑∑(Xij − X)
i= j = 1 1 k ni 2
ν总 = N −1
SS总=18.4176×(60-1)=1086.619
2.组间变异:各组均数与总均数的离均差平方和,反 组间变异:各组均数与总均数的离均差平方和,
16.3 11.8 14.6 4.9 8.1 3.8 6.1 13.2 16.5 9.2
-0.6 5.7 12.8 4.1 -1.8 -0.1 6.3 12.7 9.8 12.6
5.0 3.5 5.8 8.8 15.5 11.8
相关文档
最新文档