方差分析(2)
第十讲 第五章 方差分析2
B与C比:23-18=5<5.07,不显著
D与C比:24-18=6>5.23,显著
结论:只有处理D和C的差异在a=0.05水平显著, 其余皆不显著。
2.q检验:
q检验与SSR检验相似,其区别仅在a,而是查qa。
查qa值后,即有:
LSR= s x ×qa
3.各方法的异同
课堂练习:完全随机试验设计试验结果的统计分析
.
[例4] 研究6种氮肥施用方法(K=6)对小麦的效应,每种施 肥方法种5盆小麦(n=5),完全随机设计,最后测定它们的含 氮量,其结果如下表.试作方差分析
表 6种施肥法小麦植株含氮量
处理
施 12
氮法 34 5
6 总和
2.9 4 2.6 0.5 4.6 4
第五章 方差分析2 三、多重比较
F检验是一个整体的概念。仅能测出不同处理效应的平均 数的显著差异性。但是,是否各个平均数间都有显著差异性? 还是仅有部分平均数间有显著差异而另一部分平均数间没有 显著差异?它不曾提供任何信息。
要明确各个平均数间的差异显著性,还必须对各平均数 进行多重比较。
多重比较的方法主要有两大类: (一)LSD法:t检验法 (二)LSR法:分为SSR法、q检验法
表8 新复极差检验的LSR值
p
2
3
4
5
SSR0.05 SSR0.01 LSR0.05 LSR0.01
2.92 3.96 0.304 0.412
3.07 4.14 0.319 0.431
3.15 4.24 0.328 0.441
3.22 4.33 0.335 0.450
6 3.28 4.39 0.341 0.457
(二)平方和分解
方差分析(2)
ST = S1 + S2
上式表明, 上式表明,总的偏差平方和可以分解为组间偏差平方和 与组内偏差平方和之和。 与组内偏差平方和之和。前者表征了由于因素水平的改变而 引起的数据波动, 引起的数据波动,后者则表征了由于试验存在随机误差而引 起的数据波动。 起的数据波动。
列数据计算表
水 平 重 复 数 1 2… x12… x22… j… x1j… x2j… k 合 计 平均值
f2 = fT − f 1
(5)显著性 ) 为分析条件误差的显著性,常使用 检验 试验的F值 检验。 为分析条件误差的显著性,常使用F检验。 试验的 值 因素方差(组间) 因素方差(组间) 误差方差(组内) 误差方差(组内)
V S1 / f1 F= 1 = V2 S2 / f2
根据F值的大小及给定的显著度 α ,就可判断因素对 根据 值的大小及给定的显著度 值的大小及给定的 试验指标的影响相对于试验误差对试验指标的影响是否显 值越大, 著。F值越大,因素的影响越显著。 值越大 因素的影响越显著。 可从F分布表中查得 根据自由度 f 1 、 f 2 及显著水平α ,可从 分布表中查得 在这些条件下的临界F值 若实际的F值大于此临 在这些条件下的临界 值—— F 。若实际的 值大于此临 α 界值 Fα ,则可认为有 (1 − α ) 的把握说因素对试验指标有显 著影响。 著影响。
计算表中的数据按以下公式计算: 计算表中的数据按以下公式计算:
Ti = ∑xij
j=1
k
1 1 k xi = T = ∑xij i k k j=1 T = ∑Ti = ∑∑xij
i=1 i=1 j=1 m m k
1 1 m 1 m k 1m k x= T = ∑xi = ∑∑xij = n∑∑xij m k m i=1 m i=1 j=1 k i=1 j=1
第六章方差分析(二)
1.46
1.03
1.62
1.27
31.50
28.97
合计
2.08 2.97
2.08 2.49
2.06 2.91
2.30 3.08
2.24 2.58
SST SSA SSB
2.自由度的分解
总自由度:dfT ab 1
A的自由度:dfA a 1 B的自由度:dfB b 1
组内自由度:dfe (a 1)(b 1)
3. 方差计算:
s
2 A
SS A df A
sB2
SSB df B
se2
SSe dfe
方差分析表
变异来源 df A因素 a-1 B因素 b-1
SSR值与LSR值(dfe = 27)
M SSR0.05 SSR0.01 LSR0.05 LSR0.01
2 2.905 3.925 9.267 12.521
3 3.055 4.095 9.745 13.063
光照(A)
5h/d 10h/d 15h/d
平均数
Tij
90 -9 -17
差异显著性
α=0.05 α=0.01
…
Xabn
T•b
T
x•b
x
线性数学模型:
A、B的交互作用
随机误差,独立,正态分布
xijk i i ( )ij+ ijk
A因素的效应
B因素的效应
1. 总变异
自由度 平方和
2. A因素引起的变异
自由度 平方和
3. B因素引起的变异
自由度 平方和
4. A、B因素的交互作用引起的变异
自由度 平方和
1. 平方和的分解
矫正数:C T 2 ab
方差分析2(双因素方差分析、多元方差分析、可视化)
⽅差分析2(双因素⽅差分析、多元⽅差分析、可视化)1 双因素⽅差分析1.1 双因素⽅差分析的实战dat<-ToothGrowthdatattach(dat)table(dat$supp,dat$dose)aggregate(len,by=list(dat$supp,dat$dose),FUN=mean)解释:根据投⽅式(橙汁OJ,维C素VC)supp和剂量dose来对⽛齿的长度len进⾏求均值dose<-factor(dose)解释:为了避免把dose变量认为是数值变量,⽽是把dose认为成分组变量,所以设置成因⼦类型factorfit<-aov(dat$len~dat$supp*dat$dose)解释:aov()做⽅差分析,把 + 换成了 * ,这两项dat$supp和dat$dosee就变成了交互项summary(fit)结果分析:可以看出P值很⼩,三个P值都⼩于0.05,说明不同的投喂⽅式supp对⽛齿的⽣长长度len是有显著影响的;说明不同的剂量dose对⽛齿的⽣长长度len是有显著影响的;说明在两种投喂⽅式下,不同的投喂⽅式supp和剂量dose的交互效应对⽛齿的⽣长长度len是有显著影响的1.2 可视化⽅法1interaction.plot(dat$dose,dat$supp,dat$len,type = "b",col=c("red","blue"),pch=c(16,18),main="XX")1.3 可视化⽅法2library(gplots)plotmeans(dat$len~interaction(dat$supp,dat$dose,sep=" "),connect=list(c(1,3,5),c(2,4,6)),col=c("red","blue"),main="XX",xlab="xlab")1.4 可视化⽅法3library(HH)interaction2wt(dat$len~dat$supp*dat$dose)2 重复测量⽅差分析dat<-CO2CO2$conc<-factor(CO2$conc)w1b1<-subset(CO2,Treatment=="chilled")uptake是植物光合作⽤对⼆氧化碳的吸收量,是因变量y,type是组间因⼦,是互斥的,表⽰的是两个不同地区的植物类型,要么是加拿⼤的植物,要么是美国的植物,不可能两个地⽅都是,conc是不同的⼆氧化碳的浓度,每⼀种植物都在所有的⼆氧化碳浓度下,所以conc是组内因⼦研究不同地区的植物作⽤,在某种⼆氧化碳的浓度作⽤下,对植物的光合作⽤效果有没有影响2.1 含有单个组内因⼦w和单个组间因⼦B的重复测量ANOVAfit<-aov(uptake~conc*Type+Error(Plant/(conc)),w1b1)summary(fit)结果分析:⼆氧化碳浓度和类型对植物光合作⽤都有显著影响2.2 可视化图形呈现(1)⽅式⼀par(las=2)par(mar=c(10,4,4,2))with(w1b1,interaction.plot(conc,Type,uptake,type = "b",col=c("red","blue"),pch=c(16,18)))(2)⽅式⼆boxplot(uptake~Type*conc,data=w1b1,col=c("red","blue"))3 多元⽅差分析library(MASS)attach(UScereal)dat<-UScerealshelf<-factor(shelf)y<-cbind(calories,fat,sugars)fit<-manova(y~shelf)summary(fit)结果分析:不同的货架shelf上,⾷物的热量calories,脂肪含量fat和含糖量sugars是⾮常显著不同的3.1 多元正态性center<-colMeans(y)n<-nrow(y) #⾏数p<-ncol(y) #列数cov<-cov(y) #计算⽅差d<-mahalanobis(y,center,cov)coord<-qqplot(qchisq(ppoints(n),df=p),d) #画图abline(a=0,b=1) #画参考线identify(coord$x,coord$y,labels = s(UScereal)) #给出交互式标出离群点3.2 稳健多元⽅差分析install.packages("rrcov")library(rrcov)wilks.test(y,shelf,method="mcd")结果分析:P值⼩于0.05,说明结果是显著性的,即不同货架上⾷物的热量calories,脂肪含量fat和含糖量sugars是⾮常显著不同的4 ⽤回归来做ANOVAlibrary(multcomp)dat<-cholesterollevels(dat$trt)fit.aov<-aov(response~trt,data=dat)summary(fit.aov)结果分析:aov⽅差分析,trt对response的影响⾮常显著fit.lm<-lm(response~trt,data=dat)summary(fit.lm)结果分析:lm回归分析,trt对response的影响⾮常显著,并且trt的每⼀项都显⽰出来了。
方差分析第2部分单因素试验资料的方差分
(一)两因素单独观测值试验资料的方差分析 对于A、B两个试验因素的全部ab个水 平组合,每个水平组合只有一个观测值, 全
试验共有ab个观测值,其数据模式如表620所示。
上一张 下一张 主 页 退 出
表6-20 两因素单独观测值试验数据模式
表6-20中
x i.
x
j 1
bБайду номын сангаас
ij
, x. j x..
Cx /N
2 ..
SST x C
2 ij
dfT N 1
df t k 1 df e dfT df t
上一张 下一张 主 页 退 出
SSt xi2 . / ni C
SSe SST SSt
【例6.4】 5个不同品种猪的育肥试验,后期30天增 重(kg)如下表所示。试比较品种间增重有无差异。
这是一个单因素试验,k=5,n=5。
上一张 下一张 主 页 退 出
1、计算各项平方和与自由度
C
2 SST xij C (82 132 142 132 ) 2809.00
2 x..
/ kn 265 /(5 5) 2809 .00
2
2945.00 2809.00 136.00 1 1 2 2 SSt xi. C (51 412 60 2 482 652 ) 2809.00 n 5 2882.20 2809.00 73.20
系统分组方差分析两种,现分别介绍如下。
上一张 下一张 主 页 退 出
一、交叉分组资料的方差分析
设试验考察A、B两个因素,A因素分a个水
平,B因素分b个水平 。 所谓交叉分组是指A因
第5章_方差分析(第2节)
1、三角形法 此法是将多重比较结果直接标记在平均数 多重比较表上,如表5-4、表5-5所示。由于 在多重比较表中各个平均数差数构成一个三角 形阵列,故称为三角形法。此法的优点是简便 直观,缺点是占的篇幅较大。
2、标记字母法
先将各处理平均数由大到小自上而下 排列;然后在最大平均数后标记字母a,并 将该平均数与以下各平均数依次相比 ,凡 差异不显著标记同一 字母a,直到某一与 其差异显著的平均数标记字母 b 为止;
在利用字母标记法表示多重比较结果时, 常在三角形法的基础上进行。此法的优点是占 篇幅小,在科技文献中常见。 对于【例5·1】,根据表5-4所表示的用
SSR法进行的多重比较结果,用字母标记如表
5-8所示。
表5-8 表5-4多重比较结果的字母标记 (SSR测验)
处 理 平均产量 (克/盆) 31.5 28.5
上一张 下一张 主 页
退 出
式中 μ为总平均数; αi,βj分别为Ai、Bj的效应: αi=μi-μ,βj=μj-μ μi、μj分别为Ai、Bj观测值总体平均数, 且Σαi=0,Σβj=0; εij为随机误差 ,相互独立 , 且服从N (0,σ2)。
上一张 下一张 主 页 退 出
交叉分组两因素单个观测值的试验,A因
4
5
3.18
3.25
4.33
4.40
1.988
2.031
2.706
2.750
表5-19 5个玉米品种平均穗长多重比较表(SSR法)
品种 平均数
B1
B4
20.2
19.6
3.6**
3.0**
3.0**
2.4*
1.9
1.3
单因素方差分析 (2)
单因素方差分析1. 引言•单因素方差分析(One-way ANOVA)是一种常用的统计方法,用于比较两个或多个组之间的均值是否存在显著差异。
•在实际研究中,我们经常需要比较不同组之间某个变量的均值差异,例如不同教育水平对收入的影响,不同药物对疾病的治疗效果等。
•单因素方差分析提供了一种统计方法,可以判断不同组之间均值差异是否由随机因素引起,还是由于真正的因素差异引起。
2. 基本概念•因素(Factor):需要比较不同组之间的变量,也称为自变量或分类因素。
•水平(Level):每个因素具有的不同取值或组别,也称为处理或条件。
•观测值(Observation):每个组内的单个实验结果或数据点。
•总平均(Grand Mean):所有组的观测值的平均值。
•组内平均(Group Mean):每个组的观测值的平均值。
•组间平均(Between-group Mean):所有组的观测值的平均值。
3. 假设检验•零假设(H0):不同组的均值之间没有显著差异。
•备择假设(H1):不同组的均值之间存在显著差异。
4. 单因素方差分析的步骤1.收集数据:按照分类因素进行分组,获得每个组的观测值。
2.计算总平均:计算所有观测值的平均值。
3.计算组内平均:计算每个组的观测值的平均值。
4.计算组间平均:计算所有组的观测值的平均值。
5.构造统计模型:建立协方差矩阵和方差矩阵之间的关系。
6.计算平方和:计算组内平方和和组间平方和。
7.计算均方差:计算组内均方差和组间均方差。
8.计算F值:计算F统计量,用于检验组间均值差异是否显著。
9.假设检验:比较F值与临界值,确定是否拒绝零假设。
5. F分布与p值•在单因素方差分析中,我们使用F分布来进行假设检验。
•F分布是一种连续概率分布,取值范围大于等于0,且分布形状根据自由度的不同而变化。
•在单因素方差分析中,我们计算出的F值可以与F分布表中的临界值进行比较,以确定是否拒绝零假设。
•p值是统计假设检验中的一个重要指标,表示在零假设成立的情况下,观察到的样本数据或更极端结果出现的概率。
方差分析(2次)
它除了推断k个样本所代表的总体均数µ1 ,µ2 , µ3 ,…是否相等外,还要推断b个区组所代表 的总体均数是否相等。由于从总变异中分离出 配伍组变异,考虑了个体变异对处理的影响, 使误差更能反映随机误差的大小,因而提高了 研究效率。
SS总 = SS处理 + SS配伍 + SS误差 df总 = df处理 + df配伍 + df误差
第一节
完全随机设计的方差分析
试验设计时,将受试对象随机分配到两组或 多组中进行实验观察,这里只涉及一个因素, 该因素的各个水平就是各个处理组。
单因素方差分析
或称单向方差分析(one way analysis of variance)或 成组设计(完全随机设计)方差分析,是指试验研究 的处理因素,或调查研究资料的分类方式只有一种。 这个处理因素(或分类方式)包含有多个离散的水平, 分析在不同水平上应变量的平均值是否来自相同总体
Xi = ∑ Xij ni
j =1
ni
X = ∑∑ Xij N = ∑ni Xi N
i =1 j =1 i =1
k
ni
k
SS总 = ∑∑ Xij − X
i=1 j =1
k
ni
(
)
2
ν总 = N −1
2、组间变异 、
SS组间 = ∑ni Xi − X
k
ν组间 = k −1
3、组内变异
i =1
(
)
2
MS组间 = SS组间 ν组间
一、基本思想
*
Xij表示第i个处理组的第j个观察值,i=1,2,…k, j=1,2,…ni
方差分析基本思想示意图
变异原因
第六章 方差分析2
Dft=k–1 Dfe=N–k DfT=N–1
SSt MSt dft SSe MSe dfe
MSt MSe
F分布
• 设想作一个抽样试验,即在一正态总体N(μ, σ2)中随机抽取样本含量为n的样本k个,将各样 本观测值整理成表6-1的形式。此时所谓的各处理 没有真实差异,各处理只是随机分的组。 SS SSt 都是误差方差σ 2的估计量 2 2 Se e St
(3)再求一个组内的离均差平方和相加得:
( X ij X ) ( X ij X i ) ni ( X i X )
2 2 j 1 j 1
因为:
ni
ni
2
2( X
j 1
ni
ij
X i )( X i X ) 2( X i X ) ( X ij X i ) 0
• HA: 至少有两个均数不等 或 至少有一个 a 0
(2)检验统计量,列方差分析表
SSt dft MSt F ~ F (dft , dfe ) SSe dfe MSe
MSt: 组间均方, MSe:组内均方
当 H0 成立时,
E ( MSt ) 2 n 2 0
6.1.3期望均方
试验中各处理所属总体的本质差异体现在处理效 应αi的差异上。
a
2 i
/(k 1) ( i ) /(k 1) 效应方差
2
它也反映了各处理观测值总体平均数μ的变异程 度,记为σα2 2 2 i
k 1
6.1.3期望均方
(x
i.
x.. ) /(k 1)
x i.
10.2 8.2 12 9.6 13
解:
方差分析二:双向方差分析
Yijk
ik
S j
Yij2k
ik
20 557
20 596
20 659
16613
18000
22843
华中科技大学同济医学院 宇传华制作,2004,9
60 1812
57456
21
两因素析因分析的方差分析步骤
1.整理数据:求出处理因素 A、B 及其交互项 AB 的观
察值之和,一个因素的观察值平方和、总和、总平方和等。
110447.5 6
变异分解
(1) 总变异: 所有观察值之间的变异
(2) 处理间变异:处理因素+随机误差
(3) 区组间变异:区组因素+随机误差
(4) 误差变异:
随机误差
S S 总 S S 处 理 S S 区 组 S S 误 差
总 处 理 区 组 误 差
华中科技大学同济医学院 宇传华制作,2004,9
双向方差分析前面内容回顾析因设计factorialdesignanova所关心的问题析因设计的4个实例析因设计的特点2个或以上处理因素factor分类变量本节只考虑两个因素每个因素有2个或以上水平level每一组合涉及全部因素每一因素只有一个水平参与几个因素的组合中至少有2个或以上的观察值观测值为定量数据需满足随机独立正态等方差的anova条件三交互作用三交互作用图第三节两因素析因设计方差分析中的多重比较第四节裂区设计splitplotdesign资料的方差分析裂区设计资料的特点一级单位大区间主区家庭学校二级单位小区内即裂区家庭成员学生两因素裂区设计资料的方差分析方法先按随机区组析因设计的方法分析因素a家庭拥挤程度区组家庭的主效应及其交互作用
变异来源 处理 区组 误差 总
离均差平方和 SS 283.83
连续型变量的推断性分析——方差分析(2)
前面我们介绍了差异分解的方差分析思路,这是最初始的方差分析思想,随着线性模型的发展,人们又将线性模型的思想引入了方差分析,大大提升了这一分析方法的发展空间,下面我们来介绍一下线性模型在方差分析中的体现。
任何一次实验结果都可以表示成如下形式:Y i=μ+εi其中Y i是第i次实验的实际结果,μ是该结果的最佳估计值,其实就是总体均值,εi是均值和实际结果的偏差也就是随机误差,为了方便推导,我们假定εi服从均值为0,标准差为某个定值的正态分布,这也是前面讲到的方差分析的适用条件之一。
我们把以上形式按照方差分析进行推广,假设我们要研究几种水平之间的差异,每种水平抽取一定样本并收集相关数据,那么模型公式可以表示为:Y ij=μi+εij其中Y ij是第i组水平的第j个样本的实际结果,μi是第i组的均值,εij是第i组第j个样本相对于实际结果的偏差。
我们同样假定εi服从均值为0,标准差为某个定值的正态分布,如果这i组水平没有差异,则Y ij应等于总体均值加上随机误差项。
为了方便统计推断,我们又把模型公式改为如下形式:Y ij=μ+αi+εij其中μ表示不考虑分组时的总体均值,αi表示第i组的附加效应,即在第i组时的均值改变情况,例如αi=10,表示第i组的均值要比总体均值多10,如果这i组均值并无差异,那么α1=α2=α3=.....=αi,反正则不等,据此我们可以建立假设:H0:i取任意值时,αi=0H1:i取任意值时,至少有一个αi<>0结合差异分解的方差分析思路,我们发现αi实际上就是处理因素导致的差异。
在多因素方差分析中,我们不但要考虑某个因素的影响,还要考虑多个因素之间的交互作用,因此模型公式还需要扩展,以两因素方差为例,模型公式为:Y ij=μ+αi+βj+γij+εijk其中μ表示不考虑分组时的总体均值,αi表示第i组的附加效应βj表示第j组的附加效应γij表示两个因素的交互作用产生的效应如果我们要分析αi对均值有无影响,需要以αi建立假设,即H0:i取任意值时,αi=0H1:i取任意值时,至少有一个αi≠0如果我们要分析βj对均值有无影响,需要以βj建立假设,即H0:i取任意值时,βj=0H1:i取任意值时,至少有一个βj≠0【线性模型的计算方法和差异分解的计算方法是一样的。
第四章方差分析2
H A0 : µ1 = µ2 = L = µr ; H A1 : 至少存在一对µi ≠ µ j ,
1 s 1 设 : x i ⋅ = ∑ x ij , ( i = 1, 2, L , r ), x ⋅ j = s j =1 r 1 x = rs
H B 0 : µ1 = µ 2 = L = µr ; H B1 : 至少存在一对µi ≠ µ j ,
Y i ~ N ( µ i , σ 2 ), ( i = 1, 2 , L , r ), 且 相 互 独 立 , y ij 是 Y ij的 样 本 值 , 在 同 一 Y i 下 , 样 本 Y ij ~ N ( µ i , σ 2 )( j = 1, 2 , L , n i ) 也 相 互 独 立 ,
∴ µ i的 1 − α 置 信 区 间 为 : Yi ⋅ − tα / 2 ( n − r )
2 SE , Yi ⋅ + tα / 2 ( n − r ) ni ( n − r ) 2 SE ni ( n − r )
9
结束
就例1而言 就例 而言, 而言
αˆ 1 = y 1 ⋅ − y = 1 7 3 . 5 − 1 9 0 . 3 3 = − 1 6 . 8 3 , αˆ 2 = y 2 ⋅ − y = 1 8 7 . 7 5 − 1 9 0 . 3 3 = − 2 . 5 8 , αˆ 3 = y 3 ⋅ − y = 2 0 9 . 7 5 − 1 9 0 . 3 3 = 1 9 . 4 2 .
2 A
2 A
( r − 1) , S = S
2 E
2 E
2 SA ( n − r ) , F = 2 ~ F ( r − 1, n − r ). SE
6
第5章方差分析2
除杂方法(Ai)
A1 A2 A3 A4 A5
表5-2 不同除杂方法的除杂量
除杂量(xij)
(1)总偏差平方和的分解 在表5-1中,反映全部观测值总变异的
总偏差平方和是各观测值xij与总平均数 x..
的离均差平方和,记为SST。即
kn
SST
( xij x.. )2
i1 j1
上一张 下一张 主 页 退 出
k n
kn
(xij x..)2
(xi. x..) (xij xi.) 2
(xij xi. ) 2
i1 j1
SST =SSt+SSe
(5-8)
所以
总偏差平方和=处理间偏差平方和+处理内偏差平方和
或 =因素偏差平方和+误差偏差平方和
上一张 下一张 主 页 退 出
各偏差平方和计算公式:
kn
SST
xi2j C
i1 j 1
SS t
1 n
k i 1
xi2.
C
(5-9)
来表示,则
xij x.. (xi. x.. ) (xij xi. ) x.. ti e(ij 5-6) 与(5-4)式比较可知, x.. 、(xi. x.. ) ti 、
(xij xi. ) eij 分 别是μ、(μi-μ)= 、i
(xij- i ) = ij 的估计值。
13518.7875 13390.3125 128.4750
第九章方差分析2
交互作用:当一个因素的水平在另一个因素的不同水平 上变化趋势不一致时,称两个因素之前存在交互作用。 当一个因素的水平在另一个因素的不同水平上变化趋势 一致时,表明两个因素是相互独立的,即不存在交互作 用
(三)事后检验 1、二因素方差分析主效应显著,但交互作用不显著, 必须进行主效应事后检验 2、二因素交互作用显著,两个主效应也显著或某个主 效应显著,进行主效应事后检验已经不重要,而进行交 互作用的事后检验(称为简单效应分析)非常重要,即 限定其中一个因素的某个水平上,看另一个因素对因变 量的影响。
两因素(A、B)方差分析的流程图
进行方差分析 检验A因素 简单效应
交互作用 是否存在
不存在
存在 分析完成 检验B因素 简单效应
检验主效应
67600 32400 36100 78400
1350 1822500
265900
1960 3841600
1350 1822500
312100
变异来源 平方和
自由度
均方
F
P
组间效应 3878.8
2
1939.4
1.37
>0.05
组内效应 26848.5
19
1413.1
总变异
30727.3
21
ቤተ መጻሕፍቲ ባይዱ
第三节单因素随机区组设计的方差分析 一、什么叫随机区组设计 (一)随机区组设计又叫重复测量设计或组内设计,源 于农业试验 (二)特点:把被试划分为几个区组,再根据实验变量 的水平数在每一个区组内划分为若干个小区,同一个区 组随机接受不同的实验处理。 (三)原则:同一区组内的被试尽量同质
方差分析(二)
M 误 = 4 1 4, X24h =12.76, X0 = 8 04, n h = n =10 S 差 . 8 . 24 0
1 1 SXi −Xj = M 误 ( + ) = S 差 ni nj
LSDLSD- t =
1 1 41 ( + ) = 09 5 . 84 . 1 1 0 10
泸州医学院流行病与卫生统计教研室
一、SNK-q检验 SNK-
SNK(Student-Newman-Keuls)检验,亦称q检验
Xi − Xj SXi−X j
M误 1 1 S 差 , ν= ν 误 差 , SX −X = + i j 2 n nj i
q=
Xi , ni 和 Xj , nj 为两对比组的样本均数和样本例数。
泸州医学院流行病与卫生统计教研室
例 4 -3 续例 4 -1 试比较三个组两两之间的差别。 解:1 . 建立假设并确定检验水准 α ; 2. 计算 q 值 H0 : µi = µj H : µi ≠ µj ; α = 0.05 1 将三个样本均数从小到大排列,并赋予秩次 均数 8.04 9.25 12.76 组别 A 组 C 组 B 组 SXi −Xj = 4.184( 1 + 1 ) = 0.647 2 10 10 秩次 1 2 3 表 4-7 多个均数两两比较 q 值表 比较组秩次 (1 ) 1 , 2 1 , 3 2 , 3
①建立假设并确定检验水准 α ;
H0 : µ24h = µ96h ; H : µ24h ≠ µ96h ; α = 0.05 1
LSD②求 LSD- t 值
M 误 = 4.184, X24h =12.76, X96h = 9.25, n24h = n =10 S 差 96
单因素方差分析(2)
分析多组平均数之间差异显著性 的一种常用方法
1
[例8.1]比较5个不同小麦品种的株高
2
[例8.2] 探讨不同窝的动物的出生重是否存在差异
3
[例9.1] 用不同原料与不同温 度发酵酒精的产量
4
概念
1.单因素试验和双因素试验
– 单因素试验:在试验中所考察的因素只有一个 – 双因素试验:在试验中所考察的因素有二个
n
a 2 / n 2 / n Biblioteka 2 i2a(2
/
an)
i 1
n
(a 1) 2 / n
2 i
20
i 1
三、期望方差与F检验
EMSe 2
E MSA
2
n a 1
a i 1
2 i
H0 :i 0 , i H0 : EMS A EMSe
H A :i 0 , i H A : EMS A EMSe
2.水平
因素在试验中所分的等级
3.处理
在试验中,同一条件下的一组试验
4.重复
每个处理内观察次数或样本数目
5
§8.1 方差分析原理
6
一、数据的一般形式
• 单因素试验的共同特点:
– 一个因素 – a个水平=a个处理 – n次重复
• 单因素试验方差分析的典型数据
7
• Xi,i=1,2,3, …,a 为第i个水平
25
五、计算方法
• [例]表8-1, 5个小麦品系株高调查结果
品系
株号
Ⅰ
II
III
Ⅳ
Ⅴ
1 64.6 64.5 67.8 71.8 69.2 2 65.3 65.3 66.3 72.1 68.2 3 64.8 64.6 67.1 70.0 69.5 4 66.0 63.7 66.8 69.1 68.3 5 65.8 63.9 68.5 71.0 67.5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
区组间变异:不同窝别的小白鼠增重不同 误差:各组内小白鼠增重不同
2020/4/27
7
变异间的关系
SS总 总
SS误差 误差 MS误差
SS处理 处理 MS处理
SS区组 区组 MS区组
变异之间的关系: • SS总= SS处理+ SS区组+ SS误差
总= 处理+ 区组+误差
1.建立假设: H0 :3种营养素喂养的小白鼠体重增量相等 1 = 2 = 3 H1 : 3种营养素喂养的小白鼠体重增量不全相等
2.确定显著性水平,用 表示,常取0.05。 3.计算统计量F: F=MS处理/MS误差 4.求概率值P: 5.做出推论:
完整书写方差分析的过程
1.建立假设: H0 :8窝小白鼠体重增量相等 1 = 2 = 3。。。 H1 : 8窝小白鼠体重增量不全相等
2.确定显著性水平,常取0.05。 3.计算统计量F: F2=MS区组/MS误差 4.求概率值P: 5.做出推论:
存在问题
方差分析结果提供了各组均数间差别的总的信 息,但尚未提供各组间差别的具体信息,即尚 未指出哪几个组均数间的差别具有或不具有统 计学意义。
了得到这方面的信息,可进行多个样本间的 两两比较。
(Randomized block design Two-way ANOVA)
将全部受试对象按某种或某些特性分为若干个区 组,使每个区组内的观察对象与研究对象的水平 尽可能相近,减少了个体间差异对研究结果的影 响,比成组设计更容易检验出处理因素间的差别, 提高了研究效率。 (复习配对资料)是配对资料的扩充。
2020/4/27
方差分析(二)
Prepared by: Wollong
1
给小白鼠喂A、B、C三种不同的营养 素,了解不同营养素的增重效果。现将体 重基本相同的24只小白鼠随机分为3组,每 组8只。3周后测量增重结果,结果如下表,
问3种不同营养素喂养后,体重增加有无 差别?
2020/4/27
2
第三节 随机区组设计的两因素方差分析
例题
给小白鼠分别喂A、B、C三种不同的营养素, 了解不同营养素的增重效果。以窝别作为 区组特征,以消除遗传因素对体重增长的 影响。现将同系同体重的24只小白鼠分为8 个区组,每组3只。3周后测量增重结果, 结果如下表,
问3种不同营养素喂养后所增体重有无差别?
2020/4/27
5
分析变异
总变异:24只小白鼠的增重不等,与均数 之间存在差别。
2020/4/27
17
二、 SNK-q检验
也叫Student-Newman-Keuls(SNK-q)检验
用于多个样本均数间每两个均数的比较。
计算统计量q的公式:
q ( xa xb) sd
sd
M S误差 ( 1 1 )
2
nA nB
2020/4/27
18
计算q值
1.将各组样本均数从大到小排列
统计量F 的计算
F1=MS处理/MS误差 F2=MS区组/MS误差
自由度: 处理=组数-1=3-1=2 区组=区数-1=8-1=7 误差=(组数-1)(区数-1)=14
2020/4/27
9
方差分析结果
变异来源
SS
MS
F
P
总
2861.84 23
处理间 144.92
2
区组间 2376.38
误差
14
完整书写方差分析的过程
第四节 多个样本均数间的多重比较
(Multiple comparison)
能否用t检验或µ检验?
每次犯第一类错误的概率0.05,10次都犯的概 率不是0.05,而是:?? 远大于0.05,不是小概率事件,会把本来无差
别的两个总体均数判断为有差别。
一、最小有意义t(LSD- t)检验
意义:检验K组中某一对或几对在专业上有特 殊意义的均数(dAB =XA-XB)的总体水平是否 为0。
公式: t ( xa xb) s dAB
s dAB MS误差( 1 1 ) nA nB
自由度:用误差的自由度
2020/4/27
16
对前面例题中,用糖尿病患者、正常
例题: 人的载蛋白与IGT异常者进行比较。
1.建立假设: H0 :糖尿病患者与IGT的载脂蛋白相等1 = 2 H1 :糖尿病患者与IGT的载脂蛋白不等1 2 2.确定显著性水平,用 表示,取0.05。 3.计算统计量t:105.45,102.39,203.62 ,11,9 4.求概率值P: 5.做出推论:
组次 1
2
3
均数 122.8 105.45 102.39
组别 正常人 糖尿病 IGT异常
2.根据公式计算q值,查q界值表(a, )
3.计算组间跨度a:中间涵盖的均数个数
4.误差自由度
2020/4/27
19
变量变换
目的:将原始资料变换成适用于检验方 法的资料
方法:对数变换、平方根变换、倒数变 换等。
2020/4/27
20
小结
2020/4/27
21