第4讲 方差分析 (1)
单因素方差分析(1)
H
0:
2 1
2 2
2 r
vs
H1:诸
2 i
不全相等
感谢下 载
第六章 方差分析
第一节 单因素方差分析 第二节 双因素方差分析
第一节 方差分析
一、问题的提出
方差分析(analysis of variance)就是采用数理 统计方法对数据进行分析,以鉴别各种因素及因素间 的交互作用对研究对象某些试验指标的影响大小的一 种有效方法. 注:方差分析简记为ANOVA.
水平 A1
A2
…
Ar 合计
重复数
m1 m2
mr n
试验数据 y11, y12 ,…., y1m1
y21, y22 ,…., y2m2
…….
yr1, yr2 ,…., yrmr
T
和
平均
T1
y1
T2
y2
……
Tr
yr
T
y
2. 基本假定、平方和分解、方差分析及判断准则相
同
计算公式稍有不同。特别注意 SA 的计算公式!
( yij
y)2,
fT
n 1
它反映了观测数据 总的变异程度
i1 j1
组间(因子A的)偏 差平方和:
r
SA m ( yi y)2, fA r 1 i1
r
m (i i )2
反映因子A的不同水平效 应间的差异
i1
rm
组和内: (误差)偏差平方Se
i 1
( yij yi
j 1
)2 ,
例2(第一节中例1续)检验不同饲料对鸡增重 的效应中,饲料因子显著.试进行多重比较.
补充:方差齐性检验
(齐性,即相等)
第4讲5(1) 正交试验设计(方差分析)
处理号 1 2
第1列(A) 1 1
表 L9(34)正交表
第2列 1 2
第3列 1 2
第4列 1 2
因素A第1 试验结果y水i 平3次
重复测定 y1 值 y2
3
1
3
3
3
y3
单4 因素 2
1
2
3
y4
试5 验数 2
2
3
1
y5
因素A第2
SS据A6=资13(料y1 y22
格式 78=13(K12
3 K322
y3)2 (y43y5
K32)-
T2 9
1 2
y6)2 ( 1 y7 3 1
y 82y 9)2 2 3
(y1yy62 ...
9
y7 y8
y水9)平2(修 3次正重项) 复测定值
9
3
3
2
1
y9
分析第1列因素时,其它列暂不考虑,将其看做条件因因素素A。第3
因素 重复1 重复2 重复3
显著影响
(6)列方差分析表
(1)偏差平方和分解:
总偏差平方和=各列因素偏差平方和+误差偏差平方和
SST SS因素 SS空列(误差)
(2)自由度分解:
dfT df因素 df空列( 误列(
(3)方差:MS因素=
SS因素 df因素
,MS误差=
SS误差 df误差
(4)构造F统计量:
F因素=
MS因素 MS误差
(5)列方差分析表,作F检验
若计算出的F值F0>Fa,则拒绝原假设,认为 该因素或交互作用对试验结果有显著影响;若 F0≼Fa,则认为该因素或交互作用对试验结果 无显著影响。
第4章 方差分析(anova)实验设计和分析
第4章方差分析(ANOV A)实验设计和分析Catherine Potvin4.1生态学问题弄懂生态学问题需要将各种环境因子的影响分开,生态工作者用实验来解决这个问题。
不论在野外还是在控制环境条件下,可控实验都可以让生态工作者们只变化一个因子来检验其影响。
例如,生长箱能使生物体生长在完全相同的温度而不同的光周期的条件下,或相同的光强而不同温度条件下的实验成为可能。
在控制实验中,通常最希望的情况是环境‘背景’,即所有的影响因子, 不是自由地变化,而是精确地得到控制,这样就能够保证在改变目标变量时,观测的反应不会受到其它因素的影响。
因而控制环境条件, 例如使用生长箱和温室,成为植物生态学的一个常用的方法,如同动物生态学中使用的生长柜和水族槽一样。
本章第一部分,我要讲一下作为实验生态学基本工具的方差分析(ANOV A)。
本章重点放在实验设计上。
虽然人们一般认为生长箱会提供同一环境条件,但不论在一个生长箱内还是生长箱间都存在环境异质性(Lee和Rawlings 1982;Potvin等1990a),因而能够充分处理环境异质性的实验设计将在本章中述及。
尽管我的论述主要是以生长箱实验为基础,其原理在其它类型的控制或野外环境的实验研究中同样适用(第5,15和16章)。
我还要讨论错误实验设计的代价。
本章应视为实验设计的起步点,这个起步点就是要考虑各种影响因素。
实验者通常进行的实验比这里展开的要复杂。
但是一旦懂得了基本原理,讨论各种实验设计就相对简单一些。
更详细的论述请见Cochran & Cox(1957)和Winter(1991)。
4.2 统计问题:环境变化与统计分析正如Underwood(1997)建议的一样,生态实验设计的第一步是建立一个线性模型使研究者能够将感兴趣的变量(因素)独立出来。
由于实验设计支配误差项,建立线性模型取决于所研究的因子以及具体的实验设计。
在任何一个实验开始时,最基本的是要检验空间与时间变化的格局。
完全随机设计的方差分析(1)
.
21
.
22
方差分析(Analysis of variance,ANOVA)
方差分析的定义
又叫变量分析,是英国著名统计学家R . A . Fisher于20世纪提出的。它是用以检验两个或多个 均数间差异的假设检验方法。它是一类特定情况下 的统计假设检验,或者说是平均数差异显著性检验 的一种引伸。为纪念Fisher,以F命名,故方差分析 又称F检验 。
1.特点 单因素方差分析是按照完全随机设计的原则将处理 因素分为若干个不同的水平,每个水平代表一个样本,只 能分析一个因素对试验结果的影响及作用。其设计简单, 计算方便,应用广泛,是一种常用的分析方法,但其效率 相对较低。该设计中的总变异可以分出两个部分,
•
即SS总=SS组间+SS组内。
2.常用符号及其意义
.
29
end
第一节 完全随机设计资料的方差分析
完全随机设计:(completely random design)是采
用完全随机化的分组方法,将全部试验对象分配到g个
处理组(水平组),各组分别接受不同的处理,试验 结束后比较各组均数之间的差别有无统计学意义,推 论处理因素的效应。
.
30
end
第一节 完全随机设计资料的方差分析
离均差平方和 X2
总体方差 样本方差
2 X 2
N
S2XX2X2X2/n
n1
n1
方差—随机变量离散的重要衡量方法
.
13
试验指标(experimental index): 为衡量试验
结果的好坏和处理效应的高低,在实验中具体 测定的性状或观测的项目称为试验指标。常用 的试验指标有:身高、体重、日增重、酶活性、 DNA含量等等。
方差分析1
(6-4)、(6-6)两式告诉我们: 每 个 观 测 值 都包含处理效应(μi-μ 或 xi . x.. ),与误差( xij i 或 xij xi.),故 kn个观测值的总变异可分解为处理间的变异 和处理内的变异两部分。
二、平方和与自由度的剖分 在方差分析中是用样本方差即均方(mean squares)来度量资料的变异程度的。 表6-1中全部观测值的总变异可以用总均方 来度量。 将总变异分解为处理间变异和处理内变异, 就是要将 总 均方 分解为处理间均方和处理内均 方。但这种分解是通过将总均方的分子──称为 总离均差平方和,简称为总平方和,剖分成处理 间平方和与处理内平方和两部分;将总均方的分 母──称为总自由度,剖分成处理间自由度与处 理内自由度两部分来实现的。
于资料中观测值的总个数减1,即kn-1。总自
由度记为dfT,即dfT=kn-1。
上一张 下一张 主 页 退 出
在计算处理间平方和时,各处理均数 x i. 要
受 ( xi. x.. ) 0 这一条件的约束,故处理间自由度
方差分析
t检验法适用于样本平均数与总体平均数及
两样本平均数间的差异显著性检验, 但在生产 和科学研究中经常会遇到比较 多个处理优劣的 问题, 即需进行多个平均数间的差异显著性检 验。这时,若仍采用t检验法就不适宜了。这是
因为:
上一张 下一张 主 页 退 出
1、检验过程烦琐 例如,一试验包含5个处理,采用t检验
上一张 下一张 主 页 退 出
5、试验单位(experimental unit)
在试验中能接受不同试验处理的独立的试验
载体叫试验单位。
在畜禽、水产试验中, 一只家禽、 一头家
4.方差分析实验2014 (1)
例:某研究者欲研究甲状腺功能低下婴儿血清中甲 状腺含量(nmol/L),按病情严重程度分为三个水平: 轻度组、中度组、重度组,各组中随机选取10名婴 儿,请分析不同严重程度的婴儿血清甲状腺素水平 是否不同?实验前研究者关心重度组与中度组婴儿 血清甲状腺水平是否有不同? (ANOVA 1)
不同严重程度的婴儿血清甲状腺素水平(nmol/L) (n=10)
1、变量设置 (1)数据格式 1个分类变量,标记为1,2,3,……Group=组别 1=轻度,2=中度,3=中度 2、前提条件的假设检验 1个因变量(反应变量) X=甲状腺素含量 AnalyzeDescriptive Statistics Explore Dependent List:X Factor List: Group Plots: Boxplots(箱式图) Normality plots with tests(正态性检验) Spread vs. Level with Levene Test:none
Post Hoc Post Hoc Tests for:group LSD/SNK/Bonferroni Options Estimated Marginal Means(均数估计) Display Means for :group(显示框内因素的 均 数估计,包括均数,标准误及可信区间 Display 输出选项 Descriptive statistics Homogeneity tests
统计学第四章多个样本均数比较的方差分析
72.46
2.98
>0.05
区组间
2376.38
7
339.48
13.96
<0.01
误差
340.54
14
24.32总Βιβλιοθήκη 2861.8423
F0.01(7,14)=4.28, P<0.01。可认为8个区组的小白鼠体重增量有差别,即遗传因素对小白鼠体重增量有影响(但一般更关注处理组间差别的假设检验)。
02
单击此处添加正文,文字是您思想的提炼,请言简意赅地阐述您的观点。
第四章 多个样本均数比较的 方差分析
单击此处添加副标题
202X
方差分析
01.
方差分析的基本思想
单击此处添加正文
03.
随机区组设计的两因素方差分析
单击此处添加正文
05.
多个样本均数间的多重比较
单击此处添加正文
02.
完全随机设计的单因素
阶段
1
2
3
4
5
6
7
8
9
10
11
12
I
B
B
A
B
A
A
A
A
B
B
B
A
3.07
1.33
4.44
1.87
3.20
3.73
4.13
1.07
1.07
2.27
3.47
2.40
II
A
A
B
A
B
B
B
B
A
A
A
B
2.80
1.47
3.73
3.60
2.67
1.60
方差分析(一):单向
浙江大学医学院流行病与卫生统计学教研室
沈毅
浙江大学医学院流行病与卫生统计学教研室
沈毅
F分布的随机变量没有负值。 依据不同 α 水准下的F界值表。例如当v1=10,v2=30时,= α 0.05的临界F值F0.05(10,30)=2.16,当计算出的统计量 F值等于 或大于临界 Fα ( v1,v2 ) 值时,就在 α 水准上拒绝无效假设,否则 就不拒绝无效假设。根据计算出的F统计量与临界F值 之间的关系有如下的统计学推断规则:
浙江大学医学院流行病与卫生统计学教研室
沈毅
例8-1 有3种解毒药:A、B及C,同时设一个空白对照D, 共有4个组。即解毒药这个处理因素包含有4个水平,或4个 处理组,用i表示处理组号,i=1,2,3,4分别代表A、B、 C、D4个组。受试大白鼠共24只,故动物总数或样本含量 N=24。按完全随机化方法将它们分成等数的4个组,每组 有6只动物。用ni表示第i组受试动物数(当每组受试动物数 相等时用n代替 ni)。用j(j=1,2,…,6)表示每组受试 动物号。应变量用Yij表示第 i组第j号大白鼠的血中胆碱酯酶 含量(µ/ml)。实验结果见表8-l。
浙江大学医学院流行病与卫生统计学教研室
沈毅
关系式为:
∑(
j
Y1 j − Y 1
)
2
+ ∑ Y2 j − Y 2
j
(
)
2
+ ⋯ + ∑ Yaj − Y a
j
(
) ∑∑ (
2
Yij − Y i
( n1 − 1) + ( n2 − 1) + ⋯ + ( na − 1)
=
i
( N − a)
方差分析(ANOVA)1
Dunnet 检验方法,证实性检验,常用于多 个试验组与一个对照组间的比较。
单因素方差分析
例1 在肾缺血再灌注过程的研究中,将36只雄性大鼠随机等 分成三组,分别为正常对照组、肾缺血60分组和肾缺血60 分再灌注组,测得各个体的NO数据见数据文件no.sav,试 问各组的NO平均水平是否相同?
P2,45=3.20-3.21<8.87,本次F值处于F界值之 外,说明组间均方组内均方比值属于小概率 事件,因此拒绝H0,接受H1,三个总体均 数不等或不全相等
方差分析的关键条件
第一、各组服从正态分布! 第二、各组符合方差齐性! 第三、独立性
方差齐性检验
Bartlett检验法 Levene F 检验 最大方差与最小方差之比<3,初步认为方
H0:三个总体均数相等,即三组工作人员 的体重指数总体均数相等
H1:三个总体均数不等或不全相等 a=0.05
(2)计算检验统计量F值
变异来源
组间 组内 总变异
SS 自由度(df)
MS
143.406 363.86 507.36
2
71.703
45
8.09
47
F 8.87
(3)确定p值,作出统计推断
18~岁 21.65 20.66
… … 18.82 16 22.07 8.97
30~岁 27.15 28.58
… … 23.93 16 25.94 8.11
45~60岁 20.28 22.88 … … 26.49 16 25.49 7.19
一、方差分析的基本思想
思想来源: 观察值总变异可以分解为组间变异和组内变异
变异程度除与离均差平方和的大小有关外, 还与其自由度有关,由于各部分自由度不相等, 因此各部分离均差平方和不能直接比较,须将 各部分离均差平方和除以相应自由度,其比值
田间统计第5章_方差分析(第1节)
在计算处理内平方和时,kn个离均差
( xij xi ) 要受k个条件的约束,即
(x
j 1
n
ij
xi ) 0 (i=1,2,…,k)
故处理内自由度为资料中观测值的总个数
减 k ,即 kn - k 。 处理内自由度记为 dfe
dfe=kn-k=k(n-1)
因为
nk 1 (k 1) (nk k ) (k 1) k (n 1)
F 分布密度曲线是随自由度df1、df2的
变化而变化的一簇偏态曲线,其形态随着df1、 df2的增大逐渐趋于对称,如图3-15所示。
特点:1、F分布的平均数μ F=1; 2、取值范围[0,+∞]; 3、只有一尾概率,右尾概率; 4、F分布是一组曲线系,当V1、V2都 趋近于+∞时,F分布趋于对称分布。
(二)、F检验
用 F 值出现概率的大小推断一个总
体方差是否大于另一个总体方差的方法
称为F检验(F-test)。F检验是一尾检验。
对于单因素完全随机设计试验资料的方差
分析:
无效假设H0:μ1=μ2=…=μk
备择假设HA:各μi不全相等 或 假设 H0:σt2=σe2 对 HA:σt2﹥σe2, F=MSt / MSe,也就是要判断处理间均方
j
Hale Waihona Puke LSDa t a ( dfe ) S xi x j
t ( df e ) 为在F 检验中误差项自由度下,显著水平
为α的临界t 值, S x x 为均数差数标准误, i j
S xi x j
2MS e / n
MS e 为F 检验中的误差均方,n为各处理的重复数。
当显著水平α=0.05和0.01时,从t 值表中查出
方差分析ppt课件
在观测变量总离差平方和中,如果组
间离差平方和所占比例较大,则说明观 测变量的变动主要是由控制变量引起的, 可以由控制变量来解释,控制变量给观 测变量带来了显著影响;反之,如果组 间离差平方和所占比例小,则说明观测 变量的变动不是主要由控制变量引起的, 不可以主要由控制变量来解释,控制变 量的不同水平没有给观测变量带来显著 影响,观测变量值的变动是由随机变量 因素引起的。
不同饲料对牲畜体重增长的效果等, 都可以使用方差分析方法去解决。
方差或叫均方,是标准差的平方,是
表示变异的量。在一个多处理试验中, 可以得到一系列不同的观测值。造成观 测值不同的原因是多方面的,有的是处 理不同引起的,叫处理效应或条件变异, 有的是试验过程中偶然性因素的干扰和 测量误差所致,称为实验误差。
dfT nk 1 20 1 19
dft k 1 5 1 4
dfe 5(4 1) 15
st 2
SSt dft
103.94 3
34.65
se2
SSe dfe
109.36 12
9.11
进行F检验:
F st2 34.65 50.15 se2 9.11
F0.05(4,15) 3.06, F0.01(4,15) 4.89, F
x1 x2
ts x1 x2
x1 x2
LSD0.05 t s 0.05 x1x2
LSD0.01
t0.01
s x1 x2
若
x1
x 2 >t0.05
s x1
x2
或
x1
ห้องสมุดไป่ตู้
x2
>
t0.01
s x1 x2
方差分析课件-PPT
增重表就是选用S-N-K法作均数多重两两比较得结果:
本例按a=0、05水准,将无显著性差异得数归为一类 (Subset for alpha=0、05)。可见
品种5、2、3得样本均数位于同一个子集( Subset )内,说 明品种5、品种2、品种3得样本均数两两之间无显著差异; 品种3、4、1位于同一个Subset内,她们之间无显著差异;而 品种5、2与品种4、1得样本均数有显著差异。
即三组均数间差异极显著,即不同时期切痂对大鼠肝脏 ATP含量有影响。
LSD法多重比较:
“*”显著性标注 两组均数得差
•S-N-K法:本例按0、5水平,将无显著差异得均数归为一类。
•第一组与第三组为一类,无显著差异,它们与第二组之间均数差 异显著。
•LSD与S-N-K法,不同得两两比较法会有不同。
如欲了解就是否达到极显著差异,需要将显著水平框中得 值输入0、01。
例、 为了研究烫伤后不同时间切痂对大鼠肝脏 ATP得影响,现将30只雄性大鼠随机分成3组,每组 10只:A组为烫伤对照组,B组为烫伤后24小时切痂 组,C组为烫伤后96小时切痂组。全部大鼠在烫伤 168小时候处死并测量器肝脏ATP含量,结果如下。 问试验3组大鼠肝脏ATP总数均数就是否相同。
该12个观察值得总得均值为91、5,标准差为34、 48。
上图为品系、剂量间均值得方差分析(F检验)结果
由表中可知,品系得F=23、771,P=0、001<0、01,差异极显著;
剂量得F=33、537,P=0、001<0、01,差异极显著。说明不同品系与 不同雌激素剂量对大鼠子宫得发育均有极显著影响,故有必要进一步对 品系、雌激素剂量两因素不同水平得均值进行多重比较。
方差分析1
3、方差分析的原理 在上述假定条件下,判断颜色对销售量是否有显著 影响,实际上也就是检验具有同方差的四个正态总体 的均值是否相等的问题。
如果四个总体的均值相等,可以期望四个样本的均 值也会很接近。 四个样本的均值越接近,我们推断四个总体均值相 等的证据也就越充分。 样本均值越不同,我们推断总体均值不同的证据就 越充分。
首先,提出如下假设: H0: 1 = 2 = 3 = 4 如果原假设成立(四种颜色饮料销售的均值都 相等、没有系统误差)这意味着每个样本都来自均 值为、方差为2的同一正态总体,有充分证据表明 颜色因素对分店的日营业额没有实质性影响
f(X)
1 2 3 4
X
备择假设:H1: i (i=1,2,3,4)不全相等 如果备择假设成立(即至少有一个总体的均值是不同 的、有系统误差)这意味着四个样本分别来自均值不 同的四个正态总体,有充分证据说明颜色因素对日营 业额有显著影响。
(2)水平(level) ——又称处理(treatment) 因子在实验中的不同状态或因素的具体表现称为 水平。如例中橘黄色、粉色、绿色和无色四种颜色就是因 素的水平。 水平有质的不同和量的差异两种情况。
例1,所要研究的因素为性别,这个因素就可以分为男和 女两个不同的水平。 例2,要研究不同教材所产生的学习效果是否有显著性差 异,可以从四所学校同一个年级中各抽取一组学生,每组学生 用一种教材进行教学,然后比较各组学生学习成绩的高低。 例3,按IQ分数的高低把被试分成高智商、智商中等和低 智商三个水平。 例4,按考试成绩高低把学生分为高成就、成绩中等和低 成就三个水平。
应用统计
方差分析
方差分析简称ANOV, ANOVA 由英国统计学家 R.A.Fisher首创,为纪 念Fisher,以F命名, 故方差分析又称 F 检 验 (F test)。用于 推断多个总体均数有无 差异
方差分析-1
SSt X 2 ji
j 1 i 1 nj
n
j nj
SSb
j 1
k
( X ji )
i 1
2
nj
( X ji ) 2
j 1 i 1 k j 1
n
j
SSw SSt SSb dft N 1 n j 1
析因设计的单元格
• 第一个因子的水平数 * 第二个因子的水平数 • 前面那个例子, 2 个水平的测试时间 * 2 个 水平的犯罪严重程度 = 2*2 的析因实验设 计 = 4 个单元格
下表就是一个 2Χ2 的实验设计
B1 B2
A1
A1B1
A1B2
A2
A2B1
A2B2
一个 2Χ3 的实验设计
B1 B2 B3
n
j nj
SSb
j 1
k
( X ji )
i 1
2
nj
( X ji ) 2
j 1 i 1 k j 1
n
j
SSw SSt SSb dft N 1 n j 1
j 1 k
dfb k 1 dfw dft dfb N k F MSb SSb / dfb MS w SSw / dfw
一个最简单的例子
• 研究者想知道对重要信息的回忆是否会受犯罪的 严重程度和案件过去的时间的影响 • 因变量是对重要信息的回忆,即正确回答案件相 关问题的个数 • 被试是大学生
对自变量的分析
• 第一个自变量是犯罪的严重程度 • 一个录像关于一个男小偷在一个服装店偷一 个妇女的钱包 • 一个录像用了同样的演员,但是是一个男的 持枪抢劫在同一个的服装店的收银员。在这 里录像里,导购员站在收银员的后面,另外 有两个人站在柜台旁边
方差分析与实验设计(1)幻灯片
❖ 所以,方差分析是一种实用、有效的分析方 法。
6.1.2 方差分析及其有关术语
❖1.方差分析的概念 ❖2.方差分析的有关术语 ❖3.方差分析的种类
1.方差分析的概念
❖ 方差分析是检验多个总体均值是否相等的一 种统计分析方法,它是通过检验各总体的均 值是否相等来判断分类型自变量对数值型因 变量是否有显著影响。
方差分析与实验设计(1)幻 灯片
本课件PPT仅供大家学习使用 学习完请自行删除,谢谢! 本课件PPT仅供大家学习使用 学习完请自行删除,谢谢!
第6章 方差分析
❖6.1 方差分析引论 ❖6.2 单因素方差分析 ❖6.3 方差分析中的多重比较 ❖6.4.1.1 引言 ❖6.1.2 方差分析及其有关术语 ❖6.1.3 方差分析的基本思想和原理 ❖6.1.4 方差分析中的基本假定 ❖6.1.5 方差分析中的F统计量
6.1.1 引言
❖ 方差分析和第七章将要介绍的回归分析都是数理统 计中最古典、最常用、应用最广泛的方法。
❖ 方差分析是由英国统计学家费歇(R.Fisher)在 1918年的著作《试验之设计》中首先提出来的,它 最初应用于农业方面的试验设计及试验结果的分析, 后来逐渐推广,现已广泛应用于工业、农业、生物、 医学等领域,成为最常用的一种统计推断方法。
对想检而验 知共。有C3 2 0435个,检验的工作量之大,可
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3. 三因素方差分析: 也称为拉丁方设计(Latin square design)的方差分析。该设计特点是, 可以同时分析三个因素对试验结果的作用, 且三个因素之间相互独立,不能有交互作用。 4. 析因设计(factorial design)的方差分析: 当 两个因素或多个因素之间存在相互影响或交 互作用时,可用该设计来进行分析。该设计 不仅可以分析多个因素的独立作用,也可以 分析多个因素间的交互作用,是一种高效率 的方差分析方法。
组间变异=①随机误差+②处理因素效应
组间变异 SSB
Sum of squares between groups
X1 X2
X3
X
n 1 ( X 1 X )2 n 2 ( X 2 X )2 n3( X 3 X )2
2
SSBetween ni ( X i X )
组内变异(within group variation )
SS组间 MS组间 组间
MS组内
SS组内
组内
分析变异
方差比的分布!
F
MS组间 MS组内
处理因素变异 误差变异 误差变异
• 基本思想:根据实验设计的类型,将全部 观测值总的离均差平方和及其自由度分解 为两个或多个部分,除随机误差作用外, 每个部分的变异可由某个因素的作用(或 某几个因素的交互作用)加以解释,如组 间变异SS组间可由处理因素的作用加以解释。 通过比较不同变异来源的均方,借助F分布 作出统计推断,从而推论各种研究因素对 试验结果有无影响。
总
• 2.数理统计证明,SS 可以由几个部分构成。 单因素方差分析中,SS 由组间变异和组内 变异构成。 SS =SS +SS • 3.组间变异主要受到处理因素和个体误差两 方面影响,组内变异主要受个体误差的影响。 当H0为真时,由于处理因素不起作用,组间 变异只受个体误差的影响。此时,组间变异 与组内变异相差不能太大。
• 例4-2:某医生为了研究一种降血脂新药的临
床疗效,按统一纳入标准选择120名高血脂 症患者,采用完全随机设计方法将患者等 分为4组,进行双盲试验。6周后测得低密 度脂蛋白作为试验结果,见表4-2。问4个处 理组患者的低密度脂蛋白含量总体均数有 无差别?
表4-2 四个处理组低密度脂蛋白测量值(mmol/L)
学习要求
1.掌握方差分析的基本思想; 2.掌握单因素、双因素、两阶段、析因设计 和重复测量资料方差分析的应用条件、意 义及计算方法; 3.熟悉多个均数间两两比较的意义及方法; 4.了解方差齐性检验的意义及方法; 5.熟悉变量变换的意义和方法。
第1节 方差分析的基本思想
• 方 差 分 析 ( analysis of variance , 缩 写 为 ANOVA )是常用的统计分析方法之一。其 应用广泛,分析效率高,节省样本含量。
变异分解:
SS总 = xij x
i 1 j 1 g ni
2
g ni xij ni ni g g i 1 j 1 2 2 xij = xij -C N i 1 j 1 i 1 j 1
2
总 =N 1
xij g g 2 j 1 SS组间 = ni xi x = ni i 1 i 1
什么是方差?
方差 变异
样本方差 总体方差
自由度 离均差平方和(SS)
例4-1:某医生为研究一种四类降糖新药的疗 效,选择了60名II型糖尿病患者,按完全随机设 计方案将患者分为三组进行双盲临床试验。其 中,降糖新药高剂量组 21 人、低剂量组 19 人、 对照组 20 人。对照组服用公认的降糖药物,治 疗4周后测得其餐后2小时血糖的下降值(mmol/L) 结果如下表:问治疗4周后餐后血糖下降值各组 的平均水平是否不同?
1
2
k
H 0 : m1 m 2 m k
2 2 12 2 k 2
假设的意义为,在某处理因素的不同水平下,各样 本的总体均数相等。
• 1.设某因素有g个水平,即试验数据产生g个 样本;每个样本有ni个观测。由多个样本的全 部数据可以计算出总变异,称为总的离均差 平方和。即SS 。
组间
组内
0
1
表4-4 方差分析表
• 该结论的意义为,至少有两组低密度脂蛋 白总体均数不同。如果想确切了解哪两个 低密度脂蛋白总体均数有差异,可进一步 作多个样本均数的两两比较。
第3节
双因素方差分析
1.特点 按照随机区组设计的原则来分析两个因素对 试验结果的影响及作用。其中一个因素称为处理 因素,一般作为列因素;另一个因素称为区组因 素或配伍组因素,一般作为行因素。两个因素相 互独立,且无交互影响。双因素方差分析使用的 样本例数较少,分析效率高,是一种经常使用的 分析方法。 • 双因素方差分析的设计对选择受试对象及试验条 件等方面要求较为严格,应用该设计方法时要十 分注意。该设计方法中,总变异可以分出三个部 分: SS总=SS处理+SS区组+SS误差
2
组间 =4-1=3
SS组内 =SS总 -SS组间 =82.10-32.16 49.94
组内 =119-3=116
MS组间
SS组间
组间
SS组内
32.16 10.72 3
F
MS组间 MS组内
10.72 24.93 043MS组内 组内
49.94 0.43 116
0 1
( xij ) 2 C=
i 1 j 1
4
30
120
4 30 i 1 j 1
=
324.30
120
2
=876.42
SS总= x 2-C=958.52 876.42 82.10
总=N- 1 120 1 119
SS组间
ni xij g (102.91) 2 (81.46) 2 (80.94) 2 (58.99) 2 j 1 C 876.42 32.16 ni 30 30 30 30 i 1
F F0.013,116 , P 0.01
(3) 列方差分析表: 见表4-4。 (4)确定P值: 根据=0.05,1= =2, 2 = =24,查附表4,F界值表,得F界 值:F0.01(2,24)=5.61。本例F=54.39,大于界值 F0.01(2,24)=5.61,则P<0.01。 (5) 推断结论: 由于P<0.01,在=0.05水准上 拒绝H ,接受H ,差异有统计学意义。可以 认为四个处理组低密度脂蛋白总体均数不全 相同。
三、方差分析的类型
1. 单因素方差分析(one-way ANOVA):也称 为完全随机设计(completely random design)的 方差分析。该设计只能分析一个因素下多个 水平对试验结果的影响。 2. 双因素方差分析(two-way ANOVA):称为 随机区组设计(randomized block design)的 方差分析。该设计可以分析两个因素。一个 为处理因素,也称为列因素;一个为区组因 素,也称为行因素。
总 总 总 组间 组内
• 4.各种变异除以相应的自由度,称为均方, 用MS表示,也就是方差。当H0为真时,组 间均方与组内均方相差不大,两者比值F值 约接近于1。即 F=组间均方/组内均方≈1。 • 5.当H0不成立时,处理因素产生了作用,使 得组间均方增大,此时,F>>1,当大于 等于F临界值时,则P≤0.05可认为H0不成立, 各样本均数不全相等。
组内变异 SS 组内: 随机误差 组间变异 SS 组间:处理因素 + 随机误差
变异程度除与离均差平方和的大小有关外, 因此各部分离均差平方和不能直接比较,须将 各部分离均差平方和除以相应自由度,其比值 称为均方差,简称均方 (mean square, MS)。组 间均方和组内均方的计算公式为 :
还与其自由度有关,由于各部分自由度不相等,
5.正交试验设计的方差分析 : 如果要分析的因 素有三个或三个以上,可进行正交试验设 计(orthogonal experimental design)的方差 分析。当分析因素较多时,试验次数会急 剧增加,用此设计进行分析则更能体现出 其优越性。该设计利用正交表来安排各次 试验,以最少的试验次数,得到更多的分 析结果。
ni 2
x ij i 1 j 1 C N
g ni
2
xij xij g i 1 j 1 j 1 -C - N ni i 1
g ni ni
2
2
组间 =g 1
SS组内 =SS总 -SS处理
组内 = 总 - 处理 N -g
整理如下表:
表4-3 完全随机设计资料的方差分析表
例4-2 计算
n x
x x
2
• 假设检验
(1) 建立检验假设 H :四个处理组低密度脂蛋白总体均数相同,m1=m2= m3; H :四个处理组低密度脂蛋白总体均数不全相同。 α=0.05, (2) 计算检验统计量F值: 由表4-2的数据计算有:
医学统计学 Medical Statistics
高文龙 兰州大学公共卫生学院
第4章 方差分析
第1节 第2节 第3节 第4节 第5节 第6节 第7节 方差分析的基本思想 单因素方差分析 双因素方差分析 析因设计的方差分析 重复测量资料的方差分析 多个样本均数是的两两比较 多个方差的齐性检验
试验数据中存在的变异
总变异(Total variation)
全部测量值Xij与总均数 量值之间总的变异程度。
X
间的差别 ,反映了所有测
SST X X
2
组间变异( between group variation )