第08章 单向方差分析
医学统计学 -第08章 方差分析
第一节 方差分析的基本思想
看一个例子
例8-1 为研究钙离子对体重的影响作用,某研究者将36 只肥胖模型大白鼠随机分为三组,每组12只,分别给 予高脂正常剂量钙(0.5%)、高脂高剂量钙(1.0%)和高 脂高剂量钙(1.5%)三种不同的饲料,喂养9周,测其 喂养前后体重的差值。问三组不同喂养方式下大白鼠 体重改变是否不同?
• 三种喂养方式体重改变的平均值各不相同,这种变异 称为组间变异
•
是组内均值
X
与总均值
i
X
之差的平方和
360
340
组间变异反映了:
320
三种喂养方式的差异(影响), 300
同时也包含了随机误差。
280
260
240
k ni
220
SS组间
(Xi X )2
200
i1 j
180
X甲
X
X乙
X丙
甲
乙
丙
3、组内变异(SS组内,variation within groups)
0.05
2、根据公式计算SS、MS及F值,列于方差分析表内(计 算过程省略)
变异来源 总变异 组间 组内(误差)
完全随机设计的方差分析表
平方和 SS 自由度
均方MS
47758.32
35
31291.67
2
15645.83
16466.65
33
498.99
F值
31.36
3、确定P值,作出判断
分子自由度=k-1=2,分母自由度=n-k=33,查F 界值表(方差分析用)
表 8-1 三种不同喂养方式下大白鼠体重喂养前后差值(g)
正常钙(0.5%) 高剂量钙(1.0%) 高剂量钙(1.5%)
单向方差分析
F 分布曲线
17
F 界值表
5
附表5 F界值表(方差分析用,单侧界值) 上行:P=0.05 下行:P=0.01
分母自由度 υ2
•
分子旳自由度,υ1
1
2
3
4
5
6
161 200 216 225 230 234 1
4052 4999 5403 5625 5764 5859
18.51 19.00 19.16 19.25 19.30 19.33 2
t Yi Yh Se
Yi Yh
,
MS组内(
1 n1
1 n2
)
N a 组内
29
例四个均值旳Bonferroni法比较
设α=α’/c=0.1/6=0.0167,由此t旳临 界值为t(0.0167/2,20)=2.6117
18.5 28.0
t(A: B)
3.48 2.6117, 24 4 20
以F命名,故方差分析 又称 F 检验 (F
test)。用于推断两 个或多种总体均数有 无差别 。
3
方差分析旳优点: 不受比较组数旳限制,可比较多组均数 可同步分析多种原因旳作用 可分析原因间旳交互作用
4
完全随机设计资料(单原因)方差分析 One-way analysis of variance 第一节 方差分析旳基本思想
deviations from mean,SS)反应变异旳大小
10
1. 总变异: 全部测量值之间总
旳变异程度,计算公式
a ni
SS总
Yij Y
2
Y a ni 2 ij
C
i1 j1
i1 j1
N
单向方差分析的名词解释
单向方差分析的名词解释导语:在统计学中,方差分析是一种用于比较两个或多个组之间平均值差异的方法。
单向方差分析是最常用的一种方差分析方法,它可以帮助研究人员确定因素对观察结果的影响程度。
本文将对单向方差分析进行详细解释,包括概念、步骤和统计指标等。
一、概念解释单向方差分析是一种通过比较几个组的平均值来研究因素对观察结果的影响程度的统计方法。
在单向方差分析中,研究人员将参与者分成不同组别,并观察每个组别的观察结果。
通过比较组间的平均值差异,研究人员可以判断因素是否对观察结果产生显著影响。
二、步骤解释1. 设计实验:在进行单向方差分析前,研究人员需要设计一个符合实际情况的实验。
该实验中需要确定一个主要因素,该因素具有多个水平(即不同的组别)。
确保在设计实验时,每一组的成员具有相似的特征,以减少其他因素对实验结果的干扰。
2. 收集数据:在实验开始前,研究人员需要明确观察变量(也称为因变量)的测量方法,并在实验结束后进行数据收集。
同时,还需要记录每个参与者所属的组别信息。
3. 方差分析:在收集到足够的数据后,可以进行方差分析。
方差分析的核心目标是比较各组之间的平均差异是否显著。
通过计算组内变异(即组内平方和)和组间变异(即组间平方和),可以得出总变异。
通过比较组间变异与组内变异的比值(F值),可以判断因素对观察结果的影响是否显著。
4. 解释结果:根据计算得到的F值,研究人员可以通过查询F分布表来确定显著性水平。
如果得到的P值小于预先设定的显著性水平(通常为0.05),则说明因素对观察结果有显著影响;反之,则说明组间差异可能是由随机因素引起的。
三、统计指标解释1. 组间平方和(SSB):它是通过计算每组平均值与整体平均值之差的平方和得到的。
它表示了组间差异的大小。
2. 组内平方和(SSW):它是通过计算每个观察值与所属组别平均值之差的平方和得到的。
它表示了组内差异的大小。
3. 总平方和(SST):它是组间平方和和组内平方和的总和,表示了观察数据的总差异。
单因素方差分析
统计学数学实验报告单因素方差分析单因素方差分析颜俊芳 08房产(1)班学号080272011329摘要统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释数据并从数据中得出结论的方法,统计研究的是来自各个领域的数据。
单因素方差分析也是统计学分析的一种。
单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。
关键字单因素、方差、数据统计方差分析(analysis of variance,ANOVA)就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
当方差分析中之涉及一个分类型自变量时称为单因素方差分析(one-way analysis of variance).单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。
例如要检验汽车市场销售汽车时汽车颜色对销售数据的影响,这里只涉及汽车颜色一个因素,因而属于单因素方差分析。
为了更好的理解单因素方差分析,下面举个例子来具体说明单因素方差所要解决的问题。
从3个总体中各抽取容量不同的样本数据,结果如下表1所示。
检验3个总体的均值之间是否有显著差异(α=0.01)P29210.1样本1 样本2 样本3158 153 169148 142 158161 156 180154 149169如果要进行单因素方差分析时,就需要得到一些相关的数据结构,从而对那些数据结构进行分析,如下表2所示:分析步骤1.提出假设与通常的统计推断问题一样,方差分析的任务也是先根据实际情况提出原假设H0与备择假设H1,然后寻找适当的检验统计量进行假设检验。
本节将借用上面的实例来讨论单因素试验的方差分析问题。
表中的数据可以看成来自s 个不同总体(每个水平对应一个总体)的样本值,将各个总体的均值依次记为,则按题意需检验假设不全相等2. 构造检验的统计量 (1)计算个样本的均值假如从第i 个总体中抽取一个容量为1i 的简单随机样本,令i x 为第i 个总体样本的样本均值,则有in j iji n xx i∑==1其中: k i ,...,2,1=式中,n i为第i 个总体的样本量的第个观测值。
概率论课件_高教版_第八章_方差分析与回归分析
MS A 168.00 F 20.56 MS e 8.17
查附表在f1=3,f2=12时, F0.05=3.49,F0.01=5.95 实得 F> F0.01或 P<0.01,说明药剂处理有统计意义。
四、单因素方差分析模型参数的估计 当方差分析结果为否定原假设时,就需要估计模型的有 关参数 ,下面就讨论方差分析模型参数的估计。 单因素方差分析的模型 为 xij i ij i 1,2, , r 2 ~ N ( 0 , ), 且相互独立 j 1,2, , m ij 其中为总以平均效应, i为因素A的第i个水平Ai 对试验指标 的作用; ij为随机因素对试验指标 值的影响。需要估计的 参数 有 , i , 2。不难证明这些参数的 极大似然估计量为: 1 r m 1 m 1 r m ˆ i xij ˆ xij xij rm i 1 j 1 m j rm i 1 j 1 1 r m 1 2 2 ˆ ˆ) ( xij SSe rm i 1 j 1 rm
Tr
T
xr
x
其中xij是因素A第i水平下第j次重复试验结果 , m r m r T T Ti xij xi T xij Ti x . m rm j 1 i 1 j 1 i 1
单因素方差分析的统计模型
试验数据xij满足 xij i ij i 1,2,, r 2 ~ N ( 0 , ),且相互独立 j 1,2,, m ij 其中为总以平均效应, i为因素A的第i个水平Ai 对试验指 标的作用 ; ij为随机因素对试验指标 值的影响。
鸡重/g-1000
60 80 1 2 12 9 28
Ti
生物统计学杜荣骞第8章答案
第八章单因素方差分析8.1 黄花蒿中所含的青蒿素是当前抗疟首选药物,研究不同播期对黄花蒿种子产量的影响,试验采用完全随机化设计,得到以下结果(kg/小区)[47]:重复播种期2月19日3月9日3月28日4月13日1 0.26 0.14 0.12 0.032 0.49 0.24 0.11 0.023 0.36 0.21 0.15 0.04对上述结果做方差分析。
答:对于方差分析表中各项内容的含义,在“SAS程序及释义”部分已经做了详细解释,这里不再重复。
如果有不明白的地方,请复习“SAS程序及释义”的相关内容。
SAS分析结果指出,不同播种期其产量差异极显著。
多重比较表明,2和3间差异不显著,3和4间差异不显著,1和其他各组间差异都显著。
以上结果可以归纳成下表。
变差来源平方和自由度均方 F P播期间0.185 158 33 3 0.061 719 44 14.99 0.001 2重复间0.032 933 33 8 0.004 116 67总和0.218 091 67 11多重比较:1 2 3 48.2 下表是6种溶液及对照组的雌激素活度鉴定,指标是小鼠子宫重。
对表中的数据做方差分析,若差异是显著的,则需做多重比较。
鼠号溶液种类Ⅰ(ck) ⅡⅢⅣⅤⅥⅦ1 89.9 84.4 64.4 75.2 88.4 56.4 65.62 93.8 116.0 79.8 62.4 90.2 83.2 79.43 88.4 84.0 88.0 62.4 73.2 90.4 65.64 112.6 68.669.4 73.8 87.8 85.670.2答:溶液种类的显著性概率P=0.038 5,P <0.05,不同种类的溶液影响显著。
其中1、2、5、6间差异不显著;2、5、6、3、7、4间差异不显著。
以上结果可以归纳成下表:变差来源平方和自由度均方 F P溶液间 2 419.105 00 6 403.184 17 2.77 0.038 5重复间 3 061.307 50 21 145.776 55总和 5 480.412 50 271(ck) 2 5 6 3 7 48.3 人类绒毛组织培养,通常的方法是,向培养瓶中接入大量组织碎片,加入适当的基质使组织碎片贴壁,经过一段时间,将贴壁的组织块浸入到培养基中。
单向方差分析
单向方差分析
单向方差分析(ANOVA)是统计学中常用的变量比较统计检验方法。
它的主要目的是
检验多个样本的总体均值是否拥有相同的数量程度,如果样本的总体均值不具有相同的数
量程度时,ANOVA 可用来对不同样本的数量程度进行比较。
单向方差分析是由美国统计学家 R.A. Fisher于1920 年提出的。
它通过计算均方差
逐步进行的,用来检验一个独立变量在多个水平上的均值是否一致,如果不一致,再找出
拥有哪些不同的水平。
单向方差分析主要有以下三个步骤:首先,确定每组样本的均值;其次,计算每组样
本的方差;最后,比较各组样本的均值和方差以观察它们是否存在统计学上的显著性差异。
在单向方法分析中,研究者需要指定检定的课题和水平,并且要在设定的课题和水平上,确定研究变量的均值、方差、标准偏差等。
接着,将样例按照水平分别排序,然后比
较各水平的均值、方差、标准偏差以及观察它们之间的差别是否显著。
为了检验分组之间
是否存在显著性差异,可以使用独立抽样 t 测试、F 检验或者卡方检验等。
单向方差分析在科学研究中有广泛的应用,尤其是可以用来比较不同舆论公众、新闻
传播媒介对消息传送效率和影响力的比较测量,乃至还可以用来估计实验组与对照组的差
异程度。
它有助于提高研究的准确性和可靠性,同时也可以提供系统性的证据,用于支持
研究的结论。
研究生医学统计学-单向方差分析课件
在单向方差分析中,我们将数据分为k个组别,每个组别有 n个观测值,通过构建线性模型来描述组间和组内的变异。
模型公式
线性模型的一般形式为 Y=Xβ+ε,其中Y是观测向量,X是 设计矩阵,β是未知参数向量,ε是随机误差向量。
方差分析的统计推断
参数估计
通过最小二乘法对方差分析模 型进行参数估计,得到未知参
其他软件工具
Stata
Stata是一款功能强大的统计软件,可以进行单向方 差分析等统计分析。
SAS
SAS是一款商业统计软件,也支持单向方差分析等统 计分析。
R语言
R语言是一款开源的统计软件,可以通过安装相关包 来进行单向方差分析等统计分析。
感谢您的观看
THANKS
04
单向方差分析的注意事项与 局限性
注意事项
确保数据正态分布
在进行单向方差分析之前,需 要检验数据是否符合正态分布
,以避免统计结果的偏倚。
考虑样本量大小
样本量的大小会影响单向方差 分析的准确性,应确保有足够 的样本量以获得可靠的统计结 果。
控制混杂因素
在实验设计阶段,应尽量控制 混杂因素对实验结果的影响, 以提高单向方差分析的可靠性 。
数β的估计值。
假设检验
利用统计量进行假设检验, 判断各组之间是否存在显著
差异。
统计量计算
常用的统计量包括F统计量和 T统计量,F统计量用于检验 组间效应是否存在显著差异 ,T统计量用于检验各组均值 是否存在显著差异。
方差分析的假设检验
1 2
假设内容
方差分析的假设包括总体正态性、方差齐性和独 立性。
各组数据应符合正态分布,即 数据应呈现常态分布;
总结词单向方差分析的前提假设括 数据独立性、正态分布和方差 齐性。
单向方差分析
2 s nj
s
nj
2
( xij X j )2 ( X j X )2 2 ( xij X j )( X j X )
j 1 i 1 j 1 i 1 j 1 i 1
Proc anova data=fcfx; Class g;
Model x=g;
Run;
2.7 7.8 6.9 1.5 9.4 3.8 7.5 8.4 12.2 6.0
-0.6 5.7 12.8 4.1 -1.8 -0.1 6.3 12.7 9.8 12.6 2.0 5.6 7.0 7.9 4.3 6.4 7.0 5.4 3.1 5.6 9.5 6.0 8.7 9.2 5.0 3.5 5.8 8.0 15.5 11.8 16.3 11.8 14.6 4.9 8.1 3.8 6.1 13.2 16.5 9.2 ;;;;
( s 1, n s) F F 若 ,则p < ,拒绝H0 ( s 1, n s) F F 若 ,则p ≥ ,不拒绝H0
三、方差分析的步骤
1.建立检验假设,确定检验水准 ; H 0 : μ 1 = μ 2 = …= μ s H1:μ1 ,μ2 ,…,μs 不全相等
这两段程序提交运 行后,可得如下结 果:
The ANOVA Procedure Dependent Variable: x Source Model Error Corrected Total DF 2 57 59 Sum of Squares 176.764976 909.871524 1086.636500 Mean Square 88.382488 15.962658 F Value 5.54 Pr > F 0.0063
08第八章统计分析
(二)随机区组实验设计方差分析的基本程序
• 单因素随机区组实验设计的方差分析将由区组产生 的离差平方和从误差离差平方和中分离出来,从而 使总离差平方和被分解为三个部分:处理离差平方 和 S S b 、区组离差平方和 S S r 与误差离差平方和 。
SSeSStSSbSSr
• 自由度分别为:
dfb k 1
dfr a 1
dfe(k1)(a1)
dft N 1
• 均方分别为;
MSb
SSb dfb
SSb k 1
MSr
SSr dfr
SSr a 1
MSe
(k
SSe 1)(a1)
(3)进行F检验:先计算处理均方与误差均方的方差
比:
Fb
M Sb M Se
差一致即方差齐性。否则原则上便不能运用方差分 析方法。
二、单因素完全随机化设计的方差分析
• 单因素完全随机化设计指的是用随机化的方法给处
理指派实验序号和实验对象的实验设计。在实验中
仅有一个实验因素,它分处于 k 个水平(k 2 ),
用随机化的方法将N名被试分为 k 组,每组 n j 个对
象,且
k
nj
一、基本原理
(一)综合虚无假设与部分虚无假设
• 虚无假设应为:各样本组所对应的总体其平均数都相等,一 般我们把这一假设称为“综合虚无假设” 。而组间的虚无假 设相应地就应被称为“部分虚无假设”。检验综合虚无假设 是方差分析的首要任务。如果综合虚无假设被拒绝,就要确 定究竟是哪两个(或哪些)组之间的平均数之间存在显著性 的差异,而这又需要运用事后检验方法来确定。
最新11-第8章 单因素方差分析
11-第8章单因素方差分析仅供学习与交流,如有侵权请联系网站删除 谢谢174+第八章 单因素方差分析第一节 方差分析的基本问题一、方差分析要解决的问题t 检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验;而多个平均数间的差异显著性检验,必须用方差分析法。
1、检验过程繁琐一试验包含5个处理,采用t 检验法要进行25C 10=次两两平均数的差异显著性检验;若有k 个处理,则要作k (k-1)/2次类似的检验。
2、无统一的试验误差,误差估计的精确性和检验的灵敏性低 12X -X s如表8-1,试验有5个处理,每个处理重复6次,共有30个观测值。
进行t 检验时,每次只能利用两个处理共12个观测值估计试验误差,误差自由度为2(6-1)=10;若利用整个试验的30个观测值估计试验误差,显然估计的精确性高,且误差自由度为5(6-1)=25。
可见在用t检法进行检验时,由于估计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。
3、推断的可靠性低,检验的I型错误率大用t检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互比较的两个平均数的秩次问题,因而会增大犯I型错误的概率,降低推断的可靠性。
假设每一对检验接受零假设的概率都是1-α=0.95,而且这些检验都是相互独立的,那么10对检验都接受概率是(0.95)10=0.60,犯错误的概率α׳=1-0.60=0.40犯I型错误的概率明显增加。
由于上述原因,多个平均数的差异显著性检验不宜用t检验,须采用方差分析法。
二、方差分析的几个概念方差分析(analysis of variance)是由英国统计学家R.A.Fisher于1923年提出的。
这种方法是将a个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。
OneWayANOVA单因素方差分析
单因素方差分析的数据形式
X因素的a个不同水平(处理)
每 个 处 理 下 n 个 重 复
xi xij ,
j 1 a n
n
xi
x xij ,
i 1 j 1
1 xi , i 1, 2, , a n 1 x x an
方差分析原理
线性统计模型:
例8.1:小麦株高与品系的关系研究-多重比较
Post Hoc Test
多重比较的SPSS实现
SPSS Duncan’s test output (1)
结果的解读:除品系1、2之间外,其它各品系间均 存在显著差异。
多重比较的SPSS实现
SPSS Duncan’s test output (2)
结果的解读:除品系1、2及3、5之间外,其它各品 系间均存在极显著差异。
i 1
2
1 a 2 x2 xi n i 1 na
减少计算误差 利于编程
x2 C na
C称为校正项。误差平方和 SSe = SST-SSA
例 调查5个不同小麦品系株高,结果见下表:
品 I II III 系 IV V
1
2 3 4
64.6
65.3 64.8 66.0
64.5
逐对进行双样本的平均数差的t-检验? 增大了犯I型错误的概率,不可取
多重比较
多重比较方法:
最小显著差数(LSD)检验 Student-Newman-Keuls(SNK)q检验 Duncan 检验 Dunnett t检验 Tukey 检验 …
多重比较
最小显著差数法(Fisher’s Least significant difference test, LSD)
单因素方差分析解释
所谓单因素方差分析就是在某因素作用下,以该因素为区分依据分别得到几组数据,并从几组数据方差的差异来推断该因素的影响是否存在或显著。
不难看出,方差的差异来源于两方面:一是由某因素引起的组间偏差,二是由实验误差引起的组内偏差.
这张表第一列就给出了方差类别,
第二列给出了组间平方和、组内平方和、总和(就是前两者相加)的具体数值,
第三列表示自由度,可以理解为由平方和计算方差时除的那个值(联想方差计算公式),反映了相互独立的样本数,组间自由度为2 = r — 1 说明共有r = 3 组实验数据,组内自由度为12 = n — r 说明实验总样本数为n = 15,
第四列为均方值,即方差值,是由该行平方和除自由度得到的,
第五列F值是由组间方差除组内方差得到的,反映了组间方差与组内方差的相对大小,若该值很小,说明总方差基本是由误差引起的,也就是说之前提到的那个因素对实验结果没什么影响,若该值较大,则说明有影响。
至于到底多“大”算大这个标准是由显著性水平衡量的,
第六列显著性由显著性水平及自由度决定,一般显著性水平取0。
05,所谓显著性是指零假设为真的情况下拒绝零假设所要承担的风险水平。
而零假设就是假设因素对实验结果没有影响。
这里显著性为0。
855说明有85.5%的概率该因素对实验结果无影响,故零假设成立.。
单向方差分析
主讲教师
田考聪教授
一、问题的提出
先看一个例子: 某医生为研究一种降糖药的疗效,以统一 的纳入标准和排除标准选择了39名II型糖尿病 患者,随机将其分为两组进行双盲临床试验。 其中试验组19人,对照组20人,对照组服用公 认的降糖药物。治疗4周后测得其餐后2小时血 糖的下降值(mmol/L),结果如表1。问治疗4周 后餐后2小时血糖下降值的两组总体水平是否 不同?
H0:μ1=μ2 = …=μs
其备择假设为:
H1:μ 1
,μ2 ,…,μs 不全相等
如何来检验这个假设呢?英国统计学家R.A.Fisher 从方差构成的角度对这个问题进行了探讨,并于1923年 首次给出了如下的平方和分解定理。
二、Fisher的平方和分解
考虑总平方和 (total sum of squares)
由于分子MS组间是由各水平组不同所引起的差异及随机 误差所构成的,而分母MS组内仅由随机误差所构成,故当
F ≈ 1,可以认为各水平组之间的差异不存在,即推断H0成立; F>>1,则认为各水平组之间存在差异,即推断H0不成立。
注意:F 值非负。
至于F 值究竟要大到何种程度才能拒绝原假设,可由F 分布的临界值来确定。通常可以通过查F 分布的界值表来 决定。 对于事先给定的检验水准
但在实际工作中,常常会遇到两个 以上的样本均数的比较,如将上述问题 改为: 某医生为研究一种降糖药的疗效, 以统一的纳入标准和排除标准选择了60 名II型糖尿病患者,随机将其分为三组 进行双盲临床试验。其中高剂量组21人, 低剂量组19人,对照组20人,对照组服 用公认的降糖药物。治疗4周后测得其餐 后2小时血糖的下降值(mmol/L),结果如 表2。问治疗4周后餐后2小时血糖下降值 的三组总体水平是否不同?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
组 内 自 由 度 2 = 4 × ( 6 - 1 ) = 2 0 , 组 内 均 方 MS 组内 =
447.67 = 22.38。 20
22
华中科技大学 同济医学院 宇传华制作, 2004,10
三、计算F值
F=
189.44 = 8.46 22.38
分 子 分 母 自 由 度 分 别 为 : 3, 20
3.组内变异: 在同一处理组内,虽然每
个受试对象接受的处理相同,但测量值仍各不相同,
这种变异称为组内变异,也称SS误差。 用各组内各测量值 Yij 与其所在组的均数差值的 平方和来表示,反映随机误差的影响。计算公式为
SS组内 (Yij Yi )
i 1 j 1
a
ni
2
( ni 1) S
3. 组内变异(within group variation ):每组的 每个测量值Yij与该组均数 Y 的差异
i
下面用离均差平方和(sum of squares of deviations from mean,SS)反映变异的大小
华中科技大学 同济医学院 宇传华制作, 2004,10 8
1. 总变异: 所有测量值之间总
( Yij )
i, j
N
2
N
2.组间变异:各组均数与总均数的
离均差平方和,计算公式为
SS组间 ni (Yi Y )
2 i 1 i 1
a
a
( Yij )
j 1
ni
2
组间 a 1
ni
C
SS组间反映了各组均数 Yi 的变异程度
组间变异=①随机误差+②处理因素效应
i 1
a
2 i
组内 N a
三种“变异”之间的关系
离均差平方和分解:
SS总 = SS组间 + SS组内 ,
且
ν总 =ν组间 +ν组内
组内变异 SS 组内: 随机误差 组间变异 SS 组间:处理因素 + 随机误差
One-Factor ANOVA Partitions of Total Variation
的变异程度,计算公式
SS总 Yij Y Y C
a ni 2 a ni i 1 j 1 i 1 j 1 2 ij
Y C=(N 1) S
2 ij i, j
N
2
总 N 1
2
校正系数: C
( Yij )
i 1 j 1
a ni
N
第八、九、十章 方差分析
Analysis of Variance (ANOVA )
一个因素(水平间独立)——单向方差分析 (第八章) 两个因素(水平间独立或相关)——双向方差分析 (第九章) 一个个体多个测量值——重复测量资料的方差分析 (第十章) 因素也称为处理因素(factor),每一处理因素至少 有两个水平(level)(也称“处理组”)。 用这类资料的样本信息来推断各处理组间多个总体均 数的差别有无统计学意义。
1 5, 2 5
1 10, 2 10
1 2 3 4
16
F 分布曲线
F
F 界值表
5
附表5 F界值表(方差分析用,单侧界值) 上行:P=0.05 下行:P=0.01
分母自由度 υ 2 分子的自由度,υ 1 161 4052 18.51 2 200 4999 19.00 3 216 5403 19.16 4 225 5625 19.25
One-way analysis of variance 第一节 方差分析的基本思想
所有测量值上的总变异按照其变异的来 源分解为多个部份,然后进行比较,评价由 某种因素所引起的变异是否具有统计学意义。
华中科技大学 同济医学院 宇传华制作, 2004,10
3
方差分析的假定条件
1. 正态性
2. 方差齐性
华中科技大学 同济医学院 宇传华制作, 2004,10 5
表 8-1
不 同 解 毒 药 对 应 的 大 白 鼠 血 中 胆 硷 脂 酶 含 量 (μ
/ml)
组 号 i 1 2 3 4 合 计
23 28 14 8 73
胆 硷 脂 酶 含 量 (Yij) 12 31 24 12 79 18 23 17 21 79 16 24 19 19 78 28 28 16 14 86 14 34 22 15 85
568.33 = 189.44 。 3
3 . 组 内 离 均 差 平 方 和 SS 组内 = 1 0 1 6 . 0 - 5 6 8 . 3 3 = 4 4 7 . 6 7 ,
SS 组内 = ( 6 - 1 ) × 5 . 9 9 2 + ( 6 - 1 ) × 4 . 1 5 2 + ( 6 - 1 ) × 3 . 7 8 2 + ( 6 - 1 ) × 4 . 7 1 2
ni
6 6 6 6 24
Y j ij
111 168 11 2 89 480
Yi
18.5 28.0 18.7 14.8 20.0
Yij2 j
2233.0 4790.0 2162.0 1431.0 10616.0
四 种 解 毒 药 的 解 毒 效 果 是 否 相 同 ?
Si 值
S1 5.99
S2 4.15
各处理组样本是相互独立的
相互比较的各处理组样本
随机样本,其总体服从正态分布; 的总体方差相等,即具有方差齐同 (homogeneity of variance)。
上述条件与两均数比较的t检验的应用条件相同。
华中科技大学 同济医学院 宇传华制作, 2004,10 4
例 8-1 一 个 因 素 ( factor) 解 毒 药 : 四 个 水 平 ( level) a=4 个 处 理 组 ) A、 B 、 ( : C 、 空 白 对 照 D, i=1,2,3,4 分 别 代 表 A、 B、 C、 D 每 水 平 有 ni=6 只 大 白 鼠 , 分 别 表 示 为 j=1,2,…,6 应 变 量 用 Yij 表 示 , 即 第 i 组 第 j 号 大 白 鼠 的 血 中 胆 硷 脂 酶 含 量 (μ /ml) 按 完 全 随 机 化 设 计 方 法 将 N = 24 只 动 物 随 机 等 分成4个组 ( 将 动 物 编 成 1~24 号 , 用 计 算 器 ( 机 ) 对 每 一个动物产生一个随机数,然后按随机数从小到 大的顺序排序,前面 6 个动物分为第一组,紧接着的 6 个 动 物 分 成 第 二 组 , …)
Total Variation SST
Variation Due to Treatment SSB Commonly referred to as: Sum of Squares Among, or Sum of Squares Between, or Sum of Squares Model, or Among Groups Variation Variation Due to Random Sampling SSW Commonly referred to as: Sum of Squares Within, or Sum of Squares Error, or Within Groups Variation
a ni
1 . 总 离 均 差 平 方 和 SS 总 =
Yij2 C = 1 0 6 1 6 - ( 4 8 0 ) 2 / 2 4 = 1 0 1 6 . 0 。
i 1 j 1
或 SS 总 = ( 2 4 - 1 ) × 6 . 6 5 2 = 1 0 1 6 . 0 2. 组 间 离 均 差 平 方 和
列 于 方 差 分 析 表 中 (见 表 8-2)。
表 8-2 大 白 鼠血 中 胆硷 酯 酶含 量 方 差分 析表
变异来源 组间 组内 总
SS 568.33 447.67 1016.00
ν 3 20 23
MS 22.38
F
P 0.00079
189.44 8.46
华中科技大学 同济医学院 宇传华制作, 2004,10
华中科技大学 同济医学院 宇传华制作, 2004,10 1
ANOVA 由英国统 计学家R.A.Fisher首 创,为纪念Fisher, 以F命名,故方差分析 又称 F 检验 (F test)。用于推断多 个总体均数有无差异
华中科技大学 同济医学院 宇传华制作, 2004,10
2
第八章 单向方差分析
华中科技大学 同济医学院 宇传华制作, 2004,10
20
一、 建立检验假设
H0: 1 2 3 4 即4个试验组总体均数相等 H1:4个试验组总体均数不全相等 检验水准 0.05
华中科技大学 同济医学院 宇传华制作, 2004,10 21
二、 计算离均差平方、自由度、均方
a
总 自 由 度 总 = 2 4 - 1 = 2 3 。
SS组间
i 1
(
Y )
ij j 1
ni
2
ni
116 2 168 2 112 2 89 2 C 6 6 6 6
480 2 568.33 。 24
组 间 自 由 度 1 = 4 - 1 = 3 , 组 间 均 方 MS 组间 =
MS组间
SS组间
组间
MS组内
SS组内
组内
二、F 值与F分布
,
1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0 0
f ( F)
1 1, 2 5
1 1 2 1 / 2 2 / 2 2 1 F 1 2 2 f (F ) 1 2 1 2 ( 1 F 2 ) 2 2 2