研究生统计学讲义第5讲第5章方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第5章 方差分析 analysis of variance,ANOVA 方差分析目的是利用变异的关系来判别多组资料
的总体平均值是否有差别。基本思想是:先假设(H0 )各总体均数全相等;将总变异SS总,按设计和资料 分析的需要分为两个或多个组成部分,其自由度也相 应地分为几个部分,以随机误差为基础,按F分布的 规律作统计推断。
H0:μ1=μ2=μ3=μ4,F=MS组间 / MS组内 >1
F 要大于1 多少才有统计意义呢?可查F 界值表( 见附表6)得 P 值,按 P 值的大小作出推断结论。
2.方差分析的应用条件
(1) 各样本是相互独立的随机样本。
(2) 正态性(normality),各样本来自正态分布总体。方 差分析的这一应用条件是对样本含量较小时的资料而言 ,对于样本含量较大的资料来说,则样本不论来自什么 总体,方差分析都是强有力的分析方法。因为当各组的 样本含量较大时,样本均数近似正态分布。
对照 组
14
10
12
16
13
14
10
13
9
淫羊 藿组 35 27 33 29 31 40 35 30 28 36
党参 组
21
24
18
17
22
19
18
23
20
18
黄芪 组
24
20
22
18
17
பைடு நூலகம்
21
18
22
19
23
本例属于完全随机设计资料,从表5-1资料可以看到 三种性质不同的变异(用离均差平方和表示变异):
k
SS组间 n j ( X i X 总) j 1
同样,组间变异SS组间的大小还与其自由度df组间(df组间 =k-1)有关,所以计算组间方差,称为组间均方(between groups mean square,记为MS组间),
MS组间=SS组间 /df组间= SS组间 k 1
SS总=SS组间+SS组内,且df总=df组间 + df组内
1. 方差分析的分析思路是将全部观察值之间的变异 即总变异 (SS总)按设计和资料以及分析需要分为两个 组成部分,以随机误差为基础,计算F值,按F分布 的规律作统计推断。
下面我们以完全随机设计资料为例,进一步说明方 差分析的基本思想。
例5.1 研究单味中药对小白鼠细胞免疫机能的影响, 把39只小白鼠随机分为四组,雌雄尽量各半,用药15 天后,进行E-玫瑰花结形成率(E-SFC)测定,结果 如表
(1) 总变异(total variation):
k nj
SS总
( X ij X 总 )2
j1 i 1
显然SS总 还与总例数N(=∑nj)的多少有关,确切地说 与总的自由度df总(df总=N-1)有关。 (2) 组内变异(within group variation):四个样本组各组 内部E-SFE值也大小不等,这种变异称为组内变异。它 反映了E-SFC的随机误差(包括个体差异以及观测误差), 其大小可用四样本内部每个观察值 xij 与自已所在样本
查附表6,界值F0.01(3,5) =12.1,df1=3,df2=5时, P (F >12.1) =0.01,P (F <12.1) = 0.99
查附表6, F0.01(3,5) =12.1 , df1=3 , df2=5时 , P (F >12.1) =0.01 , P (F <12.1) = 0.99 ; 查附表6 ,F0.025(7,2) = 39.36, df1=7,df2= 2时,P(F >39.36) = 0.025 , P (F <39.36) =0.975。
,记为MS组内,MS组内=SS组内 / df组内=[Σ(nj -1)sj2 ]/ (Σnj -k)。
(3) 组间变异(between groups variation):四组间E-SFC
值的样本均数 x j 也大小不等,这种变异称为组间变异,
它反映了不同处理(中药)的影响,也包括了随机误差。 其大小可用各组均数分别与总均数之差的平方和(记为 SS组间)来表示,
因一般都按组成统计量F的分子大于分母计算F值。 所以附表6中 F 界值都大于1。方便方差分析时用。
F分布具有倒数性质:
1 F1 (df 1,df 2) F (df2 ,df1 )
例如,查附表6,F0.05(2,5) =5.7861,F 界值表中没有 列出F0.95(5,2) ,利用F分布的倒数性质可得F0.95(5,2) =1/F0.05(2,5) =1/5.7861 = 0.1728 。
(3) 各比较组总体方差相等(σ12=σ22=…=σk2),称为方差 齐性(homogeneity of variance)。方差分析的这一应 用条件主要是对完全随机设计资料而言,注意:无重 复数据的方差分析,如配伍设计、交叉设计、正交设 计的方差分析,因每个单元格子中只有一个观察数据 ,不需考虑正态性和方差齐性的要求。
3.方差分析的优点 方差分析的优点有:① 不受对比的 组数之限制;② 可同时分析多个因素的作用;③ 可分 析因素间的交互作用。
组均数 x j 之差的平方和(记为SS组内)来表示,
k nj
SS组内
( X ij X j )2
(n j
1) S
2 j
j1 i 1
显然SS组内的大小还与各样本例数 nj 的多少有关, 确切地说与自由度df组内(df组内=Σnj - k)有关,所以计算 组内方差,称为组内均方(within group mean square
预备知识
方差分析首先要进行F 检验,统计量为F,我们先 介绍其统计量的分布─F分布。
定义:如果随机变量X1、X2分别服从自由度为df1 ,df2的2分布,则称随机变量
F X1 / df1 X2 / df2
服从自由度为df1, df2的F分布(Fdistribution)。
F0.05(5 ,10) =3.33, P (F >3.33) = 0.05;P (F<3.33) = 0.95;
下面的性质是F分布用于方差分析和两样本比较时 的方差齐性检验的重要依据:
如果分别从两个正态总体N(μ1,σ1)和N(μ2,σ2)中,随机
抽取样本含量为n1,n
的两个样本,算出样本均数和
2
方差分别为 ,xs211和 ,xs222,则统计量
F
s12
/
2 1
s22
/
2 2
(5.2)
服从自由度为df1 = n1-1,df2 = n2-1的F分布。 第二节 方差分析的思路
相关文档
最新文档