L2-第九章 方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总 N 1 24 1 23
SS处理 ni X i X X i ni C
2 2 i
550.012 537.30 2 618.19 2 726.282 246398.0820 6 6 6 6 3742.5521
在实际运用中,往往将上述过程总结为如下的方差分析
表。
二、方差分析的应用条件 进行方差分析时,数据应满足以下两个应用条件: 1. 各样本是相互独立的随机样本,均服从正态分布。 当样本含量较小时,资料是否来自正态分布的总体难 于进行直观判断和检验,常常根据过去的经验;当样 本含量较大时,无论资料是否来自正态分布总体,数
变异、区组的变异和随机误差三个部分。
数理统计可以证明它们有如下的数量关系。
SS总 SS处理 SS区组 SS误差
总 处理 区组 误差
具体计算公式见下表:
二、随机区组设计资料方差分析的基本步骤 随机区组设计资料的方差分析步骤概括如下: ①. 建立假设 对于处理组 H0:4个总体均数全相等 H1:4个总体均数不等或不全相等 对于区组 H0:6个总体均数全相等 H1:6个总体均数不等或不全相等
bk个格子中,每个格子仅有一个数据Xij(i=1,2,3,,k; j=1,2,3,,b), 而无重复,因此其方差分析属无重复数据 的双向(因素)方差分析(two-way ANOVA)。
一、离均差平方和与自由度的分解 从该例数据表可以看出,随机区组设计资料的总变异 可以分解为:除处理的变异、随机误差外,还可分离 出区组变异。 区组变异 为6个不同窝别家兔血糖浓度值的样本均数
X j 各不相同,即 X j 与总均数 X 的不同。它既包含6个
区组的差异,也包含随机误差,其大小可用区组均方
MS区组来描述。
SS区组 k X j X
2 j
X n C
2 j j
SS区组 MS区组 区组
区组 b 1,b表示区组数
随机区组设计方差分析的总变异可以分解为:处理的
实际上只要各组样本含量ni相等或近似,即使方差不
齐,方差分析仍然稳健且检验效能较高或最高。
第二节 完全随机设计资料的方差分析
完全设计随机是将同质的受试对象随机地分配到各处理
组。各组样本含量可以相等,也可以不等。完全随机设
计是最常用的研究单因素两水平或多水平的实验设计方 法。完全随机设计资料的方差分析用于成组设计多个样 本均数的比较, 属单向(因素)方差分析(one-way ANOVA), 它将数据按一个方向(即同一处理的不同水平或不同处理)
②. 确定检验水准 =0.05
③. 计算F统计量
可根据表9-5所列公式进行相应的计算。
C X
2
N (2431.78) 2 24 246398.0820
2
SS总 X ij X X 2 C
i j
253894.1596 246398.0820 7496.0776
组内 N k 36 3 33
MS组内 SS组内
组内
20.0381 0.6072 33
F
MS组间 MS组内
26.0629 42.9231 0.6072
④ 确定P值 在附表4 F界值表中,纵标目为分子自由度v1,横标 目为分母的自由度v2,表中给出了=0.01和 =0.05时供 方差分析用的单尾F界值,用Fa(v ,v )表示。
如果三个总体均数相等,F的数值不会太大,从理论上讲
此F=1,但由于抽样误差的影响F1。相反,如不同处理 组的处理效应不同,即三个总体均数不全同时,MS组间 MS组内,F1。但F值要大到多少才有统计学意义?就需 要查F界值表得到相应的P值,然后根据检验水准做出
推断结论。
方差分析的理论和方法最早是由英国统计学家R.A. Fisher创立的,为尊重Fisher,后人将上述统计量的分布 以其名字的首字母命名为F分布,故方差分析又称为F检 验(F test)。
C X
2
N (206.38) 2 36 1183.1307
2
SS总 X ij X X 2 C
i j
1255.2946 1183.1307 72.1639
SS组间 ni X i X X i ni C
能否用两样本t检验进行两两比较?
第一节 方差分析的基本思想和应用条件
一、方差分析的基本思想 方差分析的基本思想就是把全部观察值间的变异—总
变异,按设计和需要分解成两个或多个组成部分,然
后将各部分的变异与随机误差进行比较,以判断各部 分的变异是否具有统计学意义。 前面已经学过,变异度的大小可以用标准差或方差来 衡量。方差分析就是用方差来衡量,只不过将方差的
分子离均差平方和SS及分母自由度v 分开,分别来考虑。
从表9-1的数据Xij(表示第i组的第j个观察值,简记为X)可
以看到以下三种变异。
1. 总变异
36只大鼠喂养1周后测得的红细胞数Xij大小各不相同,
与它们的总均数 X 也不相同,这种变异称为总变异。该 变异包括了随机误差(即大鼠喂养1周后红细胞数的个体 差异和测量误差),又包括了三种不同饲料(即处理因素) 的效应。总变异的大小用所有数据(N=36)的均方 MS总来 描述。
相等,对立假设为:总体均数不等或不全等。在本例, 若三种不同饲料的处理效应相同,则组间变异和组内变 异一样,只反映随机误差的作用大小。如果此时无抽样 误差,则MS组间=MS组内。
可以证明,当零假设成立时,比值MS组间/MS组内服从自由
度为v1和v2的F分布。
F
MS组间 MS组内
v1 v组间 k 1, v2 v组内 N k
进行分组整理。
例9.1就是一个完全随机设计的例子,即将同质的受试对 象随机地分配到各处理组,再观察其实验效应。
完全随机设计资料方差分析的基本步骤
现以例9-1的资料说明方差分析的基本步骤: ①. 建立假设
H0:三个总体均数全相等,即1=2=3
H1:三个总体均数不等或不全相等 ②. 确定检验水准 =0.05 ③. 计算F 统计量 可根据表9-2所列公式进行相应的计算。
处理 k 1 4 1 3
MS处理 SS处理
处理
3742.5521 1247.5174 3
SS区组 n j X j X X j n j C
2 2 j
367.422 434.67 2 412.812 246398.0820 4 4 4 1491.2744
SS总 X ij X
i j
2
MS总
SS总
总
总 N 1
N ni
2. 组间变异 三种(k=3)不同的饲料喂养后,大鼠的红细胞均数 X i 各不 相同, 它与总均数 X 也不相同,这种变异称为组间变异。 它反映了三种不同饲料的影响(如处理因素确实有作用),
同时也包括了随机误差(含大鼠个体差异和测量误差)。组
区组 b 1 6 1 5
MS区组 SS区组
区组
1491.2744 298.2549 5
SS误差 SS总 SS处理 SS区组 7496.0776 3742.5521 1491.2744 2262.2511 v误差 v总 v处理 v区组 23 3 5 15 MS误差 SS误差 2262.2511 150.8167 v误差 15
2 2 i
52.532 66.232 87.62 2 1183.1307 12 12 12 52.1258
组间 k 1 3 1 2
MS组间 SS组间
组间
52.1258 26.0629 2
SS组内 SS总 SS组间 72.1639 52.1258 20.0381
第九章 方差分析
1
方差分析(Analysis of variance, ANOVA)由英国统计学
家R.A.Fisher提出,又称F检验,是通过对数据变异的
分解来推断不同样本所代表的总体均数是否相同,用
于比较两个或两个以上均数的比较。本章的方差分析 主要用来比较多个均数。
学习要求
掌握内容
间变异大小可用组间均方MS组间来描述。
SS组间 ni X i X
2 i
X n C
2 i i
MS组间
SS组间
组间
组间 1 k 1,k 表示处理组数
3. 组内变异
各组内大鼠红细胞数Xij大小各不相同,与其本组的样本 均数 X i也不相同,这种变异称为组内变异。组内变异反 映了随机变异(含个体差异和测量误差),故又称随机误差。 组内变异大小可用组内均方MS组内来描述。
随机区组设计又称配伍组设计,通常是将受试对象按
性质(如动物的窝别、性别、体重等非实验因素)相同或 相近者组成b个区组(又称配伍组),再将每个区组中的 受试对象随机地分配到k个处理组中去。随机区组设计
的方差分析属无重复数据的两因素方差分析(two-way
ANOVA)。
例9-2 利用随机区组设计研究不同温度对家兔血糖浓度
SS组内 X ij X i
i j
2
MS组内
SS组内
组内
组内 2 N k
数理统计可以证明: SS总 SS组间 SS组内
总 N 1 (k 1) ( N k ) 组间 组内
方差分析的零假设为H0: 1=2==k ,即所有总体均数
1 2
本例:v1=3-1=2,v2=36-3=33。查附表4,得P<0.01。 ⑤ 作出统计推断结论
因为P<0.01,所以按 =0.05水准,拒绝H0,接受H1,
差异有统计学上显著意义。可以认为喂养三种不同饲料
的大鼠红细胞数的总体均数不同或不全相同。
通常,将结果列成如下方差分析表。 表 例9-3的方差分析表
的影响,某研究者进行了如下实验:将24只家兔按窝别
配成6个区组,每组4只,分别随机分配到温度为150C、 200C、250C、300C的4个处理组中,测量家兔的血糖浓
度值(mmol/L),结果如表9.4,分析4种温度下测量家兔
的血糖浓Байду номын сангаас值是否不同?
从该例可以看出,随机区组设计将数据按区组和处理
组两个方向进行分组,在b个区组和k个处理组构成的
熟悉内容
方差分析基本思想 方差分析的应用条件
多个样本均数的两两 比较
完全随机设计、随机 区组设计资料的方差 分析的基本步骤
了解内容
多组资料的方差齐性 检验。
例9-1 为研究大豆对缺铁性贫血的恢复作用,某研究者进
行了如下实验:选取已做成贫血模型的大鼠36只,随机等
分为3组,每组12只,分别用三种不同的饲料喂养:不含 大豆的普通饲料、含10%大豆饲料和含15%大豆饲料。喂 养一周后,测定大鼠红细胞数(×1012/L),试分析喂养三 种不同饲料的大鼠贫血恢复情况是否不同?
理统计的中心极限定理均保证了样本均数的分布仍然
服从或近似服从正态分布,此时的方差分析是稳健的。 但如果总体极度偏离正态,则需作数据变换,改善其 正态性。
2. 各样本的总体方差相等,即方差齐性 对方差齐性检验的判断常用方差齐性检验的方法,检 验多个样本所代表的总体方差是否相等常采用Levene 检验。
MS处理 1247.5174 F 8.2717 MS误差 150.8167 MS区组 298.2549 F 1.9776 MS误差 150.8167
方差分析与t检验的异同点
相同点
要求各样本是独立的;
要求各样本来自正态总体; 要求各个总体方差相等; 两个独立样本均数比较时,同一资料的方差分析和t检 验完全等价,且F=t2。
不同点
t检验仅用于两组资料的比较,可进行单、双侧检验;
方差分析可用于两组或两组以上的均数比较。
第三节 随机区组设计资料的方差分析