第十七章___方差分析(F检验)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概述
方差分析——变异数分析(analysis of variance)与t 检
验Fra Baidu bibliotek样,都属于参数统计.
(参数统计——由样本指标估计总体指标。)
与t检验的差别:
t 检验-----适用于两组试验计量资料处理.
方差分析-----适用于多组资料样本均数比较
第一节 方差分析的原理、条件及应用
方差——均方差——离均差平方和/自由度,用MS表示 MS(方差):是标准差的平方 标准差S= ( x x )2
(22.6-21.49)2+……+(21.2-21.49)2=30.8
(19.1-19.91)2+……+(21.2-19.91)2=59.9 (18.9-16.49)2+……+(19.6-16.49)2=31.6 (19.0-16.16)2+……+(14.8-16.16)2=24.3
夏季= ( X 2 j X 2 ) 2 =
21.9 21.5 21.2
15.2
18.4 20.1 21.2
16.6
14.2 16.7 19.6
13.1
16.9 16.2 14.8
Xij
i
171.9
8 21.49 3724.5
159.3
8 19.91 3231.95
131.9
8 16.49 2206.27
129.3
8 16.16 2114.11
SS组间指各季节氯化物含量的均数( X ) i 与总均数( X ) 的平方和
SS组间=
n (x i X )
i i
2
(ni为每组有n个观察值)
本例SS组内=8(21.49-18.51)2+8(19.91-18.51)2+8(16.49-
18.51)2+8(16.61-18.51)2=163.5
129.3
8 16.16 2114.11
592.4
32 18.51 11276.84
(∑X)
(N)
(X )
_
ni
X
i
Xi
2
ij
(∑X2)
分析上表结果有三个变异 1 总变异 32次测定湖水氯化物含量不尽相同。 原因是:①季节影响;
②误差作用(个体差异) 2 组内变异 同一季节中8次测定值不尽相同。 原因:不是由于季节影响,是由于误差(个体因素造 成) 3 组间变异 各季节湖水氯化物含量均数不尽相同。 原因 : 季节对湖水氯化物含量影响,也包括误差。
2 求组内变异的离均差平方和(SS组内)及均 方(MS组内)
SS组内指每个季节内部各观察值与每组均数 ( X i)之差的平方和
SS组内 ( Xij X i)
i j
2
春 21.49
夏 19.91
秋 16.49
冬 16.16
春季 = ( X 1 j X 1 ) 2 =
j
592.4
32 18.51 11276.84
(∑X)
(N)
( X )
_
ni
X
i
Xi
2
ij
(∑X2)
方差分析的统计量为F值(均方比)
F=MS(组间) / MS误差(组内) (单因素方差分析)
误差的均方(组内均方)——个体差异
处理因素的均方(组间均方)——处理因素+个体因素
○若处理因素有作用,则组间均方应大于组内均方. 即MS组间>MS误差, F=MS组间/MS组内>1 ○若处理因素不起作用,各样本均来自同一整体. 即MS组间≈MS误差, 则 F=MS组间/MS组内≈1 F值是方差分析的统计量,可查F界值表,求得F值,按所 取检验水平作统计判断.
组内
SS总-SS组 N-k
间
SS
本例方差分析表
变异来源 总变异 组间 组内 SS 310.0 163.5 146.5 自由度υ 31 3 28 54.5 5.2 10.48 MS F值
5 确定P值
依椐组间自由度 υ1=3 组内自由度 υ2=28 查F界值表 0.01水平 F(3,28)=4.59 本例F=10.48> F(0.01) 故P<0.01 判断结果 拒绝H0, 接受H1 结论:不同季节湖水氯化物含量的均数差别 有高度显著性(P<0.01)
n 1
标准差S2 =SS 即离均差平方和
( x x )2 n 1
MS
MS 表示变异程度 MS大------变异大
MS小-------变异小
一 方差分析的原理
将全部观察值的变异(总变异)按设计需要分为两 个或多个组成部分,然后按变异来源进行分析. 总变异分为: ①处理因素(变异的一个来源)——MS组间 即一个处理因素是一个变异来源,两个或多个 处理因素是变异的两个或多个来源. ②误差(个体变异)——即余下的变异------MS组内
(三)分析步骤
求SS(总变异)
求SS组间
、 MS组间
求SS组内 、 MS组内
1 求总变异的离均差平方和(SS总)
SS总 ( xij X )
i j _ 2
Xij表示第i组第j个观察值。 求32个观察值中每一观察值与总均数之差的平方 和。 总均数SS总=(22.6-18.51)2+ (22.8-18.51)2+……(16.2-18.51)2+ (14.8-18.51)2=310.0
内插法:
由 F0.01(3,20)=4.94
F0.01(3,30)=4.51 求F0.01(3,28) F0.01(3,28)=4.94-(28-20)/(30-20)×(4.94-4.51)=4.59
结论:不同季节的湖水氯化物含量不同。 注:因上述过程易理解,但计算繁杂, 实际工作中用下列简化方法。
#### #### #### ####
Ⅳ
三 方差分析的条件
1 独立性 各随机样本相互独立。 2 随机性 各样本均是随机样本。 3 正态性 各样本均来自正态分布的整体。 (各因素每一水平的重复数椐均服从正态分 布。)
4 一致性 各处理组总体方差相等。
四 方差分析的基本思想
(一)方差分析的基本思想 1 从总变异中分出组间和组内变异,并用数量表 示变异程度。 2 将组间变异和组内变异进行比较,如两者差 别不大,说明处理因素影响不大,如两者相 差较大,且组间变异比组内变异大得多,说 明处理因素影响为主。
○例 如观察四种降脂药对4组动物动脉粥样硬化斑块 的影响,比较不同药物对动脉粥样硬化形成大小有 否影响。 处理 配伍
按体 重高 低分 为四 组 Ⅰ Ⅱ Ⅲ
A(安妥明)
B(降脂甲方)
C(降脂乙方)
D(降脂丙方)
#### #### #### ####
#### #### #### ####
#### #### #### ####
两因素:既按治疗前后不同时间,又按不同
患者的病程或年龄分组,叫两因素分析。
例:针刺降压观察,将高血压分为三期(Ⅰ、Ⅱ、 Ⅲ),观察不同药物(A药、B药、C药、D药) 对血压影响: (药A) Ⅰ Ⅱ Ⅲ (药B) 血压值 (药C) (药D)
由此分析药物对哪一期高血压降效应最好,且反映出什么 药物降压效果最明显。
j
秋季= 冬季=
( X 3 j X 3 ) 2=
j
_
(X
j
4j
X 4 )2
=
本例SS组内=30.8+59.9+31.6+24.3=146.6
组内均方MS组内=
SS组内 / N k ( 自由度)
=146.6/32-4=5.2 N为测定值总个数, k为组数.
3 组间变异的离均差平方和(SS组间)及均方(MS组间)
二 方差分析的应用
1 两个或多个样本均数的比较(多个样本均数差 别的显著性检验) 2 回归方程的假说检验. 3 方差齐性检验。
4 分析两因素或多因素、多水平有交互作用资 料的分析。
关于单因素与两因素方差分析
单因素:如果将研究的季节、病种、时间等
称为“因素”,仅按不同季节、不同病种、
不同药物或治疗时间分组称单因素分组。
(1)求校正值(C)
C= N =(592.4)2/32=10966.8
( X )2
(2) 求总变异的离均差平方和(SS总)
SS总=∑X2-C=11276.8-10966.8=310
(3)求组间变异的离均差平方和
SS组间= i SS组间=
( Xij) 2
i
ni
( Xij ) 2
-C
(各组样本含量不等)
注 MS组间>MS组内 如果MS组间<MS组内.那么季节影响不值注意.
5 确定自由度
υ(分子) 组间自由度υ1=k-1=4-1=3
υ(分母) 组内自由度υ2=N-k=32-4=28
6 确定P值
查附表 F值表 F0.01(3,28)=4.59 本例F=10.48> F0.01(3,28) 故P<0.01 **本例需用内插法求
(二)变异分析
○例:欲分析不同季节对湖水氯化物含量的影响, 某年度某湖不同季节湖水氯化物含量测定结 果如下,试比较不同季节湖水氯化物含量差别 有无显著性?
下表为:不同季节湖水氯化物含量(ng/L)
春
22.6 22.8 21.0 16.9
夏
19.1 22.8 24.5 18.0
秋
18.9 13.6 17.2 15.1
第十七章 方差分析(F检验)
总 结 单因素多组样本均数方差分析基本思路
(1)从总变异中分出组间变异和组内变异。 (2)将组间变异和组内变异进行比较,若组间变异 大于组内变异,且超过一定界值范围,可认为多组样 本均数的差异是由处理因素造成的,若两者差异不大, 或组间变异小于组内变异,可认为多组样本均数的差 异是由抽样误差造成的,处理因素不起多大作用。 (3)F检验只能说明4组总的有无差别,欲知每两 组之间差别用q检验. (4)方差不齐时,用变量变换成正态后再作F检验.
例:欲分析不同季节对湖水氯化物含量的影响,
某年度某湖不同季节湖水氯化物含量测定结果
如下,试比较不同季节湖水氯化物含量差别有
无显著性?
春
22.6 22.8 21.0 16.9
夏
19.1 22.8 24.5 18.0
秋
18.9 13.6 17.2 15.1
冬
19.0 16.9 17.6 14.8
24.0
分析 如处理无作用(季节无影响),则各样本均数来自同一个整体 即 组内、组间方差都是总体方差的估计值. MS组内≈MS组间≈σ2(总体均方) 均方比 F=MS组间/MS组内≈1 认为多组样本均数差异是抽样误差所致。 如处理有作用(季节有作用)则各均数不取自同一整体. MS组间≠MS组内 且MS组间受两因素影响(个体变异+处理因素) MS组间>MS组内 F值>1 认为多组样本差异是由处理因素所致。 方差分析也称F检验. F值=均方比。 F值是方差分析的统计量,可查F界植表,得到P值,按所取检验水准 作统计判断。
冬
19.0 16.9 17.6 14.8
24.0
21.9 21.5 21.2
15.2
18.4 20.1 21.2
16.6
14.2 16.7 19.6
13.1
16.9 16.2 14.8
Xij
i
171.9
8 21.49 3724.5
159.3
8 19.91 3231.95
131.9
8 16.49 2206.27
五 简化方法计算步骤
1 检验假说
H0 各季节的湖水氯化物含量的均数相等 μ1=μ2=μ3=μ4 H1:各总体均数不等或不全等。
α=0.05
2 列计算表(前表的下半部分)
分别算出各季节的 Xi j
i
ni
Xi
_
2 x ij i
及这四个值的合计项 ∑X n
X
X
2
3 计算离均差平方和(SS)
或 SS组内=∑(ni-1)Si2=∑SSi
4 列方差分析表
变异来源 SS 自由度 MS F值
总变异
∑X2-C
N-1
组间
i -C n
j i
( xij) 2
j
( xij) 2 ni
k-1
i
SS组间 SS 组间 k 1 k 1
组间 SS组内 N N kk
MS组间 MS组间 MS组内
MS组内
MS组内=SS组内/k-1 (组数-1) =163.5/4-1=54.5
由以上结果看出: SS总=SS组间+SS组内 =146.6+163.5=310.1
将上式移项
SS组内=SS总-SS组间
算出SS总及SS组间,可求出SS组内
以后计算可简化.
4 计算F值
F=MS组间/MS组内=54.5/5.2=10.48
i
ni
C (各组样本含量相等)
本例各组样本含量相等.故 SS组间=
(171.9) 2 (159.3) 2 (131.9) 2 (129.3) 2 8
10966 .8
=11130.3-10966.8=163.5
(4) 求组内变异的离均差平方和(SS组内)
SS组内=SS总-SS组间=310-163.5=146.5