武汉大学数理统计ppt 6方差分析
合集下载
06 方差分析 ppt课件
(2)计算检验统计量F值。
一、方差分析的基本思想
表2 单因素方差分析表
变异来源 SS v MS
F
P
组间
2384.03 2 1192.01
组内 总
5497.84 27 203.62 5.8540 <0.01 7811.87 29
(3)确定P值和作出统计推断:
P<0.01,拒绝原假设,接受备择假设,可认 为三种人群的载脂蛋白不同。
一、方差分析的基本思想
表1 三组人群的载脂蛋白(mg/dL)
糖尿病人
85.7 105.2 109.5 96.0 115.2 95.3 110.0 100.0 125.6 111.0 106.5 n 11
X 105.45
IGT异常者
96.0 124.5 105.1 76.4 95.3 110.0 95.2 99.0 120.0
39.8
46.2
一、方差分析的基本思想
1、概念:方差分析是一种以F值为统计 量的计量资料的假设检验方法。 它把离均差平方和与自由度分 解成至少两部分,而有一个部 分是表示抽样误差大小的。
一、方差分析的基本思想
2. 目的:推断两组或多组资料的总体 均数是否相同或检验两个或多 个样本均数的差异是否有显著 性。
一、方差分析的基本思想
3、方差分析的基本思想:根据变异的不同来源 将全部观察值总的离均差平方和与自由度分 解为两个或多个部分,除随机误差外,其余 每个部分的变异可由某个因素的作用(或某 几个因素的交互作用)加以解释,通过比较 不同变异来源的均方,借助F分布作出统计推 断,从而了解该因素对观测指标有无影响。
k ni
k
k ni
表3 不同营养素组小白鼠增加体重(g)
一、方差分析的基本思想
表2 单因素方差分析表
变异来源 SS v MS
F
P
组间
2384.03 2 1192.01
组内 总
5497.84 27 203.62 5.8540 <0.01 7811.87 29
(3)确定P值和作出统计推断:
P<0.01,拒绝原假设,接受备择假设,可认 为三种人群的载脂蛋白不同。
一、方差分析的基本思想
表1 三组人群的载脂蛋白(mg/dL)
糖尿病人
85.7 105.2 109.5 96.0 115.2 95.3 110.0 100.0 125.6 111.0 106.5 n 11
X 105.45
IGT异常者
96.0 124.5 105.1 76.4 95.3 110.0 95.2 99.0 120.0
39.8
46.2
一、方差分析的基本思想
1、概念:方差分析是一种以F值为统计 量的计量资料的假设检验方法。 它把离均差平方和与自由度分 解成至少两部分,而有一个部 分是表示抽样误差大小的。
一、方差分析的基本思想
2. 目的:推断两组或多组资料的总体 均数是否相同或检验两个或多 个样本均数的差异是否有显著 性。
一、方差分析的基本思想
3、方差分析的基本思想:根据变异的不同来源 将全部观察值总的离均差平方和与自由度分 解为两个或多个部分,除随机误差外,其余 每个部分的变异可由某个因素的作用(或某 几个因素的交互作用)加以解释,通过比较 不同变异来源的均方,借助F分布作出统计推 断,从而了解该因素对观测指标有无影响。
k ni
k
k ni
表3 不同营养素组小白鼠增加体重(g)
方差分析法PPT课件
计算各样本平均数 y 如i 下:
表 6-2
型号
ABCDE F
yi
9.4 5.5 7.9 5.4 7.5 8.8
•5
引言 方差分析的基本概念和原理
两个总体平均值比较的检验法 把样本平均数两两组成对:
y 1与 y ,2 与y 1 ,…y 3 与 y ,1 与y 6 ,…y ,2 与y 3 ,共有y (5
6.3 显著性检验
利用(6-17)式来检验原假设H0是否成立.对于给定的显著水
平,可以从F分布表查出临界值
A的值.
F(k1,k(再m根1)据),样本观测值算出F
当 FAF(k1,时k(m ,拒1绝))H0,
当 FAF(k1,,时k(m ,接1 受))H0。
即:如果H0成立,F应等于1;相反应大于1,而且因素的影响越大, F值也越大
m
km
T Tj Yij
•38
j1
作统计假设:6种型号的生产线平均维修时数无显 著差异,即
H0: i=0(i=1,2,…,6),H1:i不全为零
•37
6.3 显著性检验
计算SA及SE
k
SA
k
m
i1
(Yi
Y)2
Ti2
i1
m
T2 km
k
km
km
Ti2
SE i1
(Yij Yi)2
j1
i1
j1Yij2i1m
m
Ti Yij
j 1
相当于检验假设
H0 : i 0 (i=1,2,…,k) , H1 : αi不全为零
•29
6.3 显著性检验
可以证明当H0为真时,
ST
2
~2(k
统计学第6章方差分析精品PPT课件
量 MSA,服从自由度为 r 1 的卡方分布;组内估计量 MSE ,服从自由度为 nT r 的卡方分布。
于是,当原假设为真时,可得服从 F 分布的统计量, 其分子自由度为 r 1,分母自由度为 nT r 。此 F 统计
量可充当检验统计量: F MSA MSE
★ 6.2.2 方差分析基本步骤
:
2 1
2 2
2 r
H1
:
2 1
,
2 2
,,
2 r
不尽相等
Bartlett 方差齐性检验统计量是自由为 r 1的 2 统计量:
2
r j 1
nj
1 ln
sc2
s
s j
给定显著性水平
,检验中的拒绝准则为:
2
2
。应当注意,
Bartlett 检验结果只在样本数据具有正态性时有效。
6.3 方差相等性检验
种方法,称为最小显著性差异法,简称 LSD。LSD 的检验假设为:
H0 : i j H1 : i j
这里是针对问题中所涉及的总体的个数,提出了多次原假设。LSD 的检
验统计量是一个自由度为 nT r 的 t 统计量:t xi x j i j
M
SE
1 ni
1 nj
6.3 方差相等性检验
r 1
第六步:计算总体方差的组内估计
r
nj
1
s
2 j
MSE j1
nT r
第七步:计算 F 统计量的值。
F MSA MSE
第八步:编制方差分析表。
表 6.2
方差来源
平方和
自由度
组间
SSA
r 1
组内
SSE
nT r
于是,当原假设为真时,可得服从 F 分布的统计量, 其分子自由度为 r 1,分母自由度为 nT r 。此 F 统计
量可充当检验统计量: F MSA MSE
★ 6.2.2 方差分析基本步骤
:
2 1
2 2
2 r
H1
:
2 1
,
2 2
,,
2 r
不尽相等
Bartlett 方差齐性检验统计量是自由为 r 1的 2 统计量:
2
r j 1
nj
1 ln
sc2
s
s j
给定显著性水平
,检验中的拒绝准则为:
2
2
。应当注意,
Bartlett 检验结果只在样本数据具有正态性时有效。
6.3 方差相等性检验
种方法,称为最小显著性差异法,简称 LSD。LSD 的检验假设为:
H0 : i j H1 : i j
这里是针对问题中所涉及的总体的个数,提出了多次原假设。LSD 的检
验统计量是一个自由度为 nT r 的 t 统计量:t xi x j i j
M
SE
1 ni
1 nj
6.3 方差相等性检验
r 1
第六步:计算总体方差的组内估计
r
nj
1
s
2 j
MSE j1
nT r
第七步:计算 F 统计量的值。
F MSA MSE
第八步:编制方差分析表。
表 6.2
方差来源
平方和
自由度
组间
SSA
r 1
组内
SSE
nT r
数理统计CH方差分析pt课件
i1 j1 k 1 ab
原因AB旳互作效应
nij (xij xi x j x )2
i1 j1
ab
MSAB
SSAB
nij (xij xi x j x )2
i1 j1
(a 1)(b 1)
(a 1)(b 1)
2024/9/30
26
6.2 两向分组数据方差分析
平方和代表效应
(12)总离差平方和分解
x1b1
…
x1b,n1b
…
x2b1
…
x2b,n2b
…
…
A单向分组 …
xab1
…
xab,nab
2024/9/30
6
6.2 两向分组数据方差分析
(2)数据模式
➢各个处理(原因A与B旳水平组合)分别独立试
验,第i×j处理反复试验nij次取得nij个观察, 这nij个观察视作第i×j正态总体旳一种样本; ➢全部观察(整个样本)由a×b个独立正态总
互作效应假设 H13 : ij i j 不全为零
2024/9/30
14
6.2 两向分组数据方差分析
(6)统计假设
总效应分解成 各个原因效应
原因A效应假设 H01 :1 2 a 0
H11 : 1,2 ,
,
不全为零
a
原因B效应假设 H02 : 1 2 b 0 H12 : 1, 2 , , b不全为零
23
6.2 两向分组数据方差分析
(10)计算原因B平方和SSB
Var
x j
1
a
nij
Var
n2 j i1 k 1
xijk
2
n j
b
EH0 SSB
数理统计第四章 方差分析ppt课件
i X i )
j 1
ni
0
•
•
1 r ni X X ij , 其中 n n i 1 j 1 1 r 因此 X ni X i n i 1
据(1),(2)可得
r n i i j i
下面利用离差分解法处理 i 1n 记X (组内平均)(1) X 1 ,2 , ,r i i j, i n 1 i j
4
下面对更一般问题建立数学模型
母体 子样 子样均值
X1
X 11 X 21
X 12
X1n1 X 2n2
X1 X2
X2
X 22
Xr
X r1
Xr2
X rnr
Xr
2 2 假定 X N ( ), 则 X N ( 0 , ) . i i, i j i
那么 X i j可写作
X 1 , ,r . i j i i j, i 2 N ( 0 , ) i j
i 1
由抽样分布定理得 又据 X i j相互独立 则
Q E
( X X ) ( n 1 ) ,
2 2 2 i 1 i j j j
n j
2 ( ( n 1 ) ) ( nr ) . i i 1 2 2
r
2 则E ( Q ) ( n r ) . E
(X n )2 ij X i) i (X i X
2 i 1 j 1 i 1
•
• • Q
Q
T
Q Q E A
Q Q Q T E A
T
Q E 组内离方差; Q A 组间离方差。 为总离方差 ;
: 描述全部数据离散成都;
•Q
•Q
第六 方差分析PPT课件
第10页/共50页
计算总均值
x xij n
n nj
x 26.5 31.2 32.8 20
573.9 28.695 20
第11页/共50页
(二)计算离差平方和
总离差平方和:
SST xij x 2 n 1s 2
组内误差项离差平方和:
SSE
xij x j
第38页/共50页
它们的计算公式分别为:
SST xij x 2 n 1s2
SSA
x• j x 2
k
x• j
x
2
k
r
1
s2 x•
j
SSB
xi• x 2
r
xi•
x
2
r
k
1
s2 xi •
SSE SST SSA SSB
第39页/共50页
它们的自由度分别为: SST: rk-1=n-1 SSA: r-1 SSB: k-1 SSE: (r-1)(k-1)=n-r-k+1
2
20 1.25
组内 192 12
16
总和 232 14
第29页/共50页
由 0.05知F0.052,12 3.89
而1.25<3.89 所以:接受原假设,即三种培训方法对 工人的日产量没有影响.
第30页/共50页
二、单因素方差分析的其它问题 1、进行方差分析的数据结构
观察值
因素(A)j
i
水平1 水平2
2
nj
1
s
2 j
j i
j
组间水平项离差平方和:
SSA x j x 2 n j x j x 2
第12页/共50页
SSA=SST-SSE
统计学方差分析ppt课件
水平
水平指因素的具体表现,如销售的 四种方式就是因素的不同取值等级。有 时水平是人为划分的,比如质量被评定 为好、中、差。
单元
单元指因素水平之间的组合。如销 售方式一下有五种不同的销售业绩,就 是五个单元。方差分析要求的方差齐就 是指的各个单元间的方差齐性。
元素
元素指用于测量因变量的最小单 位。一个单元里可以只有一个元素, 也可以有多个元素。
均衡
如果一个试验设计中任一因素各水 平在所有单元格中出现的次数相同,且 每个单元格内的元素数相同,则称该试 验是为均衡,否则,就被称为不均衡。 不均衡试验中获得的数据在分析时较为 复杂。
交互作用
如果一个因素的效应大小在另一 个因素不同水平下明显不同,则称为 两因素间存在交互作用。当存在交互 作用时,单纯研究某个因素的作用是 没有意义的,必须分另一个因素的不 同水平研究该因素的作用大小。如果 所有单元格内都至多只有一个元素, 则交互作用无法测出。
地点一 地点二 地点三 地点四 地点五
方式一
77
86
81
88
83
方式二
95
92
78
96
89
方式三
71
76
68
81
74
方式四
80
84
79
70
82
【解】设这四种方式的销售量的均值分别用 1•, 2•, 3•, 4• 表示,四 个销售地点的平均销售量用 •1, •2, •3, •4 表示;则要检验的假设为
例题
Excel操作
构造F统计量
判断与结论
例题
Excel操作
方差分析概述
因素和水平
单元和元素
均衡
交互作用
方差分析课件-PPT
、 、 、 增重表就是选用S-N-K法作均数多重两两比较得结果
增重表就是选用S-N-K法作均数多重两两比较得结果:
本例按a=0、05水准,将无显著性差异得数归为一类 (Subset for alpha=0、05)。可见
品种5、2、3得样本均数位于同一个子集( Subset )内,说 明品种5、品种2、品种3得样本均数两两之间无显著差异; 品种3、4、1位于同一个Subset内,她们之间无显著差异;而 品种5、2与品种4、1得样本均数有显著差异。
即三组均数间差异极显著,即不同时期切痂对大鼠肝脏 ATP含量有影响。
LSD法多重比较:
“*”显著性标注 两组均数得差
•S-N-K法:本例按0、5水平,将无显著差异得均数归为一类。
•第一组与第三组为一类,无显著差异,它们与第二组之间均数差 异显著。
•LSD与S-N-K法,不同得两两比较法会有不同。
如欲了解就是否达到极显著差异,需要将显著水平框中得 值输入0、01。
例、 为了研究烫伤后不同时间切痂对大鼠肝脏 ATP得影响,现将30只雄性大鼠随机分成3组,每组 10只:A组为烫伤对照组,B组为烫伤后24小时切痂 组,C组为烫伤后96小时切痂组。全部大鼠在烫伤 168小时候处死并测量器肝脏ATP含量,结果如下。 问试验3组大鼠肝脏ATP总数均数就是否相同。
该12个观察值得总得均值为91、5,标准差为34、 48。
上图为品系、剂量间均值得方差分析(F检验)结果
由表中可知,品系得F=23、771,P=0、001<0、01,差异极显著;
剂量得F=33、537,P=0、001<0、01,差异极显著。说明不同品系与 不同雌激素剂量对大鼠子宫得发育均有极显著影响,故有必要进一步对 品系、雌激素剂量两因素不同水平得均值进行多重比较。
增重表就是选用S-N-K法作均数多重两两比较得结果:
本例按a=0、05水准,将无显著性差异得数归为一类 (Subset for alpha=0、05)。可见
品种5、2、3得样本均数位于同一个子集( Subset )内,说 明品种5、品种2、品种3得样本均数两两之间无显著差异; 品种3、4、1位于同一个Subset内,她们之间无显著差异;而 品种5、2与品种4、1得样本均数有显著差异。
即三组均数间差异极显著,即不同时期切痂对大鼠肝脏 ATP含量有影响。
LSD法多重比较:
“*”显著性标注 两组均数得差
•S-N-K法:本例按0、5水平,将无显著差异得均数归为一类。
•第一组与第三组为一类,无显著差异,它们与第二组之间均数差 异显著。
•LSD与S-N-K法,不同得两两比较法会有不同。
如欲了解就是否达到极显著差异,需要将显著水平框中得 值输入0、01。
例、 为了研究烫伤后不同时间切痂对大鼠肝脏 ATP得影响,现将30只雄性大鼠随机分成3组,每组 10只:A组为烫伤对照组,B组为烫伤后24小时切痂 组,C组为烫伤后96小时切痂组。全部大鼠在烫伤 168小时候处死并测量器肝脏ATP含量,结果如下。 问试验3组大鼠肝脏ATP总数均数就是否相同。
该12个观察值得总得均值为91、5,标准差为34、 48。
上图为品系、剂量间均值得方差分析(F检验)结果
由表中可知,品系得F=23、771,P=0、001<0、01,差异极显著;
剂量得F=33、537,P=0、001<0、01,差异极显著。说明不同品系与 不同雌激素剂量对大鼠子宫得发育均有极显著影响,故有必要进一步对 品系、雌激素剂量两因素不同水平得均值进行多重比较。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
单因素试验的方差分析
一 、总平方和的分解 二、统计分析
数学模型
设在试验中,因素A有S个不同水平 A1, A2 ,..., As ,
在水平下的试验结果 X j ~ N( j , 2)( j 1, 2,..., s)。
其中 j和 2是未知参数。在水平A下j 作n j次独立实验,
其结果如表1所示。
序号
j 1
i 1
总离差平方和分解为
s nj
ST
( Xij X )2
j1 i1
s nj
s nj
=
( X ij X . j )2
( X. j X )2
j1 i1
j1 i1
S E (组内离差)
SA
(组间离差)
SE
SA
s nj
S
S
=
A
( X. j X )2= nj ( X . j X )2 组间差
n nj j 1
则μ是各水平下总体均值的加权平均,称为总平均值;
j 代表了第j水平下的总体均值与平均值的差异,
这个差异称为Aj 的效应,它满足
s
nj j 0
(4)
j 1
由式(2),(3)可以得到单因素方差分析的等价数学模型
X
ij
j
ij
m
nj j
0
j 1, 2, , s; i 1, 2, , nj (5)
j1 i1
S A与S E 相互独立, ST SA SE
ST
2
SA
2
SE
2
ST
2
~
2(n 1),
SE
2
~
2(n s),
SA
2
H0
~
2(s
1)
SA的自由度为s-1
即
ST
2
~
2
(n
1),
SE
2
~
2(n s),
SA
2
~
2(s 1)
在H0 : i 0成立的条件下,
取统计量
SE
SE n s
F值
F SA SE
F SA ~ F (s 1, n s) SE
例2 设对四种玉米品种进行对比实验,每个品种 都在同一块田的五个小区各做一次实验,实 验结果如下表所示。试问不同品种对玉米的 平均产量是否有显著影响?(α=0.01)
品种
产量(斤/小区)
A1
32.3 34.0 34.3 35.0 36.5
品种
A1
A2
A3 A4
产量(斤/小区)
32.3 34.0 34.3 35.0
36.5
33.3 33.0 36.3 36.8
34.5
30.8 34.3 35.3 32.3
35.8
29.3 26.0 29.8 28.0
29.8
前面提到的产品的产量、性能等称为试验指标, 他们受因素的影响,因素的不同状态称为水平,一个因素 可采取多个水平。 统计学上,不同的因素,不同的水平可以看作是不同的总体。 通过观察可以得到试验指标的数据,这些数据可以看成 从不同的总体中得到的样本数值。
的
要判断因素的各水平间是否有显著差异,也就是
要 判断各正态总体的均值是否相等,即检验假设
H0 : 1 2 s H1 : 1, 2 , , s ,不全相等
(1)
由于X ij 相互独立,且
Xij ~ N( j , 2) i 1, 2,..., nj ; j 1, 2, , s
若记 ij Xij j (i 1, 2, , nj ; j 1, 2, , s)
则 ij ~ N(0, 2), 且相互独立
X ij j ij
ij
~
N (0,
2)
ij相互独立
(2)
其中 i 1, 2, , nj j 1, 2, , s
其中 j与 2均为未知参数。
式(2)称为单因素方差分析的数学模型。
再令
1 n
s
nj j
j 1
(i 1, 2,
s
, m)
(3)
j j
A2
33.3 33.0 36.3 36.8 34.5
A3
30.8 34.3 35.3 32.3 35.8
A4
29.3 26.0 29.8 28.0 29.8
解 分别以 1, 2 , 3, 4表示不同品种玉米平均
产量总体的均值,按题意需检验假设
S 4
H0 : 1 2 3 4 H1 : 1, 2 , 3, 4不全相等
X ij ij ij i j ij , ij 0
r
s
i 0, i 0
i 1
j 1
i 称为因素A在水平 Ai 的效应 j 称为因素B在水平B j 的效应
检验假设
H01 :1 2 r 0 H02 : 1 2 s 0
令平均数
1s
X i•
s
X ij ,
j 1
i 1, 2, , r
E[SE2 ] n s,即
E[ SE ]= 2
ns
S
SA nj ( X. j X )2 J 1
s
ESA
n
j
2 j
(
s
1)
2
j 1
若 H0 : 1 2 s
X ij ~ N ( j , 2 )且独立:
s nj
ST / 2 (
( X ij X )2 ) / 2 2(n-1)
s
nj
SE
( X ij X . j )2
j1 i1
nj
( X ij X. j )2
i 1
2
~(2 nj 1)
由 2分布的可加性,有
nj
SE = s 2
j 1
( X ij X . j )2
i 1
2
~
s
2( (nj
j 1
1))
即
SE
2
~ 2(n s)
(1.4)
SE
2
~ 2(n s) ,知:SE的自由度为n s,并且有
n1 n2 n3 n4 =5, n n1 n2 n3 n4 =20
xij 656.4,
xi2j 21725.22
ST
4 i 1
5 j 1
xij 2
T2 20
21725.22 656.4 182.172 20
SA
4 T. j2 T 2 i1 5 20
21677.5 656.42 20
2
1580 1640 1640 1700 1750
3
1460 1550 1600 1620 1640 1660 1740 1820
试问测试结果是否说明这三批电子管的寿命有明显差 异?
例2 设对四种玉米品种进行对比实验,每个品 种都在同一块田的五个小区各做一次实验,实 验结果如下表所示。试问不同品种对玉米的平 均产量是否有显著影响?
氧化锌B
催化剂A
B1
B2
A1
32
35
A2
33.5
36.5
A3
36
37.5
B3
B4
35.5
38.5
38
39.5
39.5
43
问不同促进剂、不同份量氧化剂分别定强有无显著影 响?
此例中有A,B 二个因素。
因素A 有三种水平: A1, A2 , A3 因素B 有四种水平:B1, B2 , B3, B4 在每种组合水平Ai Bj上 做一次试验获得了试验值。
因素B
因素A
B1
B2
A1
X11
X 12
A2
X 21
X 22
Bs
X i•
X1s
X1•
X 2s
X 2•
Ar
X r1
Xr2
X• j
X •1
X •2
X rs
X r•
X •s
X
数学模型
假设总体
X
服从正态分布
ij
N (ij
,
2
)
。
令 X ij ij ij
ij ~ N 0, 2 , ij 相互独立
令
问因素A,B分别对试验结果有无显著影响?
一般情况,设有二个因素A,B
因素 A 有r 种水平:A1, A2 , , Ar 因素 B 有s 种水平:B1, B2 , , Bs
在每一种组合水平 Ai Bj 上进行一次试验,结果为 X ij , i 1, 2, , r, j 1, 2, , s, X ij 相互独立。
是 2 的无偏估计。
E
X. j
1 nj E n j j1
X ij
1
nj
nj
j j
j 1
E
X
1 s nj
E
n j1 i1
X ij
1 n
s
ni i
j 1
ˆ X , ˆ j X. j
双因素方差分析
1. 非重复试验双因素方差分析
例1 在某种橡胶的配方中,考虑了三种不同的促进剂, 四种不同份量的氧化锌。各种配方试验一次,测得300% 定强如下:
F
SA
2
/( s
1)
SE
2
/(n
s)
F ~ F (s 1,n s)
F 分布的分位点回顾 对于给定的正数
称满足条件
的点
为
分布的上 分位点。
给定 查出 即认为因素对试验结果无显著影响。
一元方差分析表
方差来 平 自
源
方由Leabharlann 和度因素A SA s-1
误差E SE n-s
总和T ST n-1