第七章 方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12
(二)构造检验统计量 方差分析所用统计量为:
F MS A ~ F(k 1, n k) MS E
13
1、计算因素各水平(总体)的均值及总均值,
分别用 和xi 表x示地i个总体的均值与所有样本
观测值的总均值。计算公式如下:
ni
xij
xi
i 1
ni
,(i 1,2, k)
k ni
为r 1,MSE 的自由度为k 1r 1 。
36
(三)分析步骤 1、提出假设设:
H10:1 2 i k H11:( i i 1,2, , k)不完全相等 H 20:1 2 j r H 21: j ( j 1,2, , r)不完全相等 其中:i为因素A的第i个水平(总体)的均值, j为因素B的第j个水平(总体)的均值。
H
:各组平均分数相等;
0
H1:各组平均分数不全相等。
利用SPSS软件进行计算。
26
三、关系强度的度量
R2 SSA SST
27
四、单因素方差分析中的多重比较
多重比较是通过对总体均值之间的配对比较来进 一步检验到底哪些均值之间存在差异。(11)
多重比较方法有多种,这里介绍Fisher提出的最 小显著差异方法,简写为LSD。
5
方差分析中的常用术语:(2) 因素:一个独立的变量,是方差分析研 究的对象。 水平:因素在方差分析中的不同表现。 单因素方差分析:只针对一个因素进行 的方差分析。 多因素方差分析:针对多个因素进行的 方差分析。
6
二、方差分析的基本假设
1、每个总体都应服从正态分布。 对于因素的每一个水平,其观测值是来 自正态分布总体的简单随机样本。
粉色 31.2 28.3 30.8 27.9 29.6 29.56
橘黄色 27.9 25.1 28.5 24.2 26.5 26.44
绿色 30.8 29.6 32.4 31.7 32.8 31.46
总均值 28.70
2
相同总体的情况
3
不同总体的情况
1
2
3
4
4
方差分析是对多个总体均值是否相等 这一假设进行检验。
方差分析的目的:检验各个水平的均 值是否相等。
实现方差分析的目的的手段:方差的 比较。
9
观测值的差异来自于两个方面:
1、系统差异:由因素中的不同水平引起, 用组间方差度量;
2、随机差异:由样本抽区的随机性引起, 用组内方差度量。
方差分析:将一组样本数据发生的总变差 根据可能引起变差的来源分割为几个部分,使 总变差的每一部分都可归因于某种原因,通过 测度这些不同来源的变差之间是否有显著差异, 来判断总体均值之间是否存在显著差异。
ni xi2
总均值
无色
26.5 28.7 25.1 29.1 27.2 136.6 3742.6 27.32
3731.91
粉色
31.2 28.3 30.8 27.9 29.6 147.8 4377.54 29.56
4368.97
橘黄色
27.9 25.1 28.5 24.2 26.5 132.2 3508.56 26.44
ni xi2j nx 2
i1 j1
i1 j1
k
ni (xij xi )2 k
ni (xi x)2
i1 j1
i1 j1
SSE SSA
15
其中: (1)组间误差,其自由度为k-1:
k ni
k
SSA
(xi x)2 ni (xi x)2
10
第二节 单因素方差分析
一、样本数据结构(28)
单因素方差分析的样本数据结构
观
察
因 值
素水
平
A1
A2
L
Ak
试验批号
1
x11
x21
L
xk1
2
x12
x22
L
xk 2
M
M
M
M
M
ni
x1n1
x2n2
L
x k nk
11
二、单因素方差分析的步骤
(一)提出假设
H0:1 2 i k H1:(i i 1,2, ,k)不完全相等
10 14
20 18
12 18
6 10
区
B4 16 4
8
6 18
B5 26 22 16 20 10
31
(一)样本数据结构
无交互作用的双因素方差分析的样本结构表(34)
B水平
因素B
行和 行均值
A水平
B1 B2 … Br
Ti.
xi
因 素
A1
x11 x12 … x1r
A2
x21 x22 … x2r
T1· T2·
售(因素B),现从每个地区随机抽取一个规模相同的超级市场,
得到该商品不同包装的销售资料如下表。现欲检验包装方式和
销售地区对该商品销售是否显著影响(
0.)05?
某种商品不同地区不同包装的销售资料
包装方式(A)
A1
A2
A3
A4
A5
B1 20 12 20 10 14
销 售地(B)
B2 B3
22 24
k
xij
ni xi
x i1 j1 n
i1 n
,(n n1 n2 nk)
14
2、在方差分析中,需要计算三个误差平方
和,即总误差平方和( SST )、组间误差平方
和( SS A )及组内误差平方和( SSE ) 。
k
SST
ni (xij x)2 k
LSD多重比较步骤:
1、提出假设: H0:i j H1:i j 2、计算检验统计量: xi x j 3、计算LSD,其计算公式为:
LSD t 2 (n k)
M
SE
(
1 ni
1 nj
)
其中MSE
SSE nk
28
4、判断
(22)
若 xi x j
LSD,
则拒绝H
(i 1,2, k )
( j 1,2, r)
33
(二)误差平方和的分解(32)
k r
SST
xij x 2
i1 j 1
k r
xij xi x j x 2
i1 j 1
k r
kr
xi x 2
0;反之,则接受H
。
0
对于例1,在显著水平 0.05下,哪两种包装
颜色的饮料的销量有显 著差别?
x1 x2 27.32 29.26 2.24
LSD t0.025 (16)
2.8 (1 1) 2.24 55
由于x1 x2 LSD 1与2没有显著差异。
37
2、在方差分析表中计算相应的统计量
无交互作用的双因素方差分析表
误差来源
误差平方和
自由度 均方 F值
因素A的组间误差
SS A
k 1
MSA FA
因素B的组间误差
SSB
r 1
MS B
FB
随机误差
SSE
k 1r 1 MSE
总误差
SST
n 1
38
3、统计检验
在给定的显著水平下,查F分布表得到临界值:
3495.37
绿色
30.8 29.6 32.4 31.7 32.8 157.3 4955.29 31.46
4948.66
合计
573.9 16583.99 16544.91
28.70
22
某饮料的方差分析表
误差来源 误差平方和 自由度 均方 F值
组间误差 71.11 组内误差 44.82
3 23.7 8.46 16 2.8
i1 j1
i 1
k ni
k
xi2 nx 2 ni xi2 nx 2
i1 j1
i 1
(2)组内误差,其自由度为n-k:
k ni
SSE
(xij xi )2 SST SSA
i1 j1
16
3、构造统计量
MSA
SSA k 1
MSE
SSE nk
若F
F,则拒绝原假设
H
;
0
若F
F,则不能拒绝原假设
H
。
0
18
(四)方差分析表 前述(二)之1的计算,一般在方差分 析计算表中进行,(二)之2、3在方差分 析表中进行。方差分析计算表与方差分析 表的一般形式分别如后一页:
19
方差分析计算表
观
察
因 值
素水
平
A1
A2
L
试验批号
1
x11
x21
L
2
同理可判断1与3、1与4、2与3、2与4、 3与4是否有显著差异。
29
第三节 双因素方差分析
一、双因素方差分析及其类型
双因素方差分析: ①无交互作用的双因素方差分析: ②有交互作用的双因素方差分析:
30
二、无交互作用的双因素方差分析(41)
例3、某商品有五种不同包装方式(因素A),在五个不同地区销
i1 j1
MS A
SSA ,MS k 1
B
SSB ,MS r 1
E
k
SSE
1r
1
35
构造统计量:
FA
MS A MS E
~
Fk
1,k
1r
1
FB
MS B MS E
~ Fr 1,k 1r 1
其中 MSA 的自由度为k 1,MSB 的自由度
第七章 方差分析
主要内容: 方差分析的概念; 单因素方差分析; 无交互作用的双因素方差分析。
1
第一节 方差分析引论
一、问题的提出
例1、某饮料在五家超市的销售情况。(6) (9)
超市 1 2 3 4 5
均值
某饮料在五家超市的销售情况表
无色 26.5 28.7 25.1 29.1 27.2 27.32
2、各个总体的方差σ2必须相同(方差 齐性)。
各因素水平的观察数据组是从具有相同 方差的正态总体中抽取的。
7
3、各样本是相互独立的随机样本。 方差分析就是要在上述假定成立的前提 下,分析自变量对因变量的影响是否显著, 实际上也就是要检验自变量的各个水平(总 体)的均值是否相等。
8
三、方差分析的基本思想(2)
x1 x2
A … …… … …
…
Ak
xk1 xk2 … xkr
Tk·
…
xk
列列均和值T.xj j Tx·11 Tx·22
… …
Tx·kr
总和 T
总均x 值
32
其中:
xi
1 r
r
xij
j 1
x j
1 k
k i 1
xij
x
1 kr
k i 1
r
xij
j 1
x12
x22
M
M
M
M
ni
列和
x1n1
x2n2
L
n1
n2
x1 j
ቤተ መጻሕፍቲ ባይዱ
x2 j
j 1
j 1
列平方和
x n1 2 1j
n2
x22j
j 1
j 1
x x 列均值
1
2
Ak
xk1
xk 2
M
x k nk
nk
xkj
j 1
nk
xk2j
j 1
xk
20
方差分析表
误差来源 误差平方和 自由度 均方 F值 临界值
总误差 115.93 19
临界值
3.24
由于F F,所以拒绝原假设,接 受备择假设, 既饮料包装的颜色对销 售量有显著影响。
23
例2、某课程结束后,学生对该授课教师的教学质量 进行评估,评估结果分为优、良、中、差四等。教 师对学生考试成绩的评判和学生对教师的评估是分 开进行的,他们互相都不知道对方给自己的打分。 有一种说法,认为给教师评为优秀的这组学生的考 试分数,可能会显著地高于那些认为教师工作仅是 良、中或差的学生的分数。同时认为,对教师工作 评差的学生,其考试的平均分数可能最低。为对这 种说法进行检验,从对评估的每一个级组中,随机 抽取出共26名学生。试以0.05的显著水平检验各组 学生的分数是否有显著差别。26名学生的考试成绩 如下表。
F MS A ~ F(k 1, n k) MS E
17
(三)统计检验
1、确定显著水平; 2、根据样本观测值计算统 计量F MS A 的值; 3、根据给定的显著水平,查F分布MS表T 得到
相应的临界值F (k 1,n k);
4、将统计量 F的值与临界值 F 进行比较后,
得出结论。
24
观测值
i
1 2 3 4 5 6 7 8 9 10
26名学生考试成绩
学生对教师评估等级
优
良
中
差
85
80
73
76
77
78
80
72
79
94
92
70
84
73
76
85
92
79
6
90
86
73
91
75
81
64
25
解:若各组学生的平均成绩之间没有显著差异, 则表明学生对教师的评估结果与他们的成绩之间 没有必然的联系。
x j x 2
i1 j 1
i1 j 1
SST SSA SSB SSE
34
其中:
k r
SSE
xij xi x j x 2
i1 j1
kr
SSA
xi x 2
i1 j1
k r
SSB
x j x 2
组间误差 SS A
组内误差 SSE
总误差 SST
k 1 MSA MS A
n k MSE MSE
n 1
F( k 1,n k)
对前述例1,试以0.05的显著水平 检验饮料颜色对其销售量是否有显著影 响。列表计算如下:
21
某饮料的方差分析计算表(29)
观测值 (超市)
1 2 3 4 5 列和 列平方和 列均值
(二)构造检验统计量 方差分析所用统计量为:
F MS A ~ F(k 1, n k) MS E
13
1、计算因素各水平(总体)的均值及总均值,
分别用 和xi 表x示地i个总体的均值与所有样本
观测值的总均值。计算公式如下:
ni
xij
xi
i 1
ni
,(i 1,2, k)
k ni
为r 1,MSE 的自由度为k 1r 1 。
36
(三)分析步骤 1、提出假设设:
H10:1 2 i k H11:( i i 1,2, , k)不完全相等 H 20:1 2 j r H 21: j ( j 1,2, , r)不完全相等 其中:i为因素A的第i个水平(总体)的均值, j为因素B的第j个水平(总体)的均值。
H
:各组平均分数相等;
0
H1:各组平均分数不全相等。
利用SPSS软件进行计算。
26
三、关系强度的度量
R2 SSA SST
27
四、单因素方差分析中的多重比较
多重比较是通过对总体均值之间的配对比较来进 一步检验到底哪些均值之间存在差异。(11)
多重比较方法有多种,这里介绍Fisher提出的最 小显著差异方法,简写为LSD。
5
方差分析中的常用术语:(2) 因素:一个独立的变量,是方差分析研 究的对象。 水平:因素在方差分析中的不同表现。 单因素方差分析:只针对一个因素进行 的方差分析。 多因素方差分析:针对多个因素进行的 方差分析。
6
二、方差分析的基本假设
1、每个总体都应服从正态分布。 对于因素的每一个水平,其观测值是来 自正态分布总体的简单随机样本。
粉色 31.2 28.3 30.8 27.9 29.6 29.56
橘黄色 27.9 25.1 28.5 24.2 26.5 26.44
绿色 30.8 29.6 32.4 31.7 32.8 31.46
总均值 28.70
2
相同总体的情况
3
不同总体的情况
1
2
3
4
4
方差分析是对多个总体均值是否相等 这一假设进行检验。
方差分析的目的:检验各个水平的均 值是否相等。
实现方差分析的目的的手段:方差的 比较。
9
观测值的差异来自于两个方面:
1、系统差异:由因素中的不同水平引起, 用组间方差度量;
2、随机差异:由样本抽区的随机性引起, 用组内方差度量。
方差分析:将一组样本数据发生的总变差 根据可能引起变差的来源分割为几个部分,使 总变差的每一部分都可归因于某种原因,通过 测度这些不同来源的变差之间是否有显著差异, 来判断总体均值之间是否存在显著差异。
ni xi2
总均值
无色
26.5 28.7 25.1 29.1 27.2 136.6 3742.6 27.32
3731.91
粉色
31.2 28.3 30.8 27.9 29.6 147.8 4377.54 29.56
4368.97
橘黄色
27.9 25.1 28.5 24.2 26.5 132.2 3508.56 26.44
ni xi2j nx 2
i1 j1
i1 j1
k
ni (xij xi )2 k
ni (xi x)2
i1 j1
i1 j1
SSE SSA
15
其中: (1)组间误差,其自由度为k-1:
k ni
k
SSA
(xi x)2 ni (xi x)2
10
第二节 单因素方差分析
一、样本数据结构(28)
单因素方差分析的样本数据结构
观
察
因 值
素水
平
A1
A2
L
Ak
试验批号
1
x11
x21
L
xk1
2
x12
x22
L
xk 2
M
M
M
M
M
ni
x1n1
x2n2
L
x k nk
11
二、单因素方差分析的步骤
(一)提出假设
H0:1 2 i k H1:(i i 1,2, ,k)不完全相等
10 14
20 18
12 18
6 10
区
B4 16 4
8
6 18
B5 26 22 16 20 10
31
(一)样本数据结构
无交互作用的双因素方差分析的样本结构表(34)
B水平
因素B
行和 行均值
A水平
B1 B2 … Br
Ti.
xi
因 素
A1
x11 x12 … x1r
A2
x21 x22 … x2r
T1· T2·
售(因素B),现从每个地区随机抽取一个规模相同的超级市场,
得到该商品不同包装的销售资料如下表。现欲检验包装方式和
销售地区对该商品销售是否显著影响(
0.)05?
某种商品不同地区不同包装的销售资料
包装方式(A)
A1
A2
A3
A4
A5
B1 20 12 20 10 14
销 售地(B)
B2 B3
22 24
k
xij
ni xi
x i1 j1 n
i1 n
,(n n1 n2 nk)
14
2、在方差分析中,需要计算三个误差平方
和,即总误差平方和( SST )、组间误差平方
和( SS A )及组内误差平方和( SSE ) 。
k
SST
ni (xij x)2 k
LSD多重比较步骤:
1、提出假设: H0:i j H1:i j 2、计算检验统计量: xi x j 3、计算LSD,其计算公式为:
LSD t 2 (n k)
M
SE
(
1 ni
1 nj
)
其中MSE
SSE nk
28
4、判断
(22)
若 xi x j
LSD,
则拒绝H
(i 1,2, k )
( j 1,2, r)
33
(二)误差平方和的分解(32)
k r
SST
xij x 2
i1 j 1
k r
xij xi x j x 2
i1 j 1
k r
kr
xi x 2
0;反之,则接受H
。
0
对于例1,在显著水平 0.05下,哪两种包装
颜色的饮料的销量有显 著差别?
x1 x2 27.32 29.26 2.24
LSD t0.025 (16)
2.8 (1 1) 2.24 55
由于x1 x2 LSD 1与2没有显著差异。
37
2、在方差分析表中计算相应的统计量
无交互作用的双因素方差分析表
误差来源
误差平方和
自由度 均方 F值
因素A的组间误差
SS A
k 1
MSA FA
因素B的组间误差
SSB
r 1
MS B
FB
随机误差
SSE
k 1r 1 MSE
总误差
SST
n 1
38
3、统计检验
在给定的显著水平下,查F分布表得到临界值:
3495.37
绿色
30.8 29.6 32.4 31.7 32.8 157.3 4955.29 31.46
4948.66
合计
573.9 16583.99 16544.91
28.70
22
某饮料的方差分析表
误差来源 误差平方和 自由度 均方 F值
组间误差 71.11 组内误差 44.82
3 23.7 8.46 16 2.8
i1 j1
i 1
k ni
k
xi2 nx 2 ni xi2 nx 2
i1 j1
i 1
(2)组内误差,其自由度为n-k:
k ni
SSE
(xij xi )2 SST SSA
i1 j1
16
3、构造统计量
MSA
SSA k 1
MSE
SSE nk
若F
F,则拒绝原假设
H
;
0
若F
F,则不能拒绝原假设
H
。
0
18
(四)方差分析表 前述(二)之1的计算,一般在方差分 析计算表中进行,(二)之2、3在方差分 析表中进行。方差分析计算表与方差分析 表的一般形式分别如后一页:
19
方差分析计算表
观
察
因 值
素水
平
A1
A2
L
试验批号
1
x11
x21
L
2
同理可判断1与3、1与4、2与3、2与4、 3与4是否有显著差异。
29
第三节 双因素方差分析
一、双因素方差分析及其类型
双因素方差分析: ①无交互作用的双因素方差分析: ②有交互作用的双因素方差分析:
30
二、无交互作用的双因素方差分析(41)
例3、某商品有五种不同包装方式(因素A),在五个不同地区销
i1 j1
MS A
SSA ,MS k 1
B
SSB ,MS r 1
E
k
SSE
1r
1
35
构造统计量:
FA
MS A MS E
~
Fk
1,k
1r
1
FB
MS B MS E
~ Fr 1,k 1r 1
其中 MSA 的自由度为k 1,MSB 的自由度
第七章 方差分析
主要内容: 方差分析的概念; 单因素方差分析; 无交互作用的双因素方差分析。
1
第一节 方差分析引论
一、问题的提出
例1、某饮料在五家超市的销售情况。(6) (9)
超市 1 2 3 4 5
均值
某饮料在五家超市的销售情况表
无色 26.5 28.7 25.1 29.1 27.2 27.32
2、各个总体的方差σ2必须相同(方差 齐性)。
各因素水平的观察数据组是从具有相同 方差的正态总体中抽取的。
7
3、各样本是相互独立的随机样本。 方差分析就是要在上述假定成立的前提 下,分析自变量对因变量的影响是否显著, 实际上也就是要检验自变量的各个水平(总 体)的均值是否相等。
8
三、方差分析的基本思想(2)
x1 x2
A … …… … …
…
Ak
xk1 xk2 … xkr
Tk·
…
xk
列列均和值T.xj j Tx·11 Tx·22
… …
Tx·kr
总和 T
总均x 值
32
其中:
xi
1 r
r
xij
j 1
x j
1 k
k i 1
xij
x
1 kr
k i 1
r
xij
j 1
x12
x22
M
M
M
M
ni
列和
x1n1
x2n2
L
n1
n2
x1 j
ቤተ መጻሕፍቲ ባይዱ
x2 j
j 1
j 1
列平方和
x n1 2 1j
n2
x22j
j 1
j 1
x x 列均值
1
2
Ak
xk1
xk 2
M
x k nk
nk
xkj
j 1
nk
xk2j
j 1
xk
20
方差分析表
误差来源 误差平方和 自由度 均方 F值 临界值
总误差 115.93 19
临界值
3.24
由于F F,所以拒绝原假设,接 受备择假设, 既饮料包装的颜色对销 售量有显著影响。
23
例2、某课程结束后,学生对该授课教师的教学质量 进行评估,评估结果分为优、良、中、差四等。教 师对学生考试成绩的评判和学生对教师的评估是分 开进行的,他们互相都不知道对方给自己的打分。 有一种说法,认为给教师评为优秀的这组学生的考 试分数,可能会显著地高于那些认为教师工作仅是 良、中或差的学生的分数。同时认为,对教师工作 评差的学生,其考试的平均分数可能最低。为对这 种说法进行检验,从对评估的每一个级组中,随机 抽取出共26名学生。试以0.05的显著水平检验各组 学生的分数是否有显著差别。26名学生的考试成绩 如下表。
F MS A ~ F(k 1, n k) MS E
17
(三)统计检验
1、确定显著水平; 2、根据样本观测值计算统 计量F MS A 的值; 3、根据给定的显著水平,查F分布MS表T 得到
相应的临界值F (k 1,n k);
4、将统计量 F的值与临界值 F 进行比较后,
得出结论。
24
观测值
i
1 2 3 4 5 6 7 8 9 10
26名学生考试成绩
学生对教师评估等级
优
良
中
差
85
80
73
76
77
78
80
72
79
94
92
70
84
73
76
85
92
79
6
90
86
73
91
75
81
64
25
解:若各组学生的平均成绩之间没有显著差异, 则表明学生对教师的评估结果与他们的成绩之间 没有必然的联系。
x j x 2
i1 j 1
i1 j 1
SST SSA SSB SSE
34
其中:
k r
SSE
xij xi x j x 2
i1 j1
kr
SSA
xi x 2
i1 j1
k r
SSB
x j x 2
组间误差 SS A
组内误差 SSE
总误差 SST
k 1 MSA MS A
n k MSE MSE
n 1
F( k 1,n k)
对前述例1,试以0.05的显著水平 检验饮料颜色对其销售量是否有显著影 响。列表计算如下:
21
某饮料的方差分析计算表(29)
观测值 (超市)
1 2 3 4 5 列和 列平方和 列均值