第六章 方差分析-贾国梅
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
促销方式 A1(广告宣传) A2(有奖销售) A3(特价销售) A4(买一送一) 104.8 112.3 143.2 145.6 与上年同期相比(%) 95.5 104.2 107.1 109.2 150.3 184.7 111.0 139.8 103.0 99.2 154.5 122.7
超市管理部门希望了解: ⑴不同促销方式对销售量是否有显著影响? ⑵哪种促销方式的效果最好?
案例 1 分析 • 可用 SPSS 软件的【工具】 →“analyze”→campare mean“One-Way ANOVA”
Dependent Factor:% Contrasts选项: Post
List:促销方式
多项式比较
Hoc选项: Options选项:Descriptive描述统计量, Homogeneity-of-variance方差齐次性检验, Means plot均值分布图 结果除了方差分析表,还有很多选项相应的结 果 求解单因素方差分析问题。
1. 最小显著差数法(LSD法)
(1) 列出平均数多重比较表 比较表中各
处理按其平均数从大到小自上而下排列; (2)计算最小显著差数 LSD
0 . 05
和
LSD
0 . 01
;
LSD
t
s
x1 x 2
S x i x j 2 MS e / n
MSe为处理间误差方差
ta : 通过附表4:学生
第二节 多重比较
为什么要进行多重比较 怎样进行多重比较 如何表示多重比较的结果 多重比较方法的选择
三、如何表示多重比较的结果
有三种方法: • 标记字母法 • 列梯形表法 • 划线法
1. 标记字母法
例:水稻不同药剂处理的苗高(cm)
药剂 A B C D 苗高观察值 18 20 10 28 21 24 15 27 20 26 17 29 13 22 14 32 总和Ti 72 92 56 116 平均 x i 18 23 14 29
行p为测验极差的平均数个数
2. 新复极差测验(SSR法)
A. 计算LSRα
例:水稻不同药剂处理的苗高(cm)
药剂 苗高观察值 总和Ti 平均 x i
B. 排序
C. 比较
A B C D
18 20 10 28
21 24 15 27
20 26 17 29
13 22 14 32
72 92 56 116
18 23 14 29
药剂处理间 药剂处理内(误差)
总
3 12
15
504 98
602
168.00 8.17
20.56* *
F 0.05(3,12)=3.49 F 0.01(3,12)=5.92
2. 什么叫多重比较
多重比较就是指在 F 测验的前提下,
如果否定了无效假设,只是表明试验的总变
异主要来源于处理间的变异,这也仅仅说明
原创:贾国梅 作者单位:湖北三峡大学
第六章 方差分析ANOVA
(Analysis of Variance)
方差分析的基本原理
多重比较
单向分组资料的方差分析
两向分组资料的方差分析 数据转换
t 检 验 法 只 适用于两个处理平均数间差 异显著性检验。 1、计算工作量大 2、无统一的试验误差,误差估计的精确性和 检验的灵敏度降低 对多个处理平均数进行差异显著性检验,不宜 采用t检验法,须采用方差分析法。
2 3 4
凡两极差≥LSRa,则为在a水平上差异显著; 反之,不显著。
处理 D B A C 平均数 29 23 18 14 P=2 D-B=6* B-A=5* A-C=4 P=3 D-A=11** B-C= 9** P=4 D-C=15**
3. q测验
• 与SSR法相似,唯一区别仅在计算LSRa 时,不是查SSRa,而是查qa(附表7), 查qa后 LSRa=SE· a q 所以不再详述。
第一节 方差分析的基本原理
方差分析是按照设计类型将变量的总变
异分解为若干部分,再通过比较各部分的
变异做出统计推断的检验方法。
• 自由度和平方和(SS)的分解 • F分布与F测验
一、自由度和平方和(SS)的分解
设有k组数据,每组有n个观察值
组别 1
观察值(xij, i=1,2,„,k; j=1,2,„,n)
氏t值表可得到
(3)将平均数多重比较表中两两平均数的差 数与 LSD
0 . 05
、LSD
0 . 01
比较,作出统计推断。
2. 新复极差测验(SSR法) A. 计算LSRα B. 排序 C. 比较
LSRa=SE· a SSR
SE se n
2
或
MS n
e
SSR通过查附表8求得 查表时:列为误差自由度
用离均差平方和(sum of squares of deviations from mean,SS)表示变异的大小
自由度和平方和(SS)的分解
总自由度DFT=组间自由度DFt+组内自由度DFe
总平方和SST=组间平方和SSt+组内平方和SSe
sT
2
总的均方(方差): MS
(x
ij
x)
自由度和平方和的分解
以A、B、C、D四种药剂处理水稻种子,其 中A为对照,每处理各得4个苗高观察值(cm),其 结果列于下表,试分解其平方和与自由度
药剂 A 18 苗高观察值 21 20 13 总和Ti 平均 72 18
x
i
B C D
x
20 10 28
24 15 27
26 17 29
22 14 32
处理 D B A C
平均数 x i 29 23 18 14
2. 新复极差测验(SSR法)
P SSR 0.05
3.08 3.23 3.33
SSR 0.01
4.32 4.55 4.68
LSR 0.05
4.40 4.62 4.76
LSR 0.01
6.18 6.51 6.69
A. 计算LSRα
B. 排序
C. 比较
方差分析结论:
特价销售的效果最好, 买一送一次之,广告宣传 和有奖销售的效果最差, 两者间无显著差异。
第六章
第二节 多重比较
为什么要进行多重比较 怎样进行多重比较 如何表示多重比较的结果 如何选择多重比较的方法
一、为什么要进行多重比较
为什么要进行多重比较
什么叫多重比较
多重比较的优点
92 56 116
23 14 29 T=336
=21
自由度和平方和的分解
总变异自由度:
药剂间自由度:
DFT=(nk-1)=(44)-1=15
DFt=(k-1)=4-1=3
药剂内自由度:
矫正数
C
DFe=k(n-1)=4(4-1)=12
T
2
336
2
nk
4 4
2 ij
2
7056
总的平方和:
各部分偏差平方和除以各自的自由度便可得
到总均方、处理间均方和处理内均方, 分别 记为 MST(或T2 S (或 S e2 )。 即
MS
T
)、MSt(或t2 S
2 ST
)和MSe
SS T / df T
MS
MS
t
e
S
S
2 e
2 t
SS
SS
e
t
/ df
e
t
/ df
注意:总均方不等于处理间均方加处理内均方。
F临界值 F0.05(3,1 2)=3.49 F0.01(3,1 2)=5.95
处理内(误差)
总
12
15
98
602
8.17
F>=F0.05, P<=0.05, 否定H0,处理间差异(极) 显著
【案例1】哪种促销方式效果最好?
• 某大型连锁超市为研究各种促销方式的效果,选 择下属4个门店,分别采用不同促销方式,对包装 食品各进行了4个月的试验。 • 试验结果如下:
2
T
nk 1
n (xi x) 2 k 1
组间的均方(方差): MS t s t 组内的均方(方差): MS e s e
2
2
( x ij x i )
2
k ( n 1)
df df df
T t e
kn 1 k 1 df
T
df
t
均方差,均方(mean square,MS)
进一步的分析
由 SPSS 软件的运行输出结果还可得:
x1
x3
101 . 875 ,
158 . 175
x2
106 . 95
x4
129 . 775
• 由 SPSS 软件的运行输出结果还直接可得 到对各 i 的 t 检验结果如下( =0.05): • 1 2 4 • (广告宣传) 1 • (有奖销售) 2 • (买一送一) 4 * * • (特价销售) 3 * * *
x11 x12 „ x1j „ x1n
总和 平均 均方 T1
x1
x2
s12
2
„ i „ k
x21
„ xi1 „ xk1
x22
„ xi2 „ xk2
„
„ „ „ „
T
x2j
„
„
x2n
„ xin „ xkn
x
T2
„ Ti „ Tk
s22
„ si2 „ sk2
„
x
i
xij
„ „
„
x
k
wenku.baidu.com
xkj
„
x ij
ni
2
S S 组 内 (Yij Yi )
i 1 a j 1 2 i
a
( n i 1) S
i 1
S,为大方差, 处理间方差; S2为小方差, 处理内方差
变异来源 处理间
二、F分布与F测验
F ( 1 ,
2
)
s1 s2
2 2
DF 3
SS 504
MS 168
F 20.56**
了k个处理的平均值有显著差异,但是并不
能说明两两平均数间的显著差异,这就需要
进行多个平均数间的两两比较,即多重比较
3. 多重比较的优点
• 比较的精确度增大了
• 所得到的结论更全面,更可靠了
二、怎样进行多重比较
常用的有: 最小显著差数法(Least significant difference, LSD法) LSD-t检验 (有专业意义的均数间比较) 最小显著极差法(Least significant ranges, LSR法):这个方法是不 同平均数间的比较采用不同的显著差数标准,克服了LSD法的 局限性,用于平均数间的所有相互比较) ☆ 新复极差测验(SSR法)又称Duncan法 (new multiple range method) ☆ SNK-q检验(student Newman Keuls) (多个均数间全面比较)又 q检验 Dunnett检验 (多个实验组与对照组比较) Tukey(真正显著差法HSD: 用单一值作为判断的标准) 、 • 还有Scheffe、 Waller 、BON等比较方法
1. 为什么要进行多重比较?
例:水稻不同药剂处理的苗高(cm) 药剂 苗高观察值 总和Ti A 18 21 20 13 72 B 20 24 26 22 92 C 10 15 17 14 56 D 28 27 29 32 116 经方差分析得下表:
变异来源 DF SS MS F 显著F值
平均
x
i
18 23 14 29
x
平方和与自由度的分解 在方差分析中是用样本方差即均方(mean squares)来度量数据资料的变异程度。 将总变异分解为处理间变异和处理内变异,就是要 将总均方分解为处理间均方和处理内均方。
总变异平方和(Total variation): :分解为处理间( between
group variation )变异平方和与处理内(within group variation )变
组间平方和: 组内平方和:
SS T
SS
t
x
C 602
504
Ti n
SS e SS T SS t 602 504 98
1. 总变异: 所有测量值之间总
的变异程度,计算公式
SS总
N
Y ij Y
i 1 j 1
a
ni
2
2
Y C
2 ij i 1 j 1
•
• 其中:P-value —— P 值,为检验中达到的显著 性水平, • 其含义与 t 检验中“P(T<=t)单尾”相同。 • F crit —— 在水平 (默认0.05)下拒绝域的 临界值 F。 • ∵ P-value = 0.00014 < 0.001 • 故不同的促销方式对商品销售额有极高度显著 影响。
异平方和两部分;
总自由度:分解为处理间自由度与处理内自由度两部
分来。
试验数据有三个不同的变异(表 5.1)
总变异: 26 只家兔的血清 ACE 浓度不尽相同, 称为总变异; 组间变异:4 组家兔血清 ACE 浓度的均数各不 相同,称为组间变异; 组内变异:即使同组内的家兔血清 ACE 浓度也 不相同,称为组内变异。
a
ni
Y C= ( N 1) S
2 ij i, j
总 N 1
2
校正系数: C
(
a
Y ij )
N
ni
( Y ij )
i, j
N
2
i 1 j 1
N
SS组间
n i (Yi Y )
2 i 1
ni
a
a
( Y ij )
j 1
ni
2
C
i 1
超市管理部门希望了解: ⑴不同促销方式对销售量是否有显著影响? ⑵哪种促销方式的效果最好?
案例 1 分析 • 可用 SPSS 软件的【工具】 →“analyze”→campare mean“One-Way ANOVA”
Dependent Factor:% Contrasts选项: Post
List:促销方式
多项式比较
Hoc选项: Options选项:Descriptive描述统计量, Homogeneity-of-variance方差齐次性检验, Means plot均值分布图 结果除了方差分析表,还有很多选项相应的结 果 求解单因素方差分析问题。
1. 最小显著差数法(LSD法)
(1) 列出平均数多重比较表 比较表中各
处理按其平均数从大到小自上而下排列; (2)计算最小显著差数 LSD
0 . 05
和
LSD
0 . 01
;
LSD
t
s
x1 x 2
S x i x j 2 MS e / n
MSe为处理间误差方差
ta : 通过附表4:学生
第二节 多重比较
为什么要进行多重比较 怎样进行多重比较 如何表示多重比较的结果 多重比较方法的选择
三、如何表示多重比较的结果
有三种方法: • 标记字母法 • 列梯形表法 • 划线法
1. 标记字母法
例:水稻不同药剂处理的苗高(cm)
药剂 A B C D 苗高观察值 18 20 10 28 21 24 15 27 20 26 17 29 13 22 14 32 总和Ti 72 92 56 116 平均 x i 18 23 14 29
行p为测验极差的平均数个数
2. 新复极差测验(SSR法)
A. 计算LSRα
例:水稻不同药剂处理的苗高(cm)
药剂 苗高观察值 总和Ti 平均 x i
B. 排序
C. 比较
A B C D
18 20 10 28
21 24 15 27
20 26 17 29
13 22 14 32
72 92 56 116
18 23 14 29
药剂处理间 药剂处理内(误差)
总
3 12
15
504 98
602
168.00 8.17
20.56* *
F 0.05(3,12)=3.49 F 0.01(3,12)=5.92
2. 什么叫多重比较
多重比较就是指在 F 测验的前提下,
如果否定了无效假设,只是表明试验的总变
异主要来源于处理间的变异,这也仅仅说明
原创:贾国梅 作者单位:湖北三峡大学
第六章 方差分析ANOVA
(Analysis of Variance)
方差分析的基本原理
多重比较
单向分组资料的方差分析
两向分组资料的方差分析 数据转换
t 检 验 法 只 适用于两个处理平均数间差 异显著性检验。 1、计算工作量大 2、无统一的试验误差,误差估计的精确性和 检验的灵敏度降低 对多个处理平均数进行差异显著性检验,不宜 采用t检验法,须采用方差分析法。
2 3 4
凡两极差≥LSRa,则为在a水平上差异显著; 反之,不显著。
处理 D B A C 平均数 29 23 18 14 P=2 D-B=6* B-A=5* A-C=4 P=3 D-A=11** B-C= 9** P=4 D-C=15**
3. q测验
• 与SSR法相似,唯一区别仅在计算LSRa 时,不是查SSRa,而是查qa(附表7), 查qa后 LSRa=SE· a q 所以不再详述。
第一节 方差分析的基本原理
方差分析是按照设计类型将变量的总变
异分解为若干部分,再通过比较各部分的
变异做出统计推断的检验方法。
• 自由度和平方和(SS)的分解 • F分布与F测验
一、自由度和平方和(SS)的分解
设有k组数据,每组有n个观察值
组别 1
观察值(xij, i=1,2,„,k; j=1,2,„,n)
氏t值表可得到
(3)将平均数多重比较表中两两平均数的差 数与 LSD
0 . 05
、LSD
0 . 01
比较,作出统计推断。
2. 新复极差测验(SSR法) A. 计算LSRα B. 排序 C. 比较
LSRa=SE· a SSR
SE se n
2
或
MS n
e
SSR通过查附表8求得 查表时:列为误差自由度
用离均差平方和(sum of squares of deviations from mean,SS)表示变异的大小
自由度和平方和(SS)的分解
总自由度DFT=组间自由度DFt+组内自由度DFe
总平方和SST=组间平方和SSt+组内平方和SSe
sT
2
总的均方(方差): MS
(x
ij
x)
自由度和平方和的分解
以A、B、C、D四种药剂处理水稻种子,其 中A为对照,每处理各得4个苗高观察值(cm),其 结果列于下表,试分解其平方和与自由度
药剂 A 18 苗高观察值 21 20 13 总和Ti 平均 72 18
x
i
B C D
x
20 10 28
24 15 27
26 17 29
22 14 32
处理 D B A C
平均数 x i 29 23 18 14
2. 新复极差测验(SSR法)
P SSR 0.05
3.08 3.23 3.33
SSR 0.01
4.32 4.55 4.68
LSR 0.05
4.40 4.62 4.76
LSR 0.01
6.18 6.51 6.69
A. 计算LSRα
B. 排序
C. 比较
方差分析结论:
特价销售的效果最好, 买一送一次之,广告宣传 和有奖销售的效果最差, 两者间无显著差异。
第六章
第二节 多重比较
为什么要进行多重比较 怎样进行多重比较 如何表示多重比较的结果 如何选择多重比较的方法
一、为什么要进行多重比较
为什么要进行多重比较
什么叫多重比较
多重比较的优点
92 56 116
23 14 29 T=336
=21
自由度和平方和的分解
总变异自由度:
药剂间自由度:
DFT=(nk-1)=(44)-1=15
DFt=(k-1)=4-1=3
药剂内自由度:
矫正数
C
DFe=k(n-1)=4(4-1)=12
T
2
336
2
nk
4 4
2 ij
2
7056
总的平方和:
各部分偏差平方和除以各自的自由度便可得
到总均方、处理间均方和处理内均方, 分别 记为 MST(或T2 S (或 S e2 )。 即
MS
T
)、MSt(或t2 S
2 ST
)和MSe
SS T / df T
MS
MS
t
e
S
S
2 e
2 t
SS
SS
e
t
/ df
e
t
/ df
注意:总均方不等于处理间均方加处理内均方。
F临界值 F0.05(3,1 2)=3.49 F0.01(3,1 2)=5.95
处理内(误差)
总
12
15
98
602
8.17
F>=F0.05, P<=0.05, 否定H0,处理间差异(极) 显著
【案例1】哪种促销方式效果最好?
• 某大型连锁超市为研究各种促销方式的效果,选 择下属4个门店,分别采用不同促销方式,对包装 食品各进行了4个月的试验。 • 试验结果如下:
2
T
nk 1
n (xi x) 2 k 1
组间的均方(方差): MS t s t 组内的均方(方差): MS e s e
2
2
( x ij x i )
2
k ( n 1)
df df df
T t e
kn 1 k 1 df
T
df
t
均方差,均方(mean square,MS)
进一步的分析
由 SPSS 软件的运行输出结果还可得:
x1
x3
101 . 875 ,
158 . 175
x2
106 . 95
x4
129 . 775
• 由 SPSS 软件的运行输出结果还直接可得 到对各 i 的 t 检验结果如下( =0.05): • 1 2 4 • (广告宣传) 1 • (有奖销售) 2 • (买一送一) 4 * * • (特价销售) 3 * * *
x11 x12 „ x1j „ x1n
总和 平均 均方 T1
x1
x2
s12
2
„ i „ k
x21
„ xi1 „ xk1
x22
„ xi2 „ xk2
„
„ „ „ „
T
x2j
„
„
x2n
„ xin „ xkn
x
T2
„ Ti „ Tk
s22
„ si2 „ sk2
„
x
i
xij
„ „
„
x
k
wenku.baidu.com
xkj
„
x ij
ni
2
S S 组 内 (Yij Yi )
i 1 a j 1 2 i
a
( n i 1) S
i 1
S,为大方差, 处理间方差; S2为小方差, 处理内方差
变异来源 处理间
二、F分布与F测验
F ( 1 ,
2
)
s1 s2
2 2
DF 3
SS 504
MS 168
F 20.56**
了k个处理的平均值有显著差异,但是并不
能说明两两平均数间的显著差异,这就需要
进行多个平均数间的两两比较,即多重比较
3. 多重比较的优点
• 比较的精确度增大了
• 所得到的结论更全面,更可靠了
二、怎样进行多重比较
常用的有: 最小显著差数法(Least significant difference, LSD法) LSD-t检验 (有专业意义的均数间比较) 最小显著极差法(Least significant ranges, LSR法):这个方法是不 同平均数间的比较采用不同的显著差数标准,克服了LSD法的 局限性,用于平均数间的所有相互比较) ☆ 新复极差测验(SSR法)又称Duncan法 (new multiple range method) ☆ SNK-q检验(student Newman Keuls) (多个均数间全面比较)又 q检验 Dunnett检验 (多个实验组与对照组比较) Tukey(真正显著差法HSD: 用单一值作为判断的标准) 、 • 还有Scheffe、 Waller 、BON等比较方法
1. 为什么要进行多重比较?
例:水稻不同药剂处理的苗高(cm) 药剂 苗高观察值 总和Ti A 18 21 20 13 72 B 20 24 26 22 92 C 10 15 17 14 56 D 28 27 29 32 116 经方差分析得下表:
变异来源 DF SS MS F 显著F值
平均
x
i
18 23 14 29
x
平方和与自由度的分解 在方差分析中是用样本方差即均方(mean squares)来度量数据资料的变异程度。 将总变异分解为处理间变异和处理内变异,就是要 将总均方分解为处理间均方和处理内均方。
总变异平方和(Total variation): :分解为处理间( between
group variation )变异平方和与处理内(within group variation )变
组间平方和: 组内平方和:
SS T
SS
t
x
C 602
504
Ti n
SS e SS T SS t 602 504 98
1. 总变异: 所有测量值之间总
的变异程度,计算公式
SS总
N
Y ij Y
i 1 j 1
a
ni
2
2
Y C
2 ij i 1 j 1
•
• 其中:P-value —— P 值,为检验中达到的显著 性水平, • 其含义与 t 检验中“P(T<=t)单尾”相同。 • F crit —— 在水平 (默认0.05)下拒绝域的 临界值 F。 • ∵ P-value = 0.00014 < 0.001 • 故不同的促销方式对商品销售额有极高度显著 影响。
异平方和两部分;
总自由度:分解为处理间自由度与处理内自由度两部
分来。
试验数据有三个不同的变异(表 5.1)
总变异: 26 只家兔的血清 ACE 浓度不尽相同, 称为总变异; 组间变异:4 组家兔血清 ACE 浓度的均数各不 相同,称为组间变异; 组内变异:即使同组内的家兔血清 ACE 浓度也 不相同,称为组内变异。
a
ni
Y C= ( N 1) S
2 ij i, j
总 N 1
2
校正系数: C
(
a
Y ij )
N
ni
( Y ij )
i, j
N
2
i 1 j 1
N
SS组间
n i (Yi Y )
2 i 1
ni
a
a
( Y ij )
j 1
ni
2
C
i 1