第六章 SPSS方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、明确观测变量和控制变量 单因素方差分析的第一步是明确观测变量和控制变量。 2、剖析观测变量的方差 单因素方差分析的第二步是剖析观测变量的方差。
SST(观测变量总离差平方和)=SSA(组间差离差平方和)+ SSE(组内离差平方和)
二、单因素方差分析的基本步骤
1、提出原假设 单因素方差分析的原假设H0是:控制变量不同水平下观
原假设分别为: 不同广告形式没有对销售额产生显著影响 不同地区的销售额没有显著差异
SPSS单因素方差分析的基本操作步骤: (1)选择菜单:【分析】-【比较均值】-【单因素ANOVA】
(2)选择观测变量到【因变量列表】 (3)选择控制变量到【因子】(自变量)。
ANOVA(广告形式对销售额的单因素的方差分析结果) 销售额
测变量各总体的均值无显著差异,控制变量不同水平下的效 应同时为0,记为:a1 a2 ak 0。 意味着控制变量不同水平的变化没有对观测变量产生显著影响。
2、选择检验统计量
方差分析采用的检验统计量是F统计量
3、计算检验统计量的观测值和概率P-值
4、给定显著性水平α,并做出决策
P< α,拒绝原假设,控制变量的不同水平对观测变量产生了显著影响
Descriptives(不同地区销售额的基本描述统计量及95%置信区间)
95% Confidence Interval for Mean
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
1.00 8 60.0000
95% Confidence Interval for Mean
Lower Bound
Upper Bound Minimum Maximum
69.9287 76.5157 54.00
94.00
66.5013 75.2765 33.00 100.00
52.6243 60.4868 33.00
86.00
1、方差齐性检验 方差齐性检验:是对控制变量不同各水平下观测变量总体方 差是否相等进行分析。
SPSS单因素方差分析中,方差齐性检验采用了方差同质性 (Homogeneity of Variance)的检验方法。
原假设是:各水平下观测变量总体方差无显著性差异,实 现思路同SPSS两独立样本t检验中的方差齐性检验。
10.98050 3.88219
50.8201
69.1799
41.00
75.00
2.00 8 64.3750
13.50066 4.77320
53.0882
75.6618
44.00
82.00
3.00 8 81.0000
Байду номын сангаас
10.98050 3.88219
71.8201
90.1799
61.00
100.00
4.00 8 79.2500
1、方差齐性检验 不同广告形式、不同地区下销售额总体方差是否相同,是否 满足单因素方差分析的前提要求,是应首先检验的问题。
SPSS进行方差齐性检验的基本操作步骤: (1)在【单因素方差分析】窗口中按【选项】按钮
输出观测变量的基本描述统计量 固定效应和随机效应模型的标准差、标准误 和95%的置信区间及方差成分间的估计值
(2)Bonferroni方法 Bonferroni方法与LSD方法基本相同。不同的是Bonferroni对
范一类错误的概率进行了控制。
(3)Tukey方法 Tukey方法与LSD方法有所不同,仅适用于各水平下观测值 个数相等的条件,这点比LSD方法要求苛刻。与LSD方法相比 ,Tukey方法对范一类错误概率的问题给予了较为有效的处理 。适用于各总体方差相等的情况。
表示实现方差齐性检验
计算分组均数相等的统计量,当不能把握方差 齐性假设时,此统计量比F统计量更有优势
输出各水平下观测变量均值的折线图 提供了两种缺失数据的处理方式
Descriptives(不同广告形式下销售额的基本描述统计量即95%置信区间)
销售额
Std.
Std.
N Mean Deviation Error
7.55456 2.67094
72.9342
85.5658
66.00
90.00
5.00 8 72.6250
8.73315 3.08763
65.3239
79.9261
57.00
87.00
6.00 8 66.3750 7.00 8 58.7500 8.00 8 73.3750
8.63444 17.29368 9.10161
常用的几个检验统计量
(1)LSD方法(Least Significant Difference)
LSD方法称为最小显著性差异法。其字面就体现了其检 验敏感性高的特点,即水平间的均值只要存在一定程度的微 小差异就可能被检验出来。它利用全部观测变量值,而非仅 使用某两组的数据。
LSD方法使用于各总体方差相等的情况,但它并没有对 范一类错误的概率问题加以有效控制。
(4)Scheffe方法 与Tukey法相比,Scheffe法不如它灵敏。
(5)S-N-K方法(Student Newman-Keuls)
S-N-K方法是一种有效划分相似性子集的方法。该方法适合 于各水平观测值个数相等的情况。
3、其他检验 (1)先验对比检验 在多重比较检验中,如果发现某些水平与另一些水平的均值 差距显著,就可以进一步比较这两组总的均值是否存在显著差 异。在检验中,SPSS根据用户确定的各均值的系数,再对其线 性组合进行检验,来判断各相似性子集间均值的差异程度。
第七章
SPSS方差分析
本章内容
• 6.1 方差分析概述 • 6.2 单因素方差分析 • 6.3 多因素方差分析 • 6.4 协方差分析
6.1方差分析概述
方差分析:是从观测变量的方差入手,研究诸多控制变量中 哪些变量是对观测变量有显著影响的变量。对观测变量有显著 影响的各个控制变量其不同水平以及各水平的交互搭配是如何 影响观测变量的。
Levene Statistic
df1
df2
Sig.
1.459
17
126
.121
2、多重比较检验 不同广告形式对产品的销售额有显著影响,那么究竟哪种
广告形式的作用较明显哪种不明显,这些问题可通过多重比较 检验实现。同理,可对商品在不同地区的销售额情况进行分析. (采用LSD,Bonferroni,Tukey,Scheffe,S-N-K五种方法)
P> α,接受原假设,控制变量的不同水平对观测变量没有产生显著影响
三、单因素方差分析的应用举例
案例:某企业在制定某商品的广告策略时,收集了该商品在不 同地区采用不同广告形式促销后的销售额数据,希望对广告形式 和地区是否对商品销售额产生影响进行分析。文件名“广告地区 与销售额”。
分析:这里以商品销售额为观测变量,广告形式和地区为控制 变量,通过单因素方差分析方法分别对广告形式、地区对销售额 的影响进行方差分析。
方差分析对观测变量各总体的分布还有以下两个基本假设前提: ➢观测变量各总体应服从正态分布。(不是非常严格) ➢观测变量各总体的方差应相同。(严格)
6.2 单因素方差分析
一、单因素方差分析的基本思想 单因素方差分析用来研究一个控制变量的不同水平是否
对观测变量产生了显著影响。由于仅研究单个因素对观测变 量的影响,因此称为单因素方差分析。
40.00 61.00 40.00 51.00 42.00 52.00 50.00 44.00 37.00
73.00 100.00
70.00 86.00 87.00 77.00 83.00 81.00 73.00
Test of Homogeneity of Variances(不同地区方差齐性检验结果) 销售额
那么如何判断控制变量的不同水平上观测变量值是否产 生了明显波动呢?
判断的原则:
如果控制变量各水平下的观测变量总体的分布出现了显著 差异,则认为观测变量值发生了明显的波动,意味着控制变 量的不同水平对观测变量产生了显著影响;反之,如果控制 变量值没有发生明显波动,意味着控制变量的不同水平对观 测变量没有产生显著影响。
Sum of Squares df Mean Square F Sig.
Between Groups 5866.083
3 1955.361 13.483 .000
Within Groups 20303.222 140 145.023
Total
26169.306 143
ANOVA(地区对销售额的单因素方差分析结果) 销售额
8 57.6250 8 77.7500 8 52.2500 8 69.7500 8 67.0000 8 64.1250 8 67.0000 8 69.2500 8 53.8750
11.18593 14.50862 10.49830 10.02497 15.89250 7.67998 11.25040 14.31034 11.74050
62.0442 71.1781 37.00
87.00
64.5911 69.0478 33.00 100.00
Test of Homogeneity of Variances(不同广告形式下方差齐性检验结果) 销售额
Levene Statistic
df1
df2
Sig.
.765
3
140
.515
销售额
(2)趋势检验
当控制变量为定序变量时,趋势检验能够分析随着控制变量 水平的变化,观测变量值变化的总体趋势是怎样的,是呈线性 变化趋势,还是呈二次、三次等多项式变化。通过趋势检验, 能够帮助人们从另外一个角度把握控制变量不同水平对观测变 量总体作用的程度。
五、单因素方差分析应用举例的进一步分析
在案例广告地区与销售额中,利用单因素方差分析分别对广 告形式、地区对销售额的影响进行了分析。分析的结论是不同 的广告形式、不同的地区对某产品的销售额有显著影响。进一 步希望研究,究竟哪种广告形式的作用较明显,哪种不明显,以 及地区和销售额之间的关系等。
3.95482 5.12957 3.71171 3.54436 5.61885 2.71528 3.97762 5.05947 4.15089
48.2733 65.6205 43.4732 61.3689 53.7135 57.7044 57.5944 57.2863 44.0597
66.9767 89.8795 61.0268 78.1311 80.2865 70.5456 76.4056 81.2137 63.6903
3.05274 6.11424 3.21790
59.1564 44.2921 65.7659
73.5936 73.2079 80.9841
52.00 33.00 61.00
77.00 76.00 86.00
9.00 10.00 11.00 12.00 13.00 14.00 15.00 16.00 17.00
报纸 36 73.2222 9.73392 1.62232
广播 36 70.8889 12.96760 2.16127
宣传品 36 56.5556 11.61881 1.93647
体验 36 66.6111 13.49768 2.24961
Total 144 66.8194 13.52783 1.12732
Sum of Squares df Mean Square F Sig.
Between Groups 9265.306 17 545.018 4.062 .000
Within Groups 16904.000 126 134.159
Total
26169.306 143
四、单因素方差分析的进一步分析
2、多重比较检验 如果控制变量确实对观测变量产生了显著影响,进一步还 应确定,控制变量的不同水平对观测变量的影响程度如何,其 中哪个水平的作用明显大于其它水平,哪些水平的作用是不显 著的。
多重比较检验利用了全部观测变量值,实现对各个水平下 观测变量总体均值的逐对比较。
多重比较检验的原假设是:相应水平下观测变量的均值间不 存在显著差异。
方差分析认为控制变量值的变化受两类因素的影响:
第一类:是控制因素(控制变量)不同水平所产生的影响; 第二类:是随机因素(随机变量)所产生的影响。
随机因素:是指那些人为很难控制的因素,主要指试验过 程中的抽样误差。
方差分析认为:如果控制变量的不同水平对观测变量产 生了显著影响,那么,它和随机变量共同作用必然使得观测 变量值有显著变动;反之,如果控制变量的不同水平没有对 观测变量产生显著影响,那么观测变量值的变动就不会明显 地表现出来,其变动可以归结为随机变量影响造成的。
SST(观测变量总离差平方和)=SSA(组间差离差平方和)+ SSE(组内离差平方和)
二、单因素方差分析的基本步骤
1、提出原假设 单因素方差分析的原假设H0是:控制变量不同水平下观
原假设分别为: 不同广告形式没有对销售额产生显著影响 不同地区的销售额没有显著差异
SPSS单因素方差分析的基本操作步骤: (1)选择菜单:【分析】-【比较均值】-【单因素ANOVA】
(2)选择观测变量到【因变量列表】 (3)选择控制变量到【因子】(自变量)。
ANOVA(广告形式对销售额的单因素的方差分析结果) 销售额
测变量各总体的均值无显著差异,控制变量不同水平下的效 应同时为0,记为:a1 a2 ak 0。 意味着控制变量不同水平的变化没有对观测变量产生显著影响。
2、选择检验统计量
方差分析采用的检验统计量是F统计量
3、计算检验统计量的观测值和概率P-值
4、给定显著性水平α,并做出决策
P< α,拒绝原假设,控制变量的不同水平对观测变量产生了显著影响
Descriptives(不同地区销售额的基本描述统计量及95%置信区间)
95% Confidence Interval for Mean
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
1.00 8 60.0000
95% Confidence Interval for Mean
Lower Bound
Upper Bound Minimum Maximum
69.9287 76.5157 54.00
94.00
66.5013 75.2765 33.00 100.00
52.6243 60.4868 33.00
86.00
1、方差齐性检验 方差齐性检验:是对控制变量不同各水平下观测变量总体方 差是否相等进行分析。
SPSS单因素方差分析中,方差齐性检验采用了方差同质性 (Homogeneity of Variance)的检验方法。
原假设是:各水平下观测变量总体方差无显著性差异,实 现思路同SPSS两独立样本t检验中的方差齐性检验。
10.98050 3.88219
50.8201
69.1799
41.00
75.00
2.00 8 64.3750
13.50066 4.77320
53.0882
75.6618
44.00
82.00
3.00 8 81.0000
Байду номын сангаас
10.98050 3.88219
71.8201
90.1799
61.00
100.00
4.00 8 79.2500
1、方差齐性检验 不同广告形式、不同地区下销售额总体方差是否相同,是否 满足单因素方差分析的前提要求,是应首先检验的问题。
SPSS进行方差齐性检验的基本操作步骤: (1)在【单因素方差分析】窗口中按【选项】按钮
输出观测变量的基本描述统计量 固定效应和随机效应模型的标准差、标准误 和95%的置信区间及方差成分间的估计值
(2)Bonferroni方法 Bonferroni方法与LSD方法基本相同。不同的是Bonferroni对
范一类错误的概率进行了控制。
(3)Tukey方法 Tukey方法与LSD方法有所不同,仅适用于各水平下观测值 个数相等的条件,这点比LSD方法要求苛刻。与LSD方法相比 ,Tukey方法对范一类错误概率的问题给予了较为有效的处理 。适用于各总体方差相等的情况。
表示实现方差齐性检验
计算分组均数相等的统计量,当不能把握方差 齐性假设时,此统计量比F统计量更有优势
输出各水平下观测变量均值的折线图 提供了两种缺失数据的处理方式
Descriptives(不同广告形式下销售额的基本描述统计量即95%置信区间)
销售额
Std.
Std.
N Mean Deviation Error
7.55456 2.67094
72.9342
85.5658
66.00
90.00
5.00 8 72.6250
8.73315 3.08763
65.3239
79.9261
57.00
87.00
6.00 8 66.3750 7.00 8 58.7500 8.00 8 73.3750
8.63444 17.29368 9.10161
常用的几个检验统计量
(1)LSD方法(Least Significant Difference)
LSD方法称为最小显著性差异法。其字面就体现了其检 验敏感性高的特点,即水平间的均值只要存在一定程度的微 小差异就可能被检验出来。它利用全部观测变量值,而非仅 使用某两组的数据。
LSD方法使用于各总体方差相等的情况,但它并没有对 范一类错误的概率问题加以有效控制。
(4)Scheffe方法 与Tukey法相比,Scheffe法不如它灵敏。
(5)S-N-K方法(Student Newman-Keuls)
S-N-K方法是一种有效划分相似性子集的方法。该方法适合 于各水平观测值个数相等的情况。
3、其他检验 (1)先验对比检验 在多重比较检验中,如果发现某些水平与另一些水平的均值 差距显著,就可以进一步比较这两组总的均值是否存在显著差 异。在检验中,SPSS根据用户确定的各均值的系数,再对其线 性组合进行检验,来判断各相似性子集间均值的差异程度。
第七章
SPSS方差分析
本章内容
• 6.1 方差分析概述 • 6.2 单因素方差分析 • 6.3 多因素方差分析 • 6.4 协方差分析
6.1方差分析概述
方差分析:是从观测变量的方差入手,研究诸多控制变量中 哪些变量是对观测变量有显著影响的变量。对观测变量有显著 影响的各个控制变量其不同水平以及各水平的交互搭配是如何 影响观测变量的。
Levene Statistic
df1
df2
Sig.
1.459
17
126
.121
2、多重比较检验 不同广告形式对产品的销售额有显著影响,那么究竟哪种
广告形式的作用较明显哪种不明显,这些问题可通过多重比较 检验实现。同理,可对商品在不同地区的销售额情况进行分析. (采用LSD,Bonferroni,Tukey,Scheffe,S-N-K五种方法)
P> α,接受原假设,控制变量的不同水平对观测变量没有产生显著影响
三、单因素方差分析的应用举例
案例:某企业在制定某商品的广告策略时,收集了该商品在不 同地区采用不同广告形式促销后的销售额数据,希望对广告形式 和地区是否对商品销售额产生影响进行分析。文件名“广告地区 与销售额”。
分析:这里以商品销售额为观测变量,广告形式和地区为控制 变量,通过单因素方差分析方法分别对广告形式、地区对销售额 的影响进行方差分析。
方差分析对观测变量各总体的分布还有以下两个基本假设前提: ➢观测变量各总体应服从正态分布。(不是非常严格) ➢观测变量各总体的方差应相同。(严格)
6.2 单因素方差分析
一、单因素方差分析的基本思想 单因素方差分析用来研究一个控制变量的不同水平是否
对观测变量产生了显著影响。由于仅研究单个因素对观测变 量的影响,因此称为单因素方差分析。
40.00 61.00 40.00 51.00 42.00 52.00 50.00 44.00 37.00
73.00 100.00
70.00 86.00 87.00 77.00 83.00 81.00 73.00
Test of Homogeneity of Variances(不同地区方差齐性检验结果) 销售额
那么如何判断控制变量的不同水平上观测变量值是否产 生了明显波动呢?
判断的原则:
如果控制变量各水平下的观测变量总体的分布出现了显著 差异,则认为观测变量值发生了明显的波动,意味着控制变 量的不同水平对观测变量产生了显著影响;反之,如果控制 变量值没有发生明显波动,意味着控制变量的不同水平对观 测变量没有产生显著影响。
Sum of Squares df Mean Square F Sig.
Between Groups 5866.083
3 1955.361 13.483 .000
Within Groups 20303.222 140 145.023
Total
26169.306 143
ANOVA(地区对销售额的单因素方差分析结果) 销售额
8 57.6250 8 77.7500 8 52.2500 8 69.7500 8 67.0000 8 64.1250 8 67.0000 8 69.2500 8 53.8750
11.18593 14.50862 10.49830 10.02497 15.89250 7.67998 11.25040 14.31034 11.74050
62.0442 71.1781 37.00
87.00
64.5911 69.0478 33.00 100.00
Test of Homogeneity of Variances(不同广告形式下方差齐性检验结果) 销售额
Levene Statistic
df1
df2
Sig.
.765
3
140
.515
销售额
(2)趋势检验
当控制变量为定序变量时,趋势检验能够分析随着控制变量 水平的变化,观测变量值变化的总体趋势是怎样的,是呈线性 变化趋势,还是呈二次、三次等多项式变化。通过趋势检验, 能够帮助人们从另外一个角度把握控制变量不同水平对观测变 量总体作用的程度。
五、单因素方差分析应用举例的进一步分析
在案例广告地区与销售额中,利用单因素方差分析分别对广 告形式、地区对销售额的影响进行了分析。分析的结论是不同 的广告形式、不同的地区对某产品的销售额有显著影响。进一 步希望研究,究竟哪种广告形式的作用较明显,哪种不明显,以 及地区和销售额之间的关系等。
3.95482 5.12957 3.71171 3.54436 5.61885 2.71528 3.97762 5.05947 4.15089
48.2733 65.6205 43.4732 61.3689 53.7135 57.7044 57.5944 57.2863 44.0597
66.9767 89.8795 61.0268 78.1311 80.2865 70.5456 76.4056 81.2137 63.6903
3.05274 6.11424 3.21790
59.1564 44.2921 65.7659
73.5936 73.2079 80.9841
52.00 33.00 61.00
77.00 76.00 86.00
9.00 10.00 11.00 12.00 13.00 14.00 15.00 16.00 17.00
报纸 36 73.2222 9.73392 1.62232
广播 36 70.8889 12.96760 2.16127
宣传品 36 56.5556 11.61881 1.93647
体验 36 66.6111 13.49768 2.24961
Total 144 66.8194 13.52783 1.12732
Sum of Squares df Mean Square F Sig.
Between Groups 9265.306 17 545.018 4.062 .000
Within Groups 16904.000 126 134.159
Total
26169.306 143
四、单因素方差分析的进一步分析
2、多重比较检验 如果控制变量确实对观测变量产生了显著影响,进一步还 应确定,控制变量的不同水平对观测变量的影响程度如何,其 中哪个水平的作用明显大于其它水平,哪些水平的作用是不显 著的。
多重比较检验利用了全部观测变量值,实现对各个水平下 观测变量总体均值的逐对比较。
多重比较检验的原假设是:相应水平下观测变量的均值间不 存在显著差异。
方差分析认为控制变量值的变化受两类因素的影响:
第一类:是控制因素(控制变量)不同水平所产生的影响; 第二类:是随机因素(随机变量)所产生的影响。
随机因素:是指那些人为很难控制的因素,主要指试验过 程中的抽样误差。
方差分析认为:如果控制变量的不同水平对观测变量产 生了显著影响,那么,它和随机变量共同作用必然使得观测 变量值有显著变动;反之,如果控制变量的不同水平没有对 观测变量产生显著影响,那么观测变量值的变动就不会明显 地表现出来,其变动可以归结为随机变量影响造成的。