第七章 方差分析的学习

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

7.1.3方差分析的原理
方差分析认为,如果控制变量的不同水平对观测变量产生了显著影 响,那么它和随机变量共同作用必然使得观测变量值显著变动;反之, 如果控制变量的不同水平没有对观测变量产生显著影响,那么观测变量 值的变动就不明显,其变动可以归结为随机变量影响造成的。
建立在观测变量各总体服从正态分布和同方差的假设之上,方差 分析的问题就转化为在控制变量不同水平上的观测变量均值是否存在显 著差异的推断问题了。
3、将控制变量选择到Factor框。控制变量有几个不同的取值 表示控制变量有几个水平。
至此,SPSS便自动分解观测变量的方差,计算组间方 差、组内方差、F统计量以及对应的概率p值,完成单因素 方差分析的相关计算,并将结果显示到输出窗口中。
7.2.4 单因素方差分析的应用举例
案例7-1:使用“广告地区与销售额”数据分析广 告形式、地区对销售额是否有显著性影响。某企业 在制订某商品的广告策略时,对不同广告形式在不 同地区的广告效果(销售额)进行了评估。这里以 商品销售额为观测变量,广告形式和地区为控制变 量,通过单因素方差分析方法分别对广告形式、地 区对销售额的影响进行方差分析。
如果进行先验对比检验,则应在Coefficients后依次输
入系数ci,并确保∑ci=0。应注意系数输入的顺序,它将分
别与控制变量的水平值相对应。
7.2.6 单因素方差分析进一步分析应用举例
案例7-2:前面例子中已经利用单因素方差分析分别对广告形 式、地区对销售额的影响进行了分析。分析的结论是不同的广 告形式、不同的地区对销售额有显著影响,下面可作进一步的 分析。
通过对不同广告形式的多重比较分析可知,在 四种广告形式中,宣传品广告的效果是最差的,而 其余三种略有差异。这里,可采用先验对比检验方 法,进一步对报纸广告的效果与广播和体验的整体 效果进行对比分析。
7.3 多因素方差分析
7.3.1多因素方差分析的基本思想
1、定义:多因素方差分析用来研究两个及两个以上控制变量的不同水平 是否对观测变量产生了显著影响。多因素方差分析不仅能够分析多个因 素对观测变量的独立影响,还能够分析多个控制变量的交互作用能否对 观测变量产生显著影响。例如:分析不同品种、不同施肥量是否给农作 物的产量产生显著影响,并进一步研究哪种品种和哪种施肥量是提高农 作物产量的最优组合。
7.2 单因素方差分析
7.2.1单因素方差分析的基本思想
1、定义:单因素方差分析用来研究一个控制变量的不同水平是否对观测 变量产生了显著影响。例如:分析不同施肥量是否给农作物的产量产生 显著影响;研究不同学历是否对工资收入产生显著影响等。
2、观测变量方差的分解
将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和 两部分,分别表示为:
SST SSA SSE
其中,SST为观测变量的总离差平方和;SSA为组间离差平方和,是 由控制变量不同水平造成的观测变量的变差;SSE为组内平方和,是由抽 样误差引起的观测变量的变差。
其中:
k ni
SST (xij x)2 i1 j1
k ni
k
SSA
(xi x)2 ni (xi x)2
第七章
SPSS方差分析
源自文库
本章内容
• 7.1 方差分析概述 • 7.2 单因素方差分析 • 7.3 多因素方差分析 • 7.4 协方差分析
7.1方差分析概述
7.1.1方差分析的作用
在诸多领域的数量分析研究中,找到众多影响因素中重要的影响因 素是非常重要的。比如:在农业生产中,我们总是希望在尽量少的投入 成本下得到较高的农作物产量。这就需要首先分析农作物的产量究竟受 到哪些因素的影响。有许多因素会影响农作物的产量,如种子的品种、 施肥量、气候、地域等,他们都会给农作物的产量带来或多或少的影响 。如果我们能够掌握在众多的影响因素中,哪些因素对农作物的产量起 到了主要的、关键性的作用,我们就可以根据实际情况对这些关键因素 加以控制。
i1 j1
i1
k ni
SSE
(xij xi )2
i1 j 1
3、比较观测变量总离差平方和各部分的比例
在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则 说明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来 解释,即控制变量给观测变量带来了显著影响。
这里我们用F统计量来表示这种比例关系,如果控制变量的不同水平对 观测变量造成了显著影响,那么观测变量总变差中控制变量所占的比例较 大,则F值就比较大;反之,如果控制变量的不同水平对观测变量没有造成 显著影响,那么观测变量总变差中控制变量所占的比例较小,则F值就比较 小。
4、单因素方差分析进一步分析的操作
(1)Option选项
Option选项用来对方差分析的前提条件进行检验 ,并可输出其他相关统计量和对缺失数据进行处理。
Homogeneity of variance test选项实现方差齐 性检验;Descriptive选项输出观测变量的基本描述统 计量;Brown-Forsythe、Welch选项可计算其统计量 以检验各组均值的相等性,当方差齐性不成立时应选择 使用这两个统计量而不是F统计量。Means Plot选项输 出各水平下观测变量均值的折线图;Missing Values 框中提供了两种缺失数据的处理方式。
多重比较检验就是分别对每个水平下的观测变量均值进 行逐对比较,判断两均值之间是否存在显著差异。其零假设 是相应组的均值之间无显著差异。
SPSS提供的多重比较检验的方法比较多,有些方法适 用在各总体方差相等的条件下,有些适用在方差不相等的条 件下。
其中LSD方法适用于各总体方差相等的情况,特点是比 较灵敏;Tukey方法和S-N-K方法适用于各水平下观测变 量个数相等的情况;Scheffe方法比Tukey方法不灵敏。
7.2.3 单因素方差分析的基本操作步骤
在利用SPSS进行单因素方差分析时,应注意数据的组织形式。 SPSS要求定义两个变量分别存放观测变量值和控制变量的水平值。基本 操作步骤如下:
1、选择菜单Analyze-Compare means-One-Way ANOVA,出现窗口
2、将观测变量选择到Dependent List框。
进一步,在掌握关键影响因素,如品种、施肥量因素等之后,我们 还要对不同的品种、不同的施肥量条件下的产量进行对比分析,研究究 竟哪个品种的产量高,施肥量究竟多少最合适,哪种品种与哪种施肥量 搭配最优,等等。在这些分析研究的基础上,我们就可以计算出各个组 合方案的成本和收益,并选择最合理的种植方案,主动的在农作物种植 过程中对各种影响因素加以准确控制,进而获得最理想的效果。
(3)Contrasts选项
Contrasts选项用来实现先验对比检验和趋势检验。
如果进行趋势检验,则应选择Polynomial选项,然后 在后面的下拉框中选择趋势检验的方法。其中Linear表示线 性趋势检验;Quadratic表示进行二次多项式检验;Cubic 表示进行三次多项式检验,4th和5th表示进行四次和五次多 项式检验。
3、其他检验
(1)先验对比检验 如果发现某些水平与另一些水平的均值差距显著,就可
以进一步比较这两组总的均值是否存在显著差异。如有5个水 平,其中x1,x2,x3和x4,x5有显著性差异,就可以比较着 两组均值是否存在显著性差异,即(x1+x2+x3)/3与 (x4+x5)/2是否有差异。令 c1=1/3,c2=1/3,c3=1/3, c4=1/2, c5=1/2, 且
2、控制变量的不同水平:控制变量的不同取值或水平,称为控制变量的不 同水平。如甲品种、乙品种;10公斤化肥、20公斤化肥、30公斤化肥等。
3、观测变量:受控制变量和随机变量影响的变量称为观测变量,如农作物 的产量等。
方差分析就是从观测变量的方差入手,研究诸多控制变量中哪些变量 是对观测变量有显著影响的变量以及对观测变量有显著影响的各个控制变 量其不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法 。
(2)Post Hoc选项
Post Hoc选项用来实现多重比较检验。
提供了18种多重比较检验的方法。其中Equal Variances Assumed框中的方法适用于各水平方差齐性 的情况。在方差分析中,由于其前提所限,应用中多采用 Equal Variances Assumed框中的方法。多重比较检验 中,SPSS默认的显著性水平为0.05,可以根据实际情 况修改Significance level后面的数值以进行调整。
SPSS单因素方差分析中,方差齐性检验采用了方差同 质性(Homogeneity of Variance)的检验方法,其零 假设是各水平下观测变量总体方差无显著性差异,实现思路 同SPSS两独立样本t检验中的方差齐性检验。
2、多重比较检验
上面的基本分析可以判断控制变量是否对观测变量产生了 显著影响。如果控制变量确实对观测变量产生了显著影响, 进一步还应确定,控制变量的不同水平对观测变量的影响程 度如何,其中哪个水平的作用明显大于其它水平,哪些水平 的作用是不显著的。例如已经确定不同施肥量会对农作物的 产量产生显著影响,便希望进一步了解究竟是10公斤、20 公斤还是30公斤施肥量最有利于提高产量,哪种施肥量对农 作物产量没有显著影响。掌握了这些信息,我们就能够制定 合理的施肥方案。
F SSA /(k 1) MSA ~ F(k 1, n k) SSE /(n k) MSE
7.2.2 单因素方差分析的基本步骤
• 提出原假设:控制变量不同水平下观测变量各总体的均
值无显著差异
• 计算检验统计量和概率P值
F SSA /(k 1) MSA SSE /(n k) MSE
给定显著性水平与p值做比较:如果p值小于显著性水平 ,则应该拒绝原假设,反之就不能拒绝原假设。
∑ci=0 。则推断∑ci xi =0的和是否为0.
在检验中,SPSS根据用户确定的各均值的系数,再对 其线性组合进行检验,来判断各相似性子集间均值的差异程 度。
(2)趋势检验
当控制变量为定序变量时,趋势检验能够分析随着控 制变量水平的变化,观测变量值变化的总体趋势是怎样的 ,是呈现线性趋势,还是呈二次、三次等多项式变化。
1、方差齐性检验
不同广告形式、不同地区下销售额总体方差是否相同,是 否满足单因素方差分析的前提要求,是应首先检验的问题。
2、多重比较检验
总体上讲,不同广告形式对产品的销售额有显 著影响,那么究竟哪种广告形式的作用较明显哪种 不明显,这些问题可通过多重比较检验实现。同理 ,可对商品在不同地区的销售额情况进行分析。( 采用LSD,Bonferroni,Tukey,Scheffe, S-N-K五种方法)
7.1.2相关概念
1、影响因素的分类:在所有的影响因素中根据是否可以人为控制可以分为 两类,一类是人为可以控制的因素,称为控制因素或控制变量,如种子品 种的选定,施肥量的多少;另一类因素是认为很难控制的因素,称为随机 因素或随机变量,如气候和地域等影响因素。在很多情况下随机因素指的 是实验过程中的抽样误差。
综上所述,方差分析从对观测变量的方差分解入手,通过推断控 制变量各水平下各观测变量的均值是否存在显著差异,分析控制变量是 否给观测变量带来了显著影响,进而再对控制变量各个水平对观测变量 影响的程度进行剖析。
根据控制变量的个数可将方差分析分为单因素方差分析、多因素 方差分析;根据观测变量的个数可将方差分析分为一元方差分析(单因 变量方差分析)和多元方差分析(多因变量方差分析)。
3、趋势检验
通过上面的分析,可以清楚地掌握不同地区的销售情况 。这里,如果假定不同地区的差异表现在人口密度方面(地 区编号小的人口密度高,地区编号大的人口密度低),那么 进一步可分析不同地区销售额总体上是否会随着地区人口密 度的减少而呈现出某种趋势性的变化规律,进而为市场细分 提供依据。
4、先验对比检验
单因素方差分析结果
• 广告形式对销售额的单因素方差分析结果
• 地区对销售额的单因素方差分析结果
7.2.5 单因素方差分析的进一步分析
1、方差齐性检验
由于方差分析的前提是各水平下的总体服从正态分布并 且方差相等,因此有必要对方差齐性进行检验,即对控制变 量不同水平下各观测变量不同总体方差是否相等进行分析。
相关文档
最新文档