第五讲 连续变量的参数检验:方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS提供的多重比较检验的方法比较多,有些方法 适用在各总体方差相等的条件下,有些适用在方差不相 等的条件下。 其中LSD方法适用于各总体方差相等的情况,特点是 比较灵敏; Tukey方法和S-N-K方法适用于各水平下观测变量个 数相等的情况; Scheffe方法比Tukey方法不灵敏。
3、其他检验
四、单因素方差分析的进一步分析
1、方差齐性检验
由于方差分析的前提是各水平下的总体服从 正态分布并且方差相等,因此有必要对方差齐性 进行检验,即对控制变量不同水平下各观测变量 不同总体方差是否相等进行分析。 SPSS单因素方差分析中,方差齐性检验采 用了方差同质性(Homogeneity of Variance) 的检验方法,其零假设是各水平下观测变量总体 方差无显著性差异,实现思路同SPSS两独立样 本t检验中的方差齐性检验。
第五讲 方差分析
本章内容
第一节 方差分析概述
第二节 单因素方差分析 第三节 多因素方差分析 第四节 协方差分析
第一节 方差分析概述
Βιβλιοθήκη Baidu
一、方差分析的含义和作用 方差分析(Analysis of Variance,ANOVA) 是研究分类变量(定类和定序变量)对数值型 因变量影响时所使用的统计分析方法。 方差分析是R.A.Fister发明的,广泛应用于心 理学、生物学、管理学、工程和医药领域的实 验数据分析。 方差分析:是检验多个样本平均数间差异是否 有统计意义的一种方法。
广告形式对销售额的单因素方差分析表
分析结果表明:F统计量的观测值为13.483,对应的概率P值近似为0, 小于给定的显著性水平0.05。 因此,应该拒绝原假设,认为不同广告形式对销售额产生了显著影响。
类似上面的步骤,可以进行地区对销售额的影 响:
地区对销售额的单因素方差分析结果
分析结果表明:F统计量的观测值为4.062,对应的概率P值近似为0, 小于给定的显著性水平0.05。 因此,应该拒绝原假设,认为不同地区对销售额产生了显著影响。
输出结果:
从不同的检验结果可以看出,在显著性水平为0.05的条件下,报纸广告只与 宣传品广告有显著差异,而与体验、广播无显著差异。
广告形式多重比较检验的相似性子集
分析:可以看到表中三种方法划分的子集结果是一致的。在显著性水平为0.05的 情况下,首先观察S-N-K方法,宣传品组(均值为55.5556)与其他三组均值有显著 不同(其相似的可能性小于0.05),被划分出来,形成两个相似性子集。 在第一个子集中(只有宣传品),组内相似的概率为1,第二组组内相似的概率大于 0.05(为0.055)。其他各组的分析类推。 总之,如果从获得高销售额的角度选择广告形式,不应选择宣传品的形式,可考 虑在其他三种形式中选择一种低成本或操作性强的广告。
五、单因素方差分析的进一步应用举例
前面例子中已经利用单因素方差分析分别对广 告形式、地区对销售额的影响进行了分析。分 析的结论是不同的广告形式、不同的地区对销 售额有显著影响,下面可作进一步的分析。
1、方差齐性检验 不同广告形式、不同地区下销售额总体方差是否 相同,是否满足单因素方差分析的前提要求,是应首 先检验的问题。
不同广告形式下销售额基本描述统计量及95%置信区间
不同广告形式下方差齐性检验
结果表明,不同广告形式下销售额的方差齐性检验值为0.765,概率P值为0.515, 大于给定的显著性水平0.05,不能拒绝原假设,认为不同广告形式下销售额方差 无显著差异。
不同广告形式下均值折线图
2、多重比较检验 总体上讲,不同广告形式对产品的销售额有显著影响,那么究竟哪 种广告形式的作用较明显哪种不明显,这些问题可通过多重比较检验 实现。同理,可对商品在不同地区的销售额情况进行分析。(采用 LSD,Bonferroni,Tukey,Scheffe,S-N-K五种方法)
SSA /( k 1) MSA F ~ F (k 1, n k ) SSE /( n k ) MSE
二、单因素方差分析的基本步骤
三、单因素方差分析的SPSS实现
例:某企业在制订某商品的广告策略时,对不 同广告形式在不同地区的广告效果(销售额) 进行了评估。这里以商品销售额为观测变量, 广告形式和地区为控制变量,通过单因素方差 分析方法分别对广告形式、地区对销售额的影 响进行方差分析。 文件名:广告地区与销售额.sav
三、方差分析的适用条件
1、样本来自的总体服从正态分布。 2、样本方差必须是齐次的。 3、各样本之间相互独立。
方差分析的类型
第二节 单因素方差分析
一、单因素方差分析的原理
于是有:
yij i ij
提出原假设,H0: 1 2 k 备择假设, H1:至少有一个 i 0
0
单因素方差分析
将观测变量总的离差平方和分解为组间离差平方和和组内离 差平方和两部分,分别表示为:
SST SSA SSE
其中,SST为观测变量的总离差平方和;SSA为组间离差 平方和,是由控制变量不同水平造成的观测变量的变差;SSE 为组内平方和,是由抽样误差(随机变量)引起的观测变量 的变差。
例:土壤、日照、施肥等对农作物产量的影响
例:方差分析:分析分类型自变量对数值型因 变量的影响。
三种饲料的效果相同吗:
如果不考虑喂养前体重的影响,则:
二、方差分析的基本概念
1、影响因素的分类:控制因素和随机因素 控制因素或控制变量:是人为可以控制的因素,如种子品种的选 定,施肥量的多少; 随机因素或随机变量:另一类因素是认为很难控制的因素,如气 候和地域等影响因素。在很多情况下随机因素指的是实验过程中的 抽样误差。 2、控制变量的不同水平:控制变量的不同取值或水平,称为控制 变量的不同水平。如甲品种、乙品种;10公斤化肥、20公斤化肥、 30公斤化肥等。 3、观测变量:受控制变量和随机变量影响的变量称为观测变量, 如农作物的产量等。 4、方差分析:方差分析就是从观测变量的方差入手,研究诸多控 制变量中哪些变量是对观测变量有显著影响的变量以及对观测变 量有显著影响的各个控制变量其不同水平以及各水平的交互搭配 是如何影响观测变量的一种分析方法
SPSS中单因素方差分析的进一步检验
(1)”对比“选项 Contrasts选项用来实现先验对比检验和趋势检验。 如果进行趋势检验,则应选择Polynomial选项,然后在后 面的下拉框中选择趋势检验的方法。其中Linear表示线性趋势检 验;Quadratic表示进行二次多项式检验;Cubic表示进行三次 多项式检验,4th和5th表示进行四次和五次多项式检验。 如果进行先验对比检验,则应在Coefficients后依次输入 系数ci,并确保∑ci=0。应注意系数输入的顺序,它将分别与控 制变量的水平值相对应。
式中:
SST为观测变量的总离差平方和; SSA、SSB分别为控制变量A、B独立作用引起的变差,又称主效应 (Main effects); SSAB为两个控制变量各个水平两两相互组合对观测变量的影响,又称多 向交互影响效应(N-WAY); SSE为随机因素引起的变差。
二、多因素方差分析的基本思路:
认为观测变量的变动是由各控制变量独立作用、它们的交互作用、以 及随机因素造成的。 基于上述原则,多因素方差分析将观测变量的总变差分解为(以两个 控制变量的方差分析为例):
SST=SSA+SSB+SSAB+SSE
(main effects) (N-way 交互) (Residual) (explained)
第三节 多因素方差分析
一、多因素方差分析的基本思想
定义:多因素方差分析用来研究两个及两个以上控制变量的 不同水平是否对观测变量产生了显著影响。 多因素方差分析不仅能够分析多个因素对观测变量的独立影 响,还能够分析多个控制变量的交互作用能否对观测变量产 生显著影响。 例如:分析不同品种、不同施肥量是否给农作物的产量产生 显著影响,并进一步研究哪种品种和哪种施肥量是提高农作 物产量的最优组合。 再如:上节应用案例中,分析发现不同广告形式对产品销售 额有显著影响,不同地区的产品销售额存在显著差异,进一 步还可以通过不同广告形式和不同地区的搭配是否对销售额 产生影响、以及哪种搭配方式可获得最理想的销售业绩等。
2、多重比较检验
上面的基本分析可以判断控制变量是否对观测变量产 生了显著影响。如果控制变量确实对观测变量产生了显 著影响,进一步还应确定,控制变量的不同水平对观测 变量的影响程度如何,其中哪个水平的作用明显大于其 它水平,哪些水平的作用是不显著的。例如已经确定不 同施肥量会对农作物的产量产生显著影响,便希望进一 步了解究竟是10公斤、20公斤还是30公斤施肥量最有利 于提高产量,哪种施肥量对农作物产量没有显著影响。 掌握了这些信息,我们就能够制定合理的施肥方案。 多重比较检验就是分别对每个水平下的观测变量均值 进行逐对比较,判断两均值之间是否存在显著差异。其 零假设是相应组的均值之间无显著差异。
将观测变量选择到Dependent List框。 将控制变量选择到Factor框。控制变量有几个不同的取值表示 控制变量有几个水平。 至此,SPSS便自动分解观测变量的方差,计算组间方差、组 内方差、F统计量以及对应的概率p值,完成单因素方差分析的 相关计算,并将结果显示到输出窗口中。
SPSS输出结果:
(2)两两比较选项:用来实现多重比较检验。
提供了18种多重比较检验的方法。其中: Equal Variances Assumed框中的方法适用于各水平方差齐性 的情况。在方差分析中,由于其前提所限,应用中多采用Equal Variances Assumed框中的方法。 多重比较检验中,SPSS默认的显著性水平为0.05,可以根据实 际情况修改Significance level后面的数值以进行调整。
(1)先验对比检验 如果发现某些水平与另一些水平的均值差距显著,就 可以进一步比较这两组总的均值是否存在显著差异。在 检验中,SPSS根据用户确定的各均值的系数,再对其线 性组合进行检验,来判断各相似性子集间均值的差异程 度。 (2)趋势检验 当控制变量为定序变量时,趋势检验能够分析随着控 制变量水平的变化,观测变量值变化的总体趋势是怎样 的。
(3)Option选项
Option选项用来对方差分析的前提条件 进行检验,并可输出其他相关统计量和对 缺失数据进行处理。 Homogeneity of variance test选项实 现方差齐性检验; Descriptive选项输出观测变量的基本描 述统计量; Brown-Forsythe、Welch选项可计算其 统计量以检验各组均值的相等性,当方差 齐性不成立时应选择使用这两个统计量而 不是F统计量。 Means Plot选项输出各水平下观测变量 均值的折线图; Missing Values框中提供了两种缺失数 据的处理方式。
在利用SPSS进行单因素方差分析时,应注意 数据的组织形式。SPSS要求定义两个变量分 别存放观测变量值和控制变量的水平值。 本例中:
X1:广告形式 X2:地区,18个地区 X3:销售额
1、选择菜单Analyze-Compare means- One-Way ANOVA,出现窗口
其中:
SST ( xij x ) 2
i 1 j 1
k
ni
SSA ( xi x ) 2 ni ( xi x ) 2
i 1 j 1 i 1
k
ni
k
SSE ( xij xi ) 2
i 1 j 1
k
ni
在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则 说明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来 解释,即控制变量给观测变量带来了显著影响。 这里我们用F统计量来表示这种比例关系,如果控制变量的不同水平对 观测变量造成了显著影响,那么观测变量总变差中控制变量所占的比例较 大,则F值就比较大; 反之,如果控制变量的不同水平对观测变量没有造成显著影响,那么 观测变量总变差中控制变量所占的比例较小,则F值就比较小。