在SPSS中进行方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS操作—方差分析
方差分析由英国统计 学家R.A.Fisher在 1923年提出,为纪念 Fisher,以F命名, 故方差分析又称 F 检 验。
三种变异
• 总变异:全部观察值大小各不相等,其变异就称为总变异 (total variation)。用SST表示
• 组间变异:由于各组处理不同所引起的变异称为组间变异 (variation between groups)。它反应了处理因素对不同 组的影响,同时也包括了随机误差。用SS组间表示
652.159
21190.86
df 3
15 18
Mean Square 6846.233 43.477
F 157.467
Sig. .000
• 第一栏:方差来源
• 第二栏:离均差平方和
• 第三栏:自由度
• 第四栏:均方(第二栏与第三栏之比)
• 第五栏:F值(组间均方与组内均方之比)
• 第六栏:F值对应的概率即P值
• 步骤
Analyze→Compare means→ One-way ANOVA
One-Way过程
• One-Way过程:单因素简单方差分析过程。在 Compare Means菜单项中,可以进行单因素方差分析 (完全随机设计资料的多个样本均数比较和样本均 数间的多重比较,也可进行多个处理组与一个对照 组的比较)、均值多重比较和相对比较,用于。
• analyze→compare means→one-way ANVOA
响应变量
因素
Contrasts:线性组合比较。是参数或统计量的线性函数,用于 检验均数间的关系,除了比较差异外,还包括线性趋势检验
Contrasts可以表达为: a1u1+ a2u2 +···+akuk =0;满足a1+ a2+···+ak =0。式中ai为线性组合系数,ui为总体均数,k为分 类变量的水平数
• Sidak(斯达克法):计算t统计量进行多重配对比较,可 以调整显著性水平,比Bonferroni法的界限要小
• Scheffe(谢弗检验法):对所有可能的组合进行同步进入 的配对比较,这些选择可以同时选择若干个,以便比较各 种均数比较方法的结果;
• R-E-G-W F(赖安-艾耶-盖F法):用F检验进行多重比较检 验,显示一致性子集表;
步骤二: 选“Post hoc
test”
勾选多重比较 的方法
(如LSD、 duncan法
wenku.baidu.com确定显著性水 平
continue
实例-多重比较
Post Hoc Test
方差分析步骤
方差分析的思路: 将全部观测值的总变异按影响结果的诸因素分
解为相应的若干部分变异,构造出反映各部分变 异作用的统计量,在此基础上,构建假设检验统 计量,以实现对总体参数的推断。
• 如果进行先验对比检验,则应在Coefficients后依次输入系 数ci,并确保∑ci=0。应注意系数输入的顺序,它将分别与 控制变量的水平值相对应。
• 例如,当k=4时, 即有A、B、C、D 4个处理组,如果只将 B组和D组比较,则线性组合系数依次为0、-1、0、-1;如果 C组与其他3组的平均水平比较,则线性组合系数依次为-1、1、3、-1,余类推。线性组合系数要按照分类变量水平的顺 序依次填入Coefficients框中。
Post Hoc(均数的多重比较选项)
• 进行多重比较是对每两个组的均值进行如下比较:MEAN(i)MEAN(j)≥4.6625×RANGE×SQRT(1/N(i)+1/N(j));其中i、j分 别为组序号, MEAN(i)、MEAN(j)分别为第i、j组均值, N(i)、N(j) 分别为第i、j组中的观测数。各组均值的多重比较方法的算法 不同RANGE值也不同。
• 常用方法备选:
– LSD法:t检验的变形,在变异和自由度的计算上利用了整个样本信息。 – Duncan 新复极差测验法 – Tukey 固定极差测验法 – Dunnett最小显著差数测验法 等
• 实现手段:
– 方差分析菜单中的“Post hoc test…”按钮
步骤一: 同one-way ANOVA
• Tukey’s-b(图基s-b法):用student range分布进行组间均 值的配对比较。其精确值为前两种检验相应值的平均值;
• Duncan(邓肯法) :新复极差测验法,指定一系列的的 Range值,逐步进行计算比较得出结论;
• Hochberg’s GT2(霍耶比GT2法):用正态最大系数进行多 重比较
• Gabriet(盖比理法):用正态标准系数进行配对比较,在单元 数较大时,这种方法较自由;
• Waller-Duncan(瓦尔-邓肯法):用t统计量进行多重比较检验。 使用贝耶斯接近;
• Dunnett(邓尼特法):最小显著差数测验法,进行各组与对照 组的均值,默认的对照组是最后一组;选定此方法后,激活 下面的Control Catetory参数框,展开小菜单,选择对照组
检验假设: H0:三个组的总体均数相同; H1:三个组的总体均数不全相同;
单因素方差分析
• 也称有一维方差分析,对二组以上的均值加以比较。 • 检验由单一因素影响的一个(或几个相互独立的)
分析变量由因素各水平分组的均值之间的差异是否 有统计意义。 • 并可以进行两两组间均值的比较,称作组间均值的 多重比较,还可以对该因素的若干水平分组中哪些 组均值不具有显著性差异进行分析,即一致性子集 检验。
• Tamhane‘s T2(塔海尼T2法):t检验进行配对比较; • Dunnett’s T3(邓尼特T3法):正态分布下的配对比较; • Games-Howell(盖门-霍威尔法):各组均值的配对比较,该方
法较灵活; • Dunnett’C(邓尼特C法):正态分布下的配对比较。
常用的多重比较方法的适用性 • LSD(Least significant Difference):存在明确对
方差相等时可选 择的比较方法
方差不等时可选 择的比较方法
用t检验完成各组 均值的配对比较
与对照组的 配对比较
• LSD(最小显著差异法):用 t检验完成各组均值间的配对 比较。 在变异和自由度的计算上利用了整个样本信息。对 多重比较误差率不进行调整;(此法最敏感)
• Bonferroni(修正最小显著差异法) :用 t检验完成各组均 值间的配对比较,但通过设置每个检验的误差率来控制整 个误差;(应用较多)
• Fix and random effects:输出 固定效应模型的标准差、标准 误和95%可信区间与随机效应 模型的标准误和95%可信区间;
• Homogeneity of variance复选项,要求进行方差齐次性检验, 并输出检验结果。
• Brown-Forsythe:检验各组均数相等,当不能确定方差齐性 检验时,该统计量优于F统计量。
• 组内变异:每个处理组内部的各个观察值也大小不等,与每 组的样本均数也不相同,这种变异称为组内变异 (variation within groups)。组内变异只反映随机误差 的大小,如个体差异、随机测量误差等。因此,又称为误差 变异。用SS组内表示
方差分析中的多重比较
• 目的:
– 如果方差分析判断总体均值间存在显著差异,接下来可通过多 重比较对每个水平的均值逐对进行比较,以判断具体是哪些水 平间存在显著差异。
• R-E-G-W Q (赖安-艾耶-盖Q法):正态分布范围进行多重 配对比较;显示一致性子集表;
• S-N-K(SNK法):用student range分布进行所有各组均值 间的比较;(应用较多)
• Tukey(图基法):固定极差测验法,用student-range统计 量进行所有组间均值的配对比较,将所有配对比较误差率 作为实验误差率;
均值的多项式比较
• 可以同时建立多个多项式。一个多项式的一级系数 输入结束,激活Next按钮,单击该按钮后 Coefficients 框中清空,准备接受下一组系数数据。
• 如果认为输入的几组系数中有错误,可以分别单击 Previous或Next按钮前后翻找出错误的一组数据。 单击出错的系数,该系数显示在编辑框中,可以在 此进行修改,修改后击Change按钮,在系数显示框 中出现正确的系数值。当在系数显示框中选中一个 系数时,同时激活Remove按钮;单击该按钮将选中 的系数清除。
常用的方法有LSD,Scheffe法,SNK法,Turky法, Duncan法和Bonferroni法等。 其中LSD法最敏感, Scheffe法不敏感, SNK法和 Bonferroni法应用较多。
Options (输出统计量的选择)
• Descriptive复选项,要求输出 描述统计量。选择此项,会计 算并输出:观测量数目、均值、 标准差、标准误、最小值、最 大值、各组中每个因变量的95 %可信区间;
• Polynomial(多项式比较):均值趋势的检验有5种多 项式:Linear线性、Quadratic二次、Cubic三次、 4th四次、5th五次多项式
• Coefficients:为多项式指定各组均值的系数。因素变量分为 几组,输入几个系数,多出的无意义。如果多项式中只包括第 一组与第四组的均值的系数,必须把第二个、第三个系数输入 为0值。如果只包括第一组与第二组的均值,则只需要输入前 两个系数,第三、四个系数可以不输入 。多项式的系数需要 由根据研究的需要输入。
• 实际工作中往往需要两两的组间均值比较。这就需要使用 One-way ANOVA进行单因素方差分析时使用选择项从而获 得更丰富的信息,使分析更深入。
例题进一步分析
• 用4种饲料喂猪,共19头猪分为四组,每组用一种饲料。 一段时间后称重。猪体重增加数据如下。比较四种饲料 对猪体重增加的作用有无不同;并比较A、C饲料效应 和与B、D效应和之间是否有显著性差异。
饲料 C
193.4 185.3 182.8 188.5 198.6
D 225.8 224.6 220.4 212.3
实例-单因素方差分析
实例-单因素方差分析(结果输出)
A NOVA
WEIGHT
Between Groups Within Groups Total
Sum of Squares 20538.70
• One-Way ANOVA过程要求:
因(分析)变量属于正态分布总体,若因(分析) 变量的分布明显的是非正态,应该用非参数分析 过程。
对被观测对象的实验不是随机分组的,而是进行 的重复测量形成几个彼此不独立的变量,应该用 Repeated Measure菜单项,进行重复测量方差分 析,条件满足时,还可以进行趋势分析。
测量根据缺失值是因变量还是自变量从有关的分析中剔除。 ② Exclude cases listwise选项对含有缺失值的观测量从所有分
析中剔除
实例-单因素方差分析各处理重复数不等的方差分析
用四种饲料喂养19头猪比较,四种饲料是否不同。
A 133.8 125.3 143.1 128.9 135.7
B 151.2 149.0 162.7 143.8 153.5
存在问题与解决方法
• 本例只考虑了猪体重的增加量,对其均值进行了比较。但实 际工作中的问题往往不是这样简单,例如是否应该考虑每头 猪的进食量对体重增加的影响,去除这个影响比较猪体重的 增加会对饲料比较得出更切合生产实际的结论。这个问题应 该使用ANOVA过程的协方差分析功能去解决。
• 使用系统默认值进行单因素方差分析只能得出是否有显著性 差异的结论,本例数据量少,哪两组之间差别最大,哪种饲 料使猪体重增加更快,几乎是可以看出来的。
• Welch:检验各组均数相等,当不能确定方差齐性检验时,该 统计量优于F统计量。
• Mean plot复选项,即均数分布图,横轴为分类变量,纵轴为 反应变量的均数线图;
• Missing Values栏中,选择缺失值处理方法。 ①Exclude cases analysis by analysis选项,对含有缺失值的观
照组,进行验证性研究;两均数间的比较是独立的 • T(Tukey)方法:如果事先未计划未计划多重比较,
在方差分析得到由统计学意义的F值之后,有需要进 行任意两组之间的比较,且各组样本数相同 • S(Scheffe)方法:多个均值间的比较,且各组样本 数不相同 • SNK(Student-Newman-Keul)方法:两两比较次数不 多
方差分析由英国统计 学家R.A.Fisher在 1923年提出,为纪念 Fisher,以F命名, 故方差分析又称 F 检 验。
三种变异
• 总变异:全部观察值大小各不相等,其变异就称为总变异 (total variation)。用SST表示
• 组间变异:由于各组处理不同所引起的变异称为组间变异 (variation between groups)。它反应了处理因素对不同 组的影响,同时也包括了随机误差。用SS组间表示
652.159
21190.86
df 3
15 18
Mean Square 6846.233 43.477
F 157.467
Sig. .000
• 第一栏:方差来源
• 第二栏:离均差平方和
• 第三栏:自由度
• 第四栏:均方(第二栏与第三栏之比)
• 第五栏:F值(组间均方与组内均方之比)
• 第六栏:F值对应的概率即P值
• 步骤
Analyze→Compare means→ One-way ANOVA
One-Way过程
• One-Way过程:单因素简单方差分析过程。在 Compare Means菜单项中,可以进行单因素方差分析 (完全随机设计资料的多个样本均数比较和样本均 数间的多重比较,也可进行多个处理组与一个对照 组的比较)、均值多重比较和相对比较,用于。
• analyze→compare means→one-way ANVOA
响应变量
因素
Contrasts:线性组合比较。是参数或统计量的线性函数,用于 检验均数间的关系,除了比较差异外,还包括线性趋势检验
Contrasts可以表达为: a1u1+ a2u2 +···+akuk =0;满足a1+ a2+···+ak =0。式中ai为线性组合系数,ui为总体均数,k为分 类变量的水平数
• Sidak(斯达克法):计算t统计量进行多重配对比较,可 以调整显著性水平,比Bonferroni法的界限要小
• Scheffe(谢弗检验法):对所有可能的组合进行同步进入 的配对比较,这些选择可以同时选择若干个,以便比较各 种均数比较方法的结果;
• R-E-G-W F(赖安-艾耶-盖F法):用F检验进行多重比较检 验,显示一致性子集表;
步骤二: 选“Post hoc
test”
勾选多重比较 的方法
(如LSD、 duncan法
wenku.baidu.com确定显著性水 平
continue
实例-多重比较
Post Hoc Test
方差分析步骤
方差分析的思路: 将全部观测值的总变异按影响结果的诸因素分
解为相应的若干部分变异,构造出反映各部分变 异作用的统计量,在此基础上,构建假设检验统 计量,以实现对总体参数的推断。
• 如果进行先验对比检验,则应在Coefficients后依次输入系 数ci,并确保∑ci=0。应注意系数输入的顺序,它将分别与 控制变量的水平值相对应。
• 例如,当k=4时, 即有A、B、C、D 4个处理组,如果只将 B组和D组比较,则线性组合系数依次为0、-1、0、-1;如果 C组与其他3组的平均水平比较,则线性组合系数依次为-1、1、3、-1,余类推。线性组合系数要按照分类变量水平的顺 序依次填入Coefficients框中。
Post Hoc(均数的多重比较选项)
• 进行多重比较是对每两个组的均值进行如下比较:MEAN(i)MEAN(j)≥4.6625×RANGE×SQRT(1/N(i)+1/N(j));其中i、j分 别为组序号, MEAN(i)、MEAN(j)分别为第i、j组均值, N(i)、N(j) 分别为第i、j组中的观测数。各组均值的多重比较方法的算法 不同RANGE值也不同。
• 常用方法备选:
– LSD法:t检验的变形,在变异和自由度的计算上利用了整个样本信息。 – Duncan 新复极差测验法 – Tukey 固定极差测验法 – Dunnett最小显著差数测验法 等
• 实现手段:
– 方差分析菜单中的“Post hoc test…”按钮
步骤一: 同one-way ANOVA
• Tukey’s-b(图基s-b法):用student range分布进行组间均 值的配对比较。其精确值为前两种检验相应值的平均值;
• Duncan(邓肯法) :新复极差测验法,指定一系列的的 Range值,逐步进行计算比较得出结论;
• Hochberg’s GT2(霍耶比GT2法):用正态最大系数进行多 重比较
• Gabriet(盖比理法):用正态标准系数进行配对比较,在单元 数较大时,这种方法较自由;
• Waller-Duncan(瓦尔-邓肯法):用t统计量进行多重比较检验。 使用贝耶斯接近;
• Dunnett(邓尼特法):最小显著差数测验法,进行各组与对照 组的均值,默认的对照组是最后一组;选定此方法后,激活 下面的Control Catetory参数框,展开小菜单,选择对照组
检验假设: H0:三个组的总体均数相同; H1:三个组的总体均数不全相同;
单因素方差分析
• 也称有一维方差分析,对二组以上的均值加以比较。 • 检验由单一因素影响的一个(或几个相互独立的)
分析变量由因素各水平分组的均值之间的差异是否 有统计意义。 • 并可以进行两两组间均值的比较,称作组间均值的 多重比较,还可以对该因素的若干水平分组中哪些 组均值不具有显著性差异进行分析,即一致性子集 检验。
• Tamhane‘s T2(塔海尼T2法):t检验进行配对比较; • Dunnett’s T3(邓尼特T3法):正态分布下的配对比较; • Games-Howell(盖门-霍威尔法):各组均值的配对比较,该方
法较灵活; • Dunnett’C(邓尼特C法):正态分布下的配对比较。
常用的多重比较方法的适用性 • LSD(Least significant Difference):存在明确对
方差相等时可选 择的比较方法
方差不等时可选 择的比较方法
用t检验完成各组 均值的配对比较
与对照组的 配对比较
• LSD(最小显著差异法):用 t检验完成各组均值间的配对 比较。 在变异和自由度的计算上利用了整个样本信息。对 多重比较误差率不进行调整;(此法最敏感)
• Bonferroni(修正最小显著差异法) :用 t检验完成各组均 值间的配对比较,但通过设置每个检验的误差率来控制整 个误差;(应用较多)
• Fix and random effects:输出 固定效应模型的标准差、标准 误和95%可信区间与随机效应 模型的标准误和95%可信区间;
• Homogeneity of variance复选项,要求进行方差齐次性检验, 并输出检验结果。
• Brown-Forsythe:检验各组均数相等,当不能确定方差齐性 检验时,该统计量优于F统计量。
• 组内变异:每个处理组内部的各个观察值也大小不等,与每 组的样本均数也不相同,这种变异称为组内变异 (variation within groups)。组内变异只反映随机误差 的大小,如个体差异、随机测量误差等。因此,又称为误差 变异。用SS组内表示
方差分析中的多重比较
• 目的:
– 如果方差分析判断总体均值间存在显著差异,接下来可通过多 重比较对每个水平的均值逐对进行比较,以判断具体是哪些水 平间存在显著差异。
• R-E-G-W Q (赖安-艾耶-盖Q法):正态分布范围进行多重 配对比较;显示一致性子集表;
• S-N-K(SNK法):用student range分布进行所有各组均值 间的比较;(应用较多)
• Tukey(图基法):固定极差测验法,用student-range统计 量进行所有组间均值的配对比较,将所有配对比较误差率 作为实验误差率;
均值的多项式比较
• 可以同时建立多个多项式。一个多项式的一级系数 输入结束,激活Next按钮,单击该按钮后 Coefficients 框中清空,准备接受下一组系数数据。
• 如果认为输入的几组系数中有错误,可以分别单击 Previous或Next按钮前后翻找出错误的一组数据。 单击出错的系数,该系数显示在编辑框中,可以在 此进行修改,修改后击Change按钮,在系数显示框 中出现正确的系数值。当在系数显示框中选中一个 系数时,同时激活Remove按钮;单击该按钮将选中 的系数清除。
常用的方法有LSD,Scheffe法,SNK法,Turky法, Duncan法和Bonferroni法等。 其中LSD法最敏感, Scheffe法不敏感, SNK法和 Bonferroni法应用较多。
Options (输出统计量的选择)
• Descriptive复选项,要求输出 描述统计量。选择此项,会计 算并输出:观测量数目、均值、 标准差、标准误、最小值、最 大值、各组中每个因变量的95 %可信区间;
• Polynomial(多项式比较):均值趋势的检验有5种多 项式:Linear线性、Quadratic二次、Cubic三次、 4th四次、5th五次多项式
• Coefficients:为多项式指定各组均值的系数。因素变量分为 几组,输入几个系数,多出的无意义。如果多项式中只包括第 一组与第四组的均值的系数,必须把第二个、第三个系数输入 为0值。如果只包括第一组与第二组的均值,则只需要输入前 两个系数,第三、四个系数可以不输入 。多项式的系数需要 由根据研究的需要输入。
• 实际工作中往往需要两两的组间均值比较。这就需要使用 One-way ANOVA进行单因素方差分析时使用选择项从而获 得更丰富的信息,使分析更深入。
例题进一步分析
• 用4种饲料喂猪,共19头猪分为四组,每组用一种饲料。 一段时间后称重。猪体重增加数据如下。比较四种饲料 对猪体重增加的作用有无不同;并比较A、C饲料效应 和与B、D效应和之间是否有显著性差异。
饲料 C
193.4 185.3 182.8 188.5 198.6
D 225.8 224.6 220.4 212.3
实例-单因素方差分析
实例-单因素方差分析(结果输出)
A NOVA
WEIGHT
Between Groups Within Groups Total
Sum of Squares 20538.70
• One-Way ANOVA过程要求:
因(分析)变量属于正态分布总体,若因(分析) 变量的分布明显的是非正态,应该用非参数分析 过程。
对被观测对象的实验不是随机分组的,而是进行 的重复测量形成几个彼此不独立的变量,应该用 Repeated Measure菜单项,进行重复测量方差分 析,条件满足时,还可以进行趋势分析。
测量根据缺失值是因变量还是自变量从有关的分析中剔除。 ② Exclude cases listwise选项对含有缺失值的观测量从所有分
析中剔除
实例-单因素方差分析各处理重复数不等的方差分析
用四种饲料喂养19头猪比较,四种饲料是否不同。
A 133.8 125.3 143.1 128.9 135.7
B 151.2 149.0 162.7 143.8 153.5
存在问题与解决方法
• 本例只考虑了猪体重的增加量,对其均值进行了比较。但实 际工作中的问题往往不是这样简单,例如是否应该考虑每头 猪的进食量对体重增加的影响,去除这个影响比较猪体重的 增加会对饲料比较得出更切合生产实际的结论。这个问题应 该使用ANOVA过程的协方差分析功能去解决。
• 使用系统默认值进行单因素方差分析只能得出是否有显著性 差异的结论,本例数据量少,哪两组之间差别最大,哪种饲 料使猪体重增加更快,几乎是可以看出来的。
• Welch:检验各组均数相等,当不能确定方差齐性检验时,该 统计量优于F统计量。
• Mean plot复选项,即均数分布图,横轴为分类变量,纵轴为 反应变量的均数线图;
• Missing Values栏中,选择缺失值处理方法。 ①Exclude cases analysis by analysis选项,对含有缺失值的观
照组,进行验证性研究;两均数间的比较是独立的 • T(Tukey)方法:如果事先未计划未计划多重比较,
在方差分析得到由统计学意义的F值之后,有需要进 行任意两组之间的比较,且各组样本数相同 • S(Scheffe)方法:多个均值间的比较,且各组样本 数不相同 • SNK(Student-Newman-Keul)方法:两两比较次数不 多