第六章 方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
无重复实验的双因素方差分析的已知条件
因素B1 因素A1 因素A2 „ 因素As X11 X21 „ Xs1 因素B2 X12 X22 „ Xs2 „ „ „ „ „ 因素Bn X1n X2n „ Xsn
问:因素A的不同水平(方案)的效果(均值)有无显著不同?
因素B的不同水平(方案)的效果(均值)有无显著不同?
第六章 方差分析
推断性比较技术(二)
本章内容
• 6.1 方差分析的概念与方差分析的过程
• 6.2 单因素方差分析
• 6.3 双因素方差分析
6.3.1 无重复实验的双因素方差分析 6.3.2 重复实验的双因素方差分析
• 6.4 协方差分析
6.1
方差分析的概念与原理
• 方差分析(Analysis of Variance)又 称为变异数分析,是英国统计学家 R.A.Fisher提出的一种统计检验方法 (F检验)。它既可作为多组均数之间 的显著性检验,也可作为方差之间的显 著性检验。
受不同因素的影响,研究所得数据会不同。造成 差异的原因可分为两类:1)随机误差,如测量误差 造成的差异或个体间的差异,称为组内差异;2)实 验条件,即不同的处理造成的差异,称为组间差异。 方差分析的目的是分析分组的平均数是否相等。 如果相等,说明组间没有差别;如果不相等,说明组 间平均数有差异,这时分组(或处理)是有效的。
一种情况是处理没有作用,即各组样本 均来自同一总体,F=MSb/MSw≈1。 另一种情况是处理确实有作用,那么, F=MSb>>MSw (远远大于)。
a 性 别 与 工 资 的 方 差 分 析 表 ( ANOVA ) Sum of Squares 4858896.821 217789827.6 222648724.4 Mean Square 4858896.8 253538.798
GLM Univariate选项:
• 选择分析模型Model:
1.默认全模型Full Factorial:包括所有因素变量的主效应、所有协 变量的主效应、所有因素与因素的交互效应,不包括协变量与其他因 素的交互效应。 2.自定义模型Custom:主效应(Main effects及其因素变量)、交互 变量(有交互效应维数之分)
即按照定类变量的不同水平来分组,看每个分
组的定距变量的平均数是否有差异。不同组间 的平均数差异越小,两个变量间的关系越弱; 相反,平均数差异越大,变量间关系越强。
不 同性 别 的 分组 平 均数 比 较 现在 每月工 资 性别 男 女 Total Mean 752.40 601.97 680.95 N 452 409 861 Std. Deviation 573.13 413.16 508.82
但其独特的地方是,它并不直接利用平均数来比 较,而是利用与方差有关的统计指标总变差(SST)、 组间变差(SSB)、组内变差(SSW)的关系来进行 判别。
收 入
男 女
Y总=800元
Y女=800元
Y男=800元
收 Y男=1000元 入
男 女
Y总=800元
Y女=600元
收 入 Yi-
男 女
y
Yi-
6.2 单因素方差分析
• 解决的问题类型
设有k个教学方案,各个方案的效果如表6.1所示。 问:怎样判断这k个方案的效果是否有显著区别 (均值是否相同)?
所谓的单因素是指只有“方案”这个变量(因素)。 不同方案就是“方案”这个变量的不同取值。这 些不同的“取值”又称为“方案”这个因素的不 同“水平”。
在科学实验中常常要探讨不同实验条件或
处理方法对实验结果的影响。通常是比较不同
实验条件下样本均值间的差异。 例如,在学校教学中,探讨多种版本教材 的实施效果,或者是研究不同教学方法对教学 效果的影响等。
类似的问题都可以通过方差分析来处理。
• 方差分析是用以测量定类变量和定距变量的关
系强度的方法。 当一个变量为定类变量(分类在3类以 上),另一变量为定距变量时,两变量间是否 有关,通常以分组平均数比较的方法来考察。
• 在一般进行方差分析时,要求除研究的因素外应该保 证其他条件的一致。然而在实际问题中,有些随机因 素是很难人为控制的,但它们又会对结果产生显著的 影响。要消除其他因素的影响,应采用协方差分析。
• 协方差分析是将那些很难控制的因素作为协变量,在 排除协变量影响的条件下,分析控制变量对观察变量 的影响,从而更加准确地对控制变量进行评价。 • 协方差分析要求协变量应是连续数值型,多个协变量 间互相独立,且与控制变量之间没有交互影响。
表 单因素方差分析的已知条件
方案1 方案2 X11 X21 X12 X22 „ „ X1n X2n
„
方案k
„
Xk1
„
Xk2
„
„
„
Xkn
注:表中ni表示方案i的实验个数。
6.2 单因素方差分析实例
P120 研究3个组(分别接受了3种不同的教学方法)在 英语成绩上是否有显著差异,如表6.3所示。 方法1/group1 99 88 79 方法2/group2 70 72 87 方法3/group3 79 56 89
协方差分析实例
• P146:例6.4 研究一个班3组同学(分别接 受了3种不同的教学方法)在数学成绩上是否 有显著差异。已知这些同学的数学入学成绩, 见数据文件“3组学生的数学成绩”。 • 统计分析过程:Analyze->General Linear Model-> Univariate
Dependent: Math Fixed Factors:group Covariate:score1
重复实验的双因素方差分析的已知条件
因素B1 因素B2
X121„ X12t
„
„ „ „ „
因素Bn
X1n1„ X1nt X2n1„ X2nt „ Xsn1„ Xsnt
因素A1
„ 因素As
X111„ X11t
因素A2 X211 „ X21t X221„ X22t
„ Xs11„ Xs1t „ Xs21„ Xs2t
绝零假设, 说明样本来自不同的正态总体,说 明处理造成均值的差异有统计意义;否则, F<F0.05((dfb,dfw), p>0.05不能拒绝零假设,说明 样本来自相同的正态总体,处理间无差异。
• 总之,方差分析的基本思想是把所有观察值 之间的变异分解为几个部分,即把描写观察 值之间的变异的离均差平方和分解为某些因 素的离均差平方和和随机抽样误差,进而计 算其均方,然后相互比较,做统计学处理, 确定各因素(控制变量)对研究对象的影响 力大小。通过方差分析,分析不同水平的控 制变量是否对结果产生了显著影响。
2
SSB是组间变差,各组平均数与总平均数的离差平方和
SSB ( y j y )
2
SSW是组内变差,每组数据和该组平均数的离差平方和。
SSW ( yij y j )
三者的关系是:
2
SST=SSB+SSW
由于方差和变差标志着每一数据对其平均数的偏离
(即异质性),因此,SSB/SSW的含义就可理解为组 间异质性和组内异质性的比较。其取值的范围在 0到正
6.3 双因素方差分析
• 双因素方差分析用来研究两个自变量(如教学方 法、性别)与一个因变量之间的关系,即同时比 较两个自变量(或因素)。这些自变量又称为主 效应。
• 具有两个或更多自变量的设计称为析因方差分析。
析因方差分析的一个优点是:既能揭示各个自变
量对因变量的作用,又能揭示自变量之间的相互
作用;后者是一系列单因素方差分析所不能明显 揭示的。
y男
y男 - y
y男
y女 - y
SST(总变差 ) ( yij y )
2
y
y女
SSW(组内变差 ) ( yij y j )
2 2
SSB(组间变差 ) ( y j y )
SST=SSB+SSW
SST是总变差,即未分组的数据的变差,总方差的分子。
SST ( yij y )
59
54
66
54
99
23
89
92
89
6.2 单因素方差分析实例
• 根据数据建立数据文件“三组教学方法英语 成绩.SAV”。 • 统计分析过程
Analyze->Compare Means->One-Way ANOVA
Dependent List:english Factor:group Options选项:Descriptive描述统计量, Homogeneity-of-variance方差齐次性检验,Means plot均值分布图 Post Hoc选项: 均值多重比较LSD和Tamhane’s T2 (各种方法的使用条件——方差齐或不齐) Contrasts选项: 多项式比较,Polynomial->”Linear” (线性分解)
无穷大之间。当该值>1,则说明组与组间的差别大于
组内的差别,也就说明这时组间平均数的差异是存在的。
• 组内SSw 、组间SSb除以各自的自由度(组内 dfw =n-m,组间dfb=m-1,其中n为样本总 数,m为组数),得到其均方MSw和MSb, MSb/MSw比值构成F分布,用F值与其临界 值比较,推断各样本是否来自相同的总体:
现在每月 工资 * 性 别
Between Groups Within Groups Total
df 1 859 860
F 19.164
a.
方差分析的假设检验
• 零假设H0:m组样本均值都相同,即μ1= μ2=....=
μm
• 如果经过计算结果组间均方远远大于组内均方
( MSb>>MSw ),F>F0.05(dfb,dfw), p<0.05,拒
不 同文 化 程 度的 分 组平 均 数比 较 现在每月工 资 文化程度 Mean 不 识 字 或 识 字 很 少 302.86 初小 460.28 高小 773.50 初中 546.95 高 中 中 专 或 中 技 676.57 大专 793.66 大学本科 828.86 研究生以上 666.00 未回答 603.33 Total 680.95 N 7 18 22 213 312 146 125 15 3 861 Std. Deviation 137.93 176.64 1386.82 326.58 470.18 460.91 618.19 325.00 194.44 508.82
问:因素A的不同水平(方案)的效果(均值)有无显著不同?
因素B的不同水平(方案)的效果(均值)有无显著不同? 因素A与B之间的交互作用如何?
6.3 双因素方差分析
• 统计分析过程
Analyze->General Linear Model(简称
GLM)->Univariate
GLM过程可以完成简单的多因素方差分 析和协方差分析,不但可以分析各因素的主 效应,还可以分析各因素间的交互效应。
6.2 单因素方差分析
• 也称为一维方差分析,对二组以上均值加以比较。
• 检验由单一因素影响的一个(或几个相互独立的) 分析变量由因素各水平分组的均值之间的差异是否 有统计意义。
• 并可以进行两两组间均值的比较,称作组间均值的 多重比较,还可以对该因素的若干水平分组中哪些 组均值不具有显著性差异进行分析。
Байду номын сангаас
3.选择分解平方和的方法(默认为TYPE III)
4.Include Intercept in model :系统默认截距包括在回归模型中
• 选择对照方法Contrasts
• 选择分布图形Plots
• 选择多重比较分析Post Hoc • 保存运算结果的选择项Save • 选择输出项Options
6.4 协方差分析