方差分析与协方差分析.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的概率是0.95时的误差为:1-0.956 =0.265。
方差分析概念
• 第一类因素:可以控制的控制因素 • 第二类因素:不能控制的随机因素 • 受前两类因素影响的事物为观察变量 • 方差分析目的:分析控制变量的不同水平是否对观察变量
产生了显著影响,检验各个水平下观察变量的均值是否相 等
方差分析分类之一
(4)方差齐性(homogeneity of variance),也称变异的同 质性,各个水平下的总体具有相同的方差。这是方差分 析一个很重要的前提,因此在进行方差分析之前,应当 进行方差齐性检验。
➢ Bartlett检验法 ➢ Levene F 检验 ➢ 最大方差与最小方差之比<3,初步认为方差齐同。
统计技术分类图
因变量
非定量因变量
定量因变量
非定量方差分析
一个因变量
多个因变量
一个自变量
多个自变量
多变量方差分析
二分变量
多分变量
定类
定类和定距
定距
T检验
单因子方差分析
N因子方差分析
协方差分析
回归分析
方差分析原理
• 目的:通过方差的比较来自百度文库检验各个水平下的观察值的均值 是否相等
• 观察值差异:观察值存在差异,差异的产生来自两个方面。 系统性差异:由控制变量的不同水平造成的,例如饮料的 不同颜色带来不同的销售量 随机性差异:由于抽选样本的随机性而产生的差异,例如,
• 单变量方差分析:一个观察变量 ➢ 单因方差分析中的控制变量只有一个 ➢ 多因素方差分析中的控制变量有多个 • 多变量方差分析:多个观察变量
方差分析分类之二
• 一般方差分析:因变量是定量变量,自变量是定类数据 • 协方差分析:将很难控制的因素作为协变量,在排除协变
量影响的条件下,分析控制变量对观察变量的影响,从而 更加准确地对控制变量进行评价。协变量一定要是连续数 值型。 • 非定量方差分析:因变量为定序变量
A BX
●● ●
●
●●
X1
●
●● ● ●
●
●●
●
X2
●●
●
X3
●● ●
●●
●
●
●
X4 ●
X5
●● ●
单因素方差分析逻辑与步骤 (One-Way ANOVA)
• 前提假设 • 模型与假设
• 平方和的分解与F 检验
• 多重比较(事后检验) • 关联强度与效应值
方差分析的前提条件
(1)每个水平下的因变量应当服从正态分布。方差分析对分布 假设有稳健性(robust),即正态性不满足时,统计结果变化 不大,因此一般并不要求检验总体的正态性。 (2)变异可加性。各因素对离差平方和的影响可以分割成几个 可以加在一起的部分。(多因素) (3)独立性。观察对象是来自所研究因素的各个水平之下的独 立随机抽样
nk 1
确定P 值,做出统计推断
如果均值相等, F=MSA/MSE1
不能拒绝H0
拒绝H0
0
F
F(k-1,n-k)
F 分布
事后比较 (posteriori/post hoc comparison)
• F 检验显著说明各组均值并不相同(至少两组不同),但不
能回答到底哪几组不同。
• 通过对各组均值之间的配对比较来进一步检验到底哪些均 值之间存在差异。
注意 d f E d f T d f A f B ,S S E S S T S S A S S B
各因素离差平方和的自由度为水平数减一,总平方和的自由度为试验总次数减一 。
• 方法众多,不下20种。
均数两两比较方法
LSD法:最灵敏,会犯假阳性错误; Sidak法:比LSD法保守; Bonferroni法:比Sidak法更为保守一些;常用 Scheffe法:多用于进行比较的两组间样本含量不等时; Dunnet法:常用于多个试验组与一个对照组的比较; S-N-K法:寻找同质亚组的方法; Turkey法:最迟钝,要求各组样本含量相同; Duncan法:与Sidak法类似。
Y=μ+a+e
• 建立假设,确定检验水准
H 0:12 k
H 1 : k组总体均数不全相等。
0.05;0.01
方差分析表
组间变异体现了因素A的效应,组内变异则被视作误
差。
来源 平方和 自由度 均方 F 值 P 值
组间 SS A 组内 SS E
k 1
MS A MS A
MS E k(n 1) MS E
总和 SS T
相同颜色的饮料在不同的商场销售量也不相同。
方差分析的基本思想(单因素)
组间变异 组内变异
总变异
▪ 组内只包含随机误差 ▪ 组间既包括随机误差,也包括系统误差
9
组间变异>组内变异
BX A
●●●●●●
X1
●●●●●●
X2 ●●●●●● X3 ●●●●●● X4 ●●●●●● X5
组间变异<组内变异
关联强度 (strength of association)与效应 值 (effect size)的度量
实验处理引致的效应的大小或者数据的变异有多少部分是由 实验处理造成的。
• Eta平方 • 净(偏)Eta平方 • Omega平方
• Cohen's f
(具体内容见附录)
双因素(无交互作用)试验的方差分析表
方差来源 平方和 自由度 均方和
因素A S S A 因素B S S B 误差 S S E 总和 S S T
d fA
MSA
SS A df A
d fB
MSB
SSB dfB
d fE
MSE
SSE dfE
d fT
F值
FA
MSA MSE
FB
MSB MSE
F 值临介值
F ( a 1 , a 1b 1) F ( b 1 , a 1b 1)
方差不齐
若方差齐性的假定不满足,可考虑如下策略: a.检查某些表现“特殊”的观测值,看能否将其剔除, 用剩下的数据进行方差分析。 b.使用无方差齐性假设的多重比较方法。 c.数据变换,用变换(平方根变换、对数变换等)后的数 据进行方差分析。正态性转换。 d. 非参数检验
模型与假设
• 模型表达式(单因素)
方差分析和协方差分析
第5组
• 在针对连续变量的统计推断方法中,最常用的有t 检验和 方差分析两种
• 四种不同的颜色包装对饮料销售量的影响(四个水平,分 类变量)
• 两两t 检验?
不能做t 检验
• 如果有K(K≥3)个平均数,若用两两比较的方法来检验,则 需作K(K-1)/2次检验,不但程序繁琐,而且相当于从t 分 布中随机抽取多个t 值,其落在大于临界值的范围内的概 率大大增加,犯Ⅰ类错误的概率大大增加:如6次检验H0
方差分析概念
• 第一类因素:可以控制的控制因素 • 第二类因素:不能控制的随机因素 • 受前两类因素影响的事物为观察变量 • 方差分析目的:分析控制变量的不同水平是否对观察变量
产生了显著影响,检验各个水平下观察变量的均值是否相 等
方差分析分类之一
(4)方差齐性(homogeneity of variance),也称变异的同 质性,各个水平下的总体具有相同的方差。这是方差分 析一个很重要的前提,因此在进行方差分析之前,应当 进行方差齐性检验。
➢ Bartlett检验法 ➢ Levene F 检验 ➢ 最大方差与最小方差之比<3,初步认为方差齐同。
统计技术分类图
因变量
非定量因变量
定量因变量
非定量方差分析
一个因变量
多个因变量
一个自变量
多个自变量
多变量方差分析
二分变量
多分变量
定类
定类和定距
定距
T检验
单因子方差分析
N因子方差分析
协方差分析
回归分析
方差分析原理
• 目的:通过方差的比较来自百度文库检验各个水平下的观察值的均值 是否相等
• 观察值差异:观察值存在差异,差异的产生来自两个方面。 系统性差异:由控制变量的不同水平造成的,例如饮料的 不同颜色带来不同的销售量 随机性差异:由于抽选样本的随机性而产生的差异,例如,
• 单变量方差分析:一个观察变量 ➢ 单因方差分析中的控制变量只有一个 ➢ 多因素方差分析中的控制变量有多个 • 多变量方差分析:多个观察变量
方差分析分类之二
• 一般方差分析:因变量是定量变量,自变量是定类数据 • 协方差分析:将很难控制的因素作为协变量,在排除协变
量影响的条件下,分析控制变量对观察变量的影响,从而 更加准确地对控制变量进行评价。协变量一定要是连续数 值型。 • 非定量方差分析:因变量为定序变量
A BX
●● ●
●
●●
X1
●
●● ● ●
●
●●
●
X2
●●
●
X3
●● ●
●●
●
●
●
X4 ●
X5
●● ●
单因素方差分析逻辑与步骤 (One-Way ANOVA)
• 前提假设 • 模型与假设
• 平方和的分解与F 检验
• 多重比较(事后检验) • 关联强度与效应值
方差分析的前提条件
(1)每个水平下的因变量应当服从正态分布。方差分析对分布 假设有稳健性(robust),即正态性不满足时,统计结果变化 不大,因此一般并不要求检验总体的正态性。 (2)变异可加性。各因素对离差平方和的影响可以分割成几个 可以加在一起的部分。(多因素) (3)独立性。观察对象是来自所研究因素的各个水平之下的独 立随机抽样
nk 1
确定P 值,做出统计推断
如果均值相等, F=MSA/MSE1
不能拒绝H0
拒绝H0
0
F
F(k-1,n-k)
F 分布
事后比较 (posteriori/post hoc comparison)
• F 检验显著说明各组均值并不相同(至少两组不同),但不
能回答到底哪几组不同。
• 通过对各组均值之间的配对比较来进一步检验到底哪些均 值之间存在差异。
注意 d f E d f T d f A f B ,S S E S S T S S A S S B
各因素离差平方和的自由度为水平数减一,总平方和的自由度为试验总次数减一 。
• 方法众多,不下20种。
均数两两比较方法
LSD法:最灵敏,会犯假阳性错误; Sidak法:比LSD法保守; Bonferroni法:比Sidak法更为保守一些;常用 Scheffe法:多用于进行比较的两组间样本含量不等时; Dunnet法:常用于多个试验组与一个对照组的比较; S-N-K法:寻找同质亚组的方法; Turkey法:最迟钝,要求各组样本含量相同; Duncan法:与Sidak法类似。
Y=μ+a+e
• 建立假设,确定检验水准
H 0:12 k
H 1 : k组总体均数不全相等。
0.05;0.01
方差分析表
组间变异体现了因素A的效应,组内变异则被视作误
差。
来源 平方和 自由度 均方 F 值 P 值
组间 SS A 组内 SS E
k 1
MS A MS A
MS E k(n 1) MS E
总和 SS T
相同颜色的饮料在不同的商场销售量也不相同。
方差分析的基本思想(单因素)
组间变异 组内变异
总变异
▪ 组内只包含随机误差 ▪ 组间既包括随机误差,也包括系统误差
9
组间变异>组内变异
BX A
●●●●●●
X1
●●●●●●
X2 ●●●●●● X3 ●●●●●● X4 ●●●●●● X5
组间变异<组内变异
关联强度 (strength of association)与效应 值 (effect size)的度量
实验处理引致的效应的大小或者数据的变异有多少部分是由 实验处理造成的。
• Eta平方 • 净(偏)Eta平方 • Omega平方
• Cohen's f
(具体内容见附录)
双因素(无交互作用)试验的方差分析表
方差来源 平方和 自由度 均方和
因素A S S A 因素B S S B 误差 S S E 总和 S S T
d fA
MSA
SS A df A
d fB
MSB
SSB dfB
d fE
MSE
SSE dfE
d fT
F值
FA
MSA MSE
FB
MSB MSE
F 值临介值
F ( a 1 , a 1b 1) F ( b 1 , a 1b 1)
方差不齐
若方差齐性的假定不满足,可考虑如下策略: a.检查某些表现“特殊”的观测值,看能否将其剔除, 用剩下的数据进行方差分析。 b.使用无方差齐性假设的多重比较方法。 c.数据变换,用变换(平方根变换、对数变换等)后的数 据进行方差分析。正态性转换。 d. 非参数检验
模型与假设
• 模型表达式(单因素)
方差分析和协方差分析
第5组
• 在针对连续变量的统计推断方法中,最常用的有t 检验和 方差分析两种
• 四种不同的颜色包装对饮料销售量的影响(四个水平,分 类变量)
• 两两t 检验?
不能做t 检验
• 如果有K(K≥3)个平均数,若用两两比较的方法来检验,则 需作K(K-1)/2次检验,不但程序繁琐,而且相当于从t 分 布中随机抽取多个t 值,其落在大于临界值的范围内的概 率大大增加,犯Ⅰ类错误的概率大大增加:如6次检验H0