《方差分析》课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方差分析 ANOVA
已经学过的知识
一位研究者对长子与次子的心理特征感兴趣。他在一 年级大学生中随机抽取了10个长子和20个非长子对其
施测自尊量表。10个长子在量表上的平均分是X = 48, SS=670。 20个非长子的平均分是X = 41, SS=1010。
这些数据表明两组间是否有显著差异?用α= .01 的显 著性水平作假设检验。
step 3: 指出检验的df (有两个 df) step 4: 查表找出临界 F统计量
step 5: 对于样本,计算 F统计量 step 6: 比较 F统计量 和临界 F统计量 step 7: 对于H0 作出结论
单因素, 独立测量研究设计的例子
检验三个不同的学习方法的效应。将学 生随机分配到3个处理组
阅读时间 5wk.baidu.com分钟 15 分钟 30 分钟 年龄 3 岁 8岁 14 岁
3*3个共9个单元 格,如何分析数 据?
分析
t-检验和 z-检验不能用于多于 2 组的 数据. 处理这类数据需要用一种新的推 论统计程序: 方差分析 (ANOVA). (为什 么)
这次课的内容
最基本的ANOVA.集中讨论单因素, 独立测 量的研究设计.
方法 A 只读课本
0
1
3
1
0
研究方法
方法 B 只作笔记
4
3
6
3
4
方法 C 借别人笔记
1
2
2
0
0
T1 = 5 SS1 = 6 n1 = 5
T2 = 20 SS2 = 6 n2 = 5
T3 = 5 SS3 = 4 n3 = 5
SX2=106 G=30=总的和
N=15=总的样本容量 G-bar=30/15=2= 总的均值 K = 3 =处理条件 (或组)
ANOVA的专用符号
K = 处理条件(或组)的数目 n = 每一个组的数目(如果它们相等) ni = 第i组的数目(如果 它们不等) N = Sni = 总的样本容量 Ti = SXij G = SXij =总的和 G-bar = G / N = 总的均值 SSi = 每一个组的和方 = S(Xij - i)2
ANOVA的过程
F比率 = 处理间方差 /处理内方差( 需要找出两个方差. ) 最基本公式s2 = SS/df.
SS和 = SX2 - (G2/N) SS和 = 106 - (302/15) =106 - 60 = 46 需要将其分解为组间变异和组内变异. SS和 = SS组间 + SS组内 如何得到SS组内? 将每一个组SS相加 SSwithin = SSS每一个 处理内部 = SSSi= 6 + 6 + 4 = 16 如何得到SS组间? 快捷的方法是: SS和- SS组内
例中我们用同一些儿童作纵向研究。年龄是组内变 量,阅读时间是组间变量).
上述研究称为因素设计, 两个组间因素,每一 个因素有 3 个水平 (称为 3 X 3 组间设计).
ANOVA逻辑
与假设检验的逻辑是同样的, 只是具体内容有 变化
step 1: 陈述 H0 (和H1) ,确定标准: a = ? step 2: ANOVA 检验总是 单尾(不同之处)
具有多于一个自变量研究称为因素设计 (factorial design).
构成因素的个别处理条件称为因素的水平
ANOVA简介(3)
ANOVA能够处理数据的类型:
两个自变量 (称为因素): 年龄和阅读时间,都是 组间 (独立样本) 变量.
包含组内 (重复测量) 因素的研究设计 同时包含组间和组内因素的混合设计(e.g. 假设上
一个新的情境
一位研究者感兴趣影响儿童阅读能力的因素.研究者认 为儿童的年龄和每次阅读时间可能是重要的影响因素。 研究者设计了以下实验:选取三个年龄组的儿童: 3 岁, 8 岁, 和 14 岁.将每个年龄组的儿童随机分配到三个阅 读条件. 组 1阅读时间为 5 分钟; 组 2为15 分钟; 对于组 3为30 分钟.两个星期之后测试了这些儿童的阅读能 力。
方法 A:让学生只读课本, 不去上课. 方法 B:上课,记笔记,不读课本. 方法 C:不读课本,不去上课, 只看别
人的笔记
单因素, 独立测量研究设计的例子
Step 1: 陈述假设和设定标准 (选择 a) H0: m1 = m2 = m3 H1: 其中一个组与另一个(或更多)的组均值
step 3: 找出检验的 df. 注意要考虑几个 df step 4: 从表找出临界 F统计量 step 5:计算样本 的F统计量观测值 step 6:比较 F统计量的观测值与临界 F统计量 如果
F统计量的观测值 (Fobs) 在统计上显著地大于 1.0 则拒绝 H0
单因素, 独立测量研究设计的例子
方差的来源
什么造成样本的不同(处理间变异)
处理/组效应 - 处理造成的差异 个体差异效应 - 个体差异变异
随机误差
每一个样本内部的变异 (处理内变异)
个体差异效应 随机误差
ANOVA简介(2)
在方差分析中, 自变量称为因素.
包含一个自变量的研究称为单因素设计 (single-factor design).
F<或=1, 即MS组间/ MSw组内<1,说明数据的总 变异由分组不同造成的变异只占很小的部分, 大部分是由试验误差何个体差异所致,就是说 不同的实验处理之间变异不大,或者说试验处 理基本无效。
F>1而且落入F分布的临界区,说明实验数据的 变异由不同的实验处理所造成,即不同的试验 处理之间有差异。
不同。备择假设 可能的形式很多: m1不等于 m2 = m3
m1 = m3 不等于 m2 m1 = m2 不等于 m3 m1 不等于 m2 不等于 m3 因此,只需给出虚无假设就够了
单因素, 独立测量研究设计的例子
step 2: ANOVA 检验总是单尾. 因为不存在负的方差. F分布表也只有单侧的Alpha.(F分布图)
1. ANOVA的简介 2. ANOVA的逻辑 3. ANOVA的符号. 4. ANOVA的过程和例题 5. 事后检验
ANOVA简介(1)
方差分析即analysis of variance,简称 ANOVA。
功能:分析实验数据中不同来源的变异 对总变异的贡献大小,确定实验中的自 变量是否对因变量有重要影响。
已经学过的知识
一位研究者对长子与次子的心理特征感兴趣。他在一 年级大学生中随机抽取了10个长子和20个非长子对其
施测自尊量表。10个长子在量表上的平均分是X = 48, SS=670。 20个非长子的平均分是X = 41, SS=1010。
这些数据表明两组间是否有显著差异?用α= .01 的显 著性水平作假设检验。
step 3: 指出检验的df (有两个 df) step 4: 查表找出临界 F统计量
step 5: 对于样本,计算 F统计量 step 6: 比较 F统计量 和临界 F统计量 step 7: 对于H0 作出结论
单因素, 独立测量研究设计的例子
检验三个不同的学习方法的效应。将学 生随机分配到3个处理组
阅读时间 5wk.baidu.com分钟 15 分钟 30 分钟 年龄 3 岁 8岁 14 岁
3*3个共9个单元 格,如何分析数 据?
分析
t-检验和 z-检验不能用于多于 2 组的 数据. 处理这类数据需要用一种新的推 论统计程序: 方差分析 (ANOVA). (为什 么)
这次课的内容
最基本的ANOVA.集中讨论单因素, 独立测 量的研究设计.
方法 A 只读课本
0
1
3
1
0
研究方法
方法 B 只作笔记
4
3
6
3
4
方法 C 借别人笔记
1
2
2
0
0
T1 = 5 SS1 = 6 n1 = 5
T2 = 20 SS2 = 6 n2 = 5
T3 = 5 SS3 = 4 n3 = 5
SX2=106 G=30=总的和
N=15=总的样本容量 G-bar=30/15=2= 总的均值 K = 3 =处理条件 (或组)
ANOVA的专用符号
K = 处理条件(或组)的数目 n = 每一个组的数目(如果它们相等) ni = 第i组的数目(如果 它们不等) N = Sni = 总的样本容量 Ti = SXij G = SXij =总的和 G-bar = G / N = 总的均值 SSi = 每一个组的和方 = S(Xij - i)2
ANOVA的过程
F比率 = 处理间方差 /处理内方差( 需要找出两个方差. ) 最基本公式s2 = SS/df.
SS和 = SX2 - (G2/N) SS和 = 106 - (302/15) =106 - 60 = 46 需要将其分解为组间变异和组内变异. SS和 = SS组间 + SS组内 如何得到SS组内? 将每一个组SS相加 SSwithin = SSS每一个 处理内部 = SSSi= 6 + 6 + 4 = 16 如何得到SS组间? 快捷的方法是: SS和- SS组内
例中我们用同一些儿童作纵向研究。年龄是组内变 量,阅读时间是组间变量).
上述研究称为因素设计, 两个组间因素,每一 个因素有 3 个水平 (称为 3 X 3 组间设计).
ANOVA逻辑
与假设检验的逻辑是同样的, 只是具体内容有 变化
step 1: 陈述 H0 (和H1) ,确定标准: a = ? step 2: ANOVA 检验总是 单尾(不同之处)
具有多于一个自变量研究称为因素设计 (factorial design).
构成因素的个别处理条件称为因素的水平
ANOVA简介(3)
ANOVA能够处理数据的类型:
两个自变量 (称为因素): 年龄和阅读时间,都是 组间 (独立样本) 变量.
包含组内 (重复测量) 因素的研究设计 同时包含组间和组内因素的混合设计(e.g. 假设上
一个新的情境
一位研究者感兴趣影响儿童阅读能力的因素.研究者认 为儿童的年龄和每次阅读时间可能是重要的影响因素。 研究者设计了以下实验:选取三个年龄组的儿童: 3 岁, 8 岁, 和 14 岁.将每个年龄组的儿童随机分配到三个阅 读条件. 组 1阅读时间为 5 分钟; 组 2为15 分钟; 对于组 3为30 分钟.两个星期之后测试了这些儿童的阅读能 力。
方法 A:让学生只读课本, 不去上课. 方法 B:上课,记笔记,不读课本. 方法 C:不读课本,不去上课, 只看别
人的笔记
单因素, 独立测量研究设计的例子
Step 1: 陈述假设和设定标准 (选择 a) H0: m1 = m2 = m3 H1: 其中一个组与另一个(或更多)的组均值
step 3: 找出检验的 df. 注意要考虑几个 df step 4: 从表找出临界 F统计量 step 5:计算样本 的F统计量观测值 step 6:比较 F统计量的观测值与临界 F统计量 如果
F统计量的观测值 (Fobs) 在统计上显著地大于 1.0 则拒绝 H0
单因素, 独立测量研究设计的例子
方差的来源
什么造成样本的不同(处理间变异)
处理/组效应 - 处理造成的差异 个体差异效应 - 个体差异变异
随机误差
每一个样本内部的变异 (处理内变异)
个体差异效应 随机误差
ANOVA简介(2)
在方差分析中, 自变量称为因素.
包含一个自变量的研究称为单因素设计 (single-factor design).
F<或=1, 即MS组间/ MSw组内<1,说明数据的总 变异由分组不同造成的变异只占很小的部分, 大部分是由试验误差何个体差异所致,就是说 不同的实验处理之间变异不大,或者说试验处 理基本无效。
F>1而且落入F分布的临界区,说明实验数据的 变异由不同的实验处理所造成,即不同的试验 处理之间有差异。
不同。备择假设 可能的形式很多: m1不等于 m2 = m3
m1 = m3 不等于 m2 m1 = m2 不等于 m3 m1 不等于 m2 不等于 m3 因此,只需给出虚无假设就够了
单因素, 独立测量研究设计的例子
step 2: ANOVA 检验总是单尾. 因为不存在负的方差. F分布表也只有单侧的Alpha.(F分布图)
1. ANOVA的简介 2. ANOVA的逻辑 3. ANOVA的符号. 4. ANOVA的过程和例题 5. 事后检验
ANOVA简介(1)
方差分析即analysis of variance,简称 ANOVA。
功能:分析实验数据中不同来源的变异 对总变异的贡献大小,确定实验中的自 变量是否对因变量有重要影响。