第4讲_方差分析概论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
平,采用t检验法要进行 C32 3次两两平 均数间的差异检验;若有k个处理,则要 作 k(k-1)/2次类似的检验。
多个平均数的差异检验不适合用T检验
• 2、无统一的误差估计,且检验的灵敏性低
对同一试验的多个处理进行比较时,应该 有一个统一的误差的估计值。若用 t 检验法作 两两比较,由于每次比较需计算一个标准误来 估计误差,故使得各次误差的估计不统一。同 时由于没有充分利用资料所提供的信息而使误 差估计的精确性降低,从而降低检验的灵敏性。
方差分析的逻辑
变异分解:
SS总 SS组间 SS组内
造成变异的原因有两个:
1. 随机因素造成的变异,记为 SS随机
2. 教材种类(解释变量)不同造成的变异,即 因为不同总体的均数不等造成的变异,记为
SS教材
组内变异只是由随机因素造成的,即:
SS组内 SS组内_随机
组间变异即有随机因素,也有教材种类不同造成的变异
多个平均数的差异检验不适合用T检验
• 3、推断的可靠性低,检验的 I 型错误率(α)大
用T 检验法进行多个处理平均数间的差异检验会
增大犯I型错误的概率,降低推断的可靠性。比如
用T 检验法进行3水平的均数间的差异检验,若两
两比较推断正确的概率为95%,因为一共要做3次 比较,则所有比较都正确的概率为0.953=0.86。
作业:08-01
51个人参与一项减肥训练 Data05-07
num gender wbefore wafter dw
1
1
2
1
…
72.0
70.0
2.0
66.0
60.0
6.0
问题1:减肥前后的体重是否有差异?
问题2:体重差量在男女之间是否有差异?
结果报告
答:方差齐性检验结果 F = 5.649;p = 0.021 < 0.05(SPSS结果,Levene's Test)
方差分析过程
1. 提出假设: H0 : 1 2 ... k (k为组数)
H1 : 至少有一对总体均数不 等
2. 计算检验统计量:
SS组间 n教材i (xi. x..)2 SS组内 (xij xi.)2
df组间 k 1
df组内 (n教材i 1)
统计检验量 F SS组间/ df组间 SS组内 / df组内
多个平均数差异检验应采用方差分析( analysis of variance )
第5讲:方差分析
主要内容
• 方差分析的基本思想
• 单因素方差分析(软件应用)
– 独立样本 – 相关样本
• 两因素方差分析(软件应用)
方差分析的基础:变异的分解
总体
教材 1 μ1=? 教材 2 μ2=? 教材 3 μ3=?
教材1 70 72 74 68 76 76 77 71
X1 73
教材2 73 72 70 73 78 75 77 74
X 2 74
教材3 74 75 72 71 87 85 84 84
X 3 79
可不可以用T检验进行两两教材之间的比较来解决该问题?
多个平均数的差异检验不适合用T检验
• 1、检验过程烦琐 例如,一实验中解释变量包含3个水
SS组间 n教材i (xi. x..)2 SS组内 (xij xi.)2
样本均数
x1.=73 x2.=74 x3.=79 x..=75.3
方差分析的基础:变异的分解
总体
样本(测试成绩)N = ∑n 教材 i = 24 样本均数
教材 1 μ1=? 教材 2 μ2=? 教材 3 μ3=?
x11=70 x21=73 x31=74
SS组间 SS组间_随机 SS教材
方差分析的逻辑
目标:考察教材种类是否影响成绩。这个问题就转化为考
察教材种类所引起的变异是否存在,即 SS教材 是否大于0?
因为 SS组内 SS组内_随机 SS组间 SS组间_随机 SS教材
所以可以比较 SS组内和SS组间 的变异来考察 SS教材是否大于0
由度”
如果比值 F
SS组间/ df组间 SS组内 / df组内
1,
说明SS教材大于0
如果比值 F
SS组间/ df组间 SS组内 / df组内
1,
说明SS教材等于0
统计检验量
F
SS组间/ df组间 SS组内 / df组内
~
F (df组间,df组内)
方差分析就是根据F分布对检验统计量F 值是否
在统计学意义上大于 1 (单侧检验)进行假设检验
x12=72 x22=72 x32=75
单个观察值的变异: (xij x..)2
…
x18=71
wk.baidu.com
…
x28=74
…
x38=84
离均差平方
x1.=73 x2.=74 x3.=79 x..=75.3
造成变异的原因有两个:
1. 随机因素造成的变异,记为 SS随机
2. 教材种类(解释变量)不同造成的变异,即
因为不同总体的均数不等造成的变异,记为 SS教材
?
F = 1.682;p = 0.100 > 0.05(Excel结果,简单的F 检验)
两个软件结果发生矛盾时,倾向采用SPSS的结果
例子:教材有差别吗?
现有三种教材,随机选取24名被试,将其随机分成3组,各 组采用一种教材进行学习。事后进行测试,测试结果如下, 问3种教材对于学习的效果是否一致?
样本(测试成绩)N = ∑n 教材 i = 24
x11=70
x12=72
…
x18=71
x21=73
x22=72
…
x28=74
x31=74
x32=75
…
x38=84
单个观察值的变异: (xij x..)2
离均差平方
总变异:
SS总 (xij x..)2
变异分解: 组间变异: 组内变异:
SS总 SS组间 SS组内
怎么比较?
通过差值比较 差值 SS组间 SS组内 通过比值比较 比值 SS 组间
SS组内 因为比值服从F分布
方差分析的逻辑
所以可以比较 SS组内和SS组间 的比值来考察 SS教材是否大于0
如果比值 F
SS 组间 SS组内
1,
说明SS教材大于0
如果比值 F
SS 组间 SS组内
1,
说明SS教材等于0
SS组内 SS组内_随机
SS组间 SS组间_随机 SS教材
这样比是否合理?
组内随机变异与组间随机变异的自由度不一致
组内随机变异的自由度
df组内 (n教材1 1) (n教材2 1) (n教材3 1)
组间随机变异的自由度 df组间 教材种类 1
方差分析的逻辑
合理做法:比较“组间变异/组间自由度”和“组内变异/组内自
多个平均数的差异检验不适合用T检验
• 2、无统一的误差估计,且检验的灵敏性低
对同一试验的多个处理进行比较时,应该 有一个统一的误差的估计值。若用 t 检验法作 两两比较,由于每次比较需计算一个标准误来 估计误差,故使得各次误差的估计不统一。同 时由于没有充分利用资料所提供的信息而使误 差估计的精确性降低,从而降低检验的灵敏性。
方差分析的逻辑
变异分解:
SS总 SS组间 SS组内
造成变异的原因有两个:
1. 随机因素造成的变异,记为 SS随机
2. 教材种类(解释变量)不同造成的变异,即 因为不同总体的均数不等造成的变异,记为
SS教材
组内变异只是由随机因素造成的,即:
SS组内 SS组内_随机
组间变异即有随机因素,也有教材种类不同造成的变异
多个平均数的差异检验不适合用T检验
• 3、推断的可靠性低,检验的 I 型错误率(α)大
用T 检验法进行多个处理平均数间的差异检验会
增大犯I型错误的概率,降低推断的可靠性。比如
用T 检验法进行3水平的均数间的差异检验,若两
两比较推断正确的概率为95%,因为一共要做3次 比较,则所有比较都正确的概率为0.953=0.86。
作业:08-01
51个人参与一项减肥训练 Data05-07
num gender wbefore wafter dw
1
1
2
1
…
72.0
70.0
2.0
66.0
60.0
6.0
问题1:减肥前后的体重是否有差异?
问题2:体重差量在男女之间是否有差异?
结果报告
答:方差齐性检验结果 F = 5.649;p = 0.021 < 0.05(SPSS结果,Levene's Test)
方差分析过程
1. 提出假设: H0 : 1 2 ... k (k为组数)
H1 : 至少有一对总体均数不 等
2. 计算检验统计量:
SS组间 n教材i (xi. x..)2 SS组内 (xij xi.)2
df组间 k 1
df组内 (n教材i 1)
统计检验量 F SS组间/ df组间 SS组内 / df组内
多个平均数差异检验应采用方差分析( analysis of variance )
第5讲:方差分析
主要内容
• 方差分析的基本思想
• 单因素方差分析(软件应用)
– 独立样本 – 相关样本
• 两因素方差分析(软件应用)
方差分析的基础:变异的分解
总体
教材 1 μ1=? 教材 2 μ2=? 教材 3 μ3=?
教材1 70 72 74 68 76 76 77 71
X1 73
教材2 73 72 70 73 78 75 77 74
X 2 74
教材3 74 75 72 71 87 85 84 84
X 3 79
可不可以用T检验进行两两教材之间的比较来解决该问题?
多个平均数的差异检验不适合用T检验
• 1、检验过程烦琐 例如,一实验中解释变量包含3个水
SS组间 n教材i (xi. x..)2 SS组内 (xij xi.)2
样本均数
x1.=73 x2.=74 x3.=79 x..=75.3
方差分析的基础:变异的分解
总体
样本(测试成绩)N = ∑n 教材 i = 24 样本均数
教材 1 μ1=? 教材 2 μ2=? 教材 3 μ3=?
x11=70 x21=73 x31=74
SS组间 SS组间_随机 SS教材
方差分析的逻辑
目标:考察教材种类是否影响成绩。这个问题就转化为考
察教材种类所引起的变异是否存在,即 SS教材 是否大于0?
因为 SS组内 SS组内_随机 SS组间 SS组间_随机 SS教材
所以可以比较 SS组内和SS组间 的变异来考察 SS教材是否大于0
由度”
如果比值 F
SS组间/ df组间 SS组内 / df组内
1,
说明SS教材大于0
如果比值 F
SS组间/ df组间 SS组内 / df组内
1,
说明SS教材等于0
统计检验量
F
SS组间/ df组间 SS组内 / df组内
~
F (df组间,df组内)
方差分析就是根据F分布对检验统计量F 值是否
在统计学意义上大于 1 (单侧检验)进行假设检验
x12=72 x22=72 x32=75
单个观察值的变异: (xij x..)2
…
x18=71
wk.baidu.com
…
x28=74
…
x38=84
离均差平方
x1.=73 x2.=74 x3.=79 x..=75.3
造成变异的原因有两个:
1. 随机因素造成的变异,记为 SS随机
2. 教材种类(解释变量)不同造成的变异,即
因为不同总体的均数不等造成的变异,记为 SS教材
?
F = 1.682;p = 0.100 > 0.05(Excel结果,简单的F 检验)
两个软件结果发生矛盾时,倾向采用SPSS的结果
例子:教材有差别吗?
现有三种教材,随机选取24名被试,将其随机分成3组,各 组采用一种教材进行学习。事后进行测试,测试结果如下, 问3种教材对于学习的效果是否一致?
样本(测试成绩)N = ∑n 教材 i = 24
x11=70
x12=72
…
x18=71
x21=73
x22=72
…
x28=74
x31=74
x32=75
…
x38=84
单个观察值的变异: (xij x..)2
离均差平方
总变异:
SS总 (xij x..)2
变异分解: 组间变异: 组内变异:
SS总 SS组间 SS组内
怎么比较?
通过差值比较 差值 SS组间 SS组内 通过比值比较 比值 SS 组间
SS组内 因为比值服从F分布
方差分析的逻辑
所以可以比较 SS组内和SS组间 的比值来考察 SS教材是否大于0
如果比值 F
SS 组间 SS组内
1,
说明SS教材大于0
如果比值 F
SS 组间 SS组内
1,
说明SS教材等于0
SS组内 SS组内_随机
SS组间 SS组间_随机 SS教材
这样比是否合理?
组内随机变异与组间随机变异的自由度不一致
组内随机变异的自由度
df组内 (n教材1 1) (n教材2 1) (n教材3 1)
组间随机变异的自由度 df组间 教材种类 1
方差分析的逻辑
合理做法:比较“组间变异/组间自由度”和“组内变异/组内自