方差分析1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Hypothesis Test
Ho: 1 2 3 4 Ha: At least one k is different
为决定是否接受零假设, 我们将利用方差分析表计算检验统计量F
SOURCE BETWEEN WITHIN
TOTAL
SS
df
MS (=SS/df)
SS(Factor) g - 1
g
SS(Error) (nj 1 )
与控制图 比较
子组内部 波动
Total = between + within
9
Response
ANOVA基础----平方和
70
65
60
55
1
2
3
4
Factor
yj - 组 均 值
y- 总 均 值
yij - 单 值
i = 第j组的第i 个观察值 j = 第j组 g = 总组 数
g nj
g
g nj
( yij y)2 n j ( y j y)2
检 验2个或2个以上因素在不同水平时的效应(双因素或 多因素方差分析---two-way or higher ANOVA)
用方差分析法来分析总波动中各个因素的波动组成,从而 得出方差分量(variance components)的估计值.
2
单因素方差分析与双样本t 检验
双 样 本T 检 验
Old Method 16.3 15.2 14.9 19.2 20.1 13.2 15.8
5
单因素方差分析
单因素方差分析是一种比较2组以上数据均值的统计方 法
检验假设:
Ho : 1 2 3 4 ... k Ha : At least one k is different
简而言之, ANOVA 只检验均值是否存在差异,但并不 能指出哪些均值与众不同,要回答这一问题,需用多重比 较法.
j 1
( ) SS(Total)
g
nj 1
j 1
SS(Factor)/(g - 1)
g
SS(Error)/(nj 1 ) j 1
F {=MS(Factor)/MS(Error)} MS(Factor) / MS(Error)
误差的共同方差
方差分析表 标准形式
为何称组内波动为误差或噪声. F值有何意义? F值大意味什么?
输出
50
40
x
30
20
x
x
10
1
2
3
A 因素A 是指线路板焊接过程中的预热温度.
图中横坐标表示预热温度的三个水平设置.
纵坐标输出表示每块线路板上的平均焊接缺陷数.
问: 因素A的不同水平是否对输出有影响, 为什么? 要做出正确判断还需什么信息?
4
方差分析
输出
50
x
40
30 x
20 x
10
1
2
3
A
现在你的结论如何? 因素A是否会产生输出差异?为什么 ?
Ho : 1 2 3 4
4组均值是否确实有差异?
Ha : At least one k is different
8
方差分析
ANOVA考察三种波动来源: » 总 体 = 所有观察值的总体波动 » 组 间 = 各组均值之间的波动(因素) » 组 内 = 各组内部的随机波动(噪声,统计误差)
子组之间 波动
• 数据堆栈后,用下列命令产生主效应图: Stat>ANOVA>Main Effects Plots
distance
dimple 1 dimple 2 dimple 3 dimple 4
Main Effects Plot - Data Means for distance
305
295
285
275
1
2
3
4
dimple pattern
方差分析
(ANOVA)
Measure Analyze Improve Control
1
学习目标
从双样本t检验过渡到更一般的情况,即比较2组以上数 据的均值(单因素方差分析--- one-way ANOVA)
如果各组均值存在显著差异,能指出是哪些组的均值与 众不同(多重 比较---multiple comparisons )
Dimple 2 281 299 317 286 290 295
Dimple 3 304 295 317 299 304 304
Dimple 4 250 277 268 272 281 286 281 263
golf.mtw
7
ANOVA 涉及的问题
各种凹陷形式的平均射程是否相同? 即4 组样本是否来自同一总体?
11
用Minitab进行方差分析
打开文件golf.mtw Minitab通过统计法和图表法进行方差分析.
» 图表法 – 主效应图 – 区间图
» 统计法 – 方差分析表
稍后我们会学习如何确定哪些组对之间存在差异? » 多重比较
12
图表法 - 主效应图
• 要产生主效应图,首先需将各组数据堆栈,命令如下: Manip>Stack/Unstack>Stack
New Method 20.7 16.6 18.1 22 均值是否有差 异?
如 何 比 较 更 多 的 方 法?
Method 1 16.3 15.2 14.9 19.2 20.1 13.2 15.8
Method 2 19.3 17.4 19.0 22.3 21.6 14.1 19.6
( yij y j )2
j1 i1
j 1
j1 i1
SS(Total) SS(Factor) SS(Error)
SS(Tot) SS(Factor) SS(Error)
= 总平方和
(单值-总均值)
= 组间平方和(因素平方和) (组均值-总均值)
= 组内平方和(误差平方和) (单值-组均值)
10
方差分析表
Method 3 20.4 19.6 20.4 23.5 24.8 15.8 23.6
Method 4 22.2 21.9 23.7 25.6 25.8 16.6 23.9
问: 各 种 方 法 的 均 值 是 否 有 差 异?
如 存 在 差 异, 究 竟 是 哪 些 方 法 与 众 不 同?
3
是否存在差异?
为什么不用 t 检验两两比较?
6
举例
一高尔夫设计人员需从四种凹陷形式中选取一种, 他想了解不同的 凹陷形式是否对球的射程有影响.
现有4 种凹陷形式的高尔夫球共24 个. 输入变量是凹陷形式,输出变量是射程. 实验采用美国高尔夫协会采用的标准测试器, 实验用球随机抽取,
为什么?
Dimple 1 277 268 281 263
Ho: 1 2 3 4 Ha: At least one k is different
为决定是否接受零假设, 我们将利用方差分析表计算检验统计量F
SOURCE BETWEEN WITHIN
TOTAL
SS
df
MS (=SS/df)
SS(Factor) g - 1
g
SS(Error) (nj 1 )
与控制图 比较
子组内部 波动
Total = between + within
9
Response
ANOVA基础----平方和
70
65
60
55
1
2
3
4
Factor
yj - 组 均 值
y- 总 均 值
yij - 单 值
i = 第j组的第i 个观察值 j = 第j组 g = 总组 数
g nj
g
g nj
( yij y)2 n j ( y j y)2
检 验2个或2个以上因素在不同水平时的效应(双因素或 多因素方差分析---two-way or higher ANOVA)
用方差分析法来分析总波动中各个因素的波动组成,从而 得出方差分量(variance components)的估计值.
2
单因素方差分析与双样本t 检验
双 样 本T 检 验
Old Method 16.3 15.2 14.9 19.2 20.1 13.2 15.8
5
单因素方差分析
单因素方差分析是一种比较2组以上数据均值的统计方 法
检验假设:
Ho : 1 2 3 4 ... k Ha : At least one k is different
简而言之, ANOVA 只检验均值是否存在差异,但并不 能指出哪些均值与众不同,要回答这一问题,需用多重比 较法.
j 1
( ) SS(Total)
g
nj 1
j 1
SS(Factor)/(g - 1)
g
SS(Error)/(nj 1 ) j 1
F {=MS(Factor)/MS(Error)} MS(Factor) / MS(Error)
误差的共同方差
方差分析表 标准形式
为何称组内波动为误差或噪声. F值有何意义? F值大意味什么?
输出
50
40
x
30
20
x
x
10
1
2
3
A 因素A 是指线路板焊接过程中的预热温度.
图中横坐标表示预热温度的三个水平设置.
纵坐标输出表示每块线路板上的平均焊接缺陷数.
问: 因素A的不同水平是否对输出有影响, 为什么? 要做出正确判断还需什么信息?
4
方差分析
输出
50
x
40
30 x
20 x
10
1
2
3
A
现在你的结论如何? 因素A是否会产生输出差异?为什么 ?
Ho : 1 2 3 4
4组均值是否确实有差异?
Ha : At least one k is different
8
方差分析
ANOVA考察三种波动来源: » 总 体 = 所有观察值的总体波动 » 组 间 = 各组均值之间的波动(因素) » 组 内 = 各组内部的随机波动(噪声,统计误差)
子组之间 波动
• 数据堆栈后,用下列命令产生主效应图: Stat>ANOVA>Main Effects Plots
distance
dimple 1 dimple 2 dimple 3 dimple 4
Main Effects Plot - Data Means for distance
305
295
285
275
1
2
3
4
dimple pattern
方差分析
(ANOVA)
Measure Analyze Improve Control
1
学习目标
从双样本t检验过渡到更一般的情况,即比较2组以上数 据的均值(单因素方差分析--- one-way ANOVA)
如果各组均值存在显著差异,能指出是哪些组的均值与 众不同(多重 比较---multiple comparisons )
Dimple 2 281 299 317 286 290 295
Dimple 3 304 295 317 299 304 304
Dimple 4 250 277 268 272 281 286 281 263
golf.mtw
7
ANOVA 涉及的问题
各种凹陷形式的平均射程是否相同? 即4 组样本是否来自同一总体?
11
用Minitab进行方差分析
打开文件golf.mtw Minitab通过统计法和图表法进行方差分析.
» 图表法 – 主效应图 – 区间图
» 统计法 – 方差分析表
稍后我们会学习如何确定哪些组对之间存在差异? » 多重比较
12
图表法 - 主效应图
• 要产生主效应图,首先需将各组数据堆栈,命令如下: Manip>Stack/Unstack>Stack
New Method 20.7 16.6 18.1 22 均值是否有差 异?
如 何 比 较 更 多 的 方 法?
Method 1 16.3 15.2 14.9 19.2 20.1 13.2 15.8
Method 2 19.3 17.4 19.0 22.3 21.6 14.1 19.6
( yij y j )2
j1 i1
j 1
j1 i1
SS(Total) SS(Factor) SS(Error)
SS(Tot) SS(Factor) SS(Error)
= 总平方和
(单值-总均值)
= 组间平方和(因素平方和) (组均值-总均值)
= 组内平方和(误差平方和) (单值-组均值)
10
方差分析表
Method 3 20.4 19.6 20.4 23.5 24.8 15.8 23.6
Method 4 22.2 21.9 23.7 25.6 25.8 16.6 23.9
问: 各 种 方 法 的 均 值 是 否 有 差 异?
如 存 在 差 异, 究 竟 是 哪 些 方 法 与 众 不 同?
3
是否存在差异?
为什么不用 t 检验两两比较?
6
举例
一高尔夫设计人员需从四种凹陷形式中选取一种, 他想了解不同的 凹陷形式是否对球的射程有影响.
现有4 种凹陷形式的高尔夫球共24 个. 输入变量是凹陷形式,输出变量是射程. 实验采用美国高尔夫协会采用的标准测试器, 实验用球随机抽取,
为什么?
Dimple 1 277 268 281 263