方差分析与正交实验设计初步
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的因素或因子
2.水平或处理(treatment) ▪ 因子的不同表现 ▪ 零售业、旅游业、航空公司、家电制造业就是因子
的水平
3.观察值 ▪ 在每个因素水平下得到的样本数据 ▪ 每个行业被投诉的次数就是观察值
可整理ppt
10
4.试验
▪ 这里只涉及一个因素,因此称为单因素四水平的
试验
5.总体
▪ 因素的每一个水平可以看作是一个总体 ▪ 比如零售业、旅游业、航空公司、家电制造业可
以看作是四个总体
6.样本数据
▪ 被投诉次数可以看作是从这四个总体中抽取的样
本数据
可整理ppt
11
7.1.2方差分析的基本思想和原理
80
60
被投诉次数
40
20
0
0
零1 售业 2旅游业 3航空公司 4 家电制造 5
不同行业被投可整诉理pp次t 数的散点图
行业12
方差分析的基本思想和原理(图形分析)
1. 从散点图上可以看出
这种差异可能是由于抽样的随机性所造成的, 也有可能是系统性影响因素造成的。
4需要有更准确的方法来检验这种差异是否显著,也 就是进行方差分析
所以叫方差分析,因为虽然我们感兴趣的是均 值,但在判断均值之间是否有差异时则需要借 助于方差
这个名字也表示:它是通过对数据误差来源的 分析判断不同总体的均值是否相等。因此,进 行方差分析时,需要考察数据误差的来源
3
不同运动队的平均成绩之间是否有显著差异?
每个队伍的24箭成绩可以看作是该队伍射箭成绩的一个 随机样本。获得金牌、银牌和铜牌的队伍之间的射箭成 绩是否有显著差异呢?
如果采用第5章介绍的假设检验方法,用分布做两两的比 较,则需要做次数比较。这样做不仅繁琐,而且每次检 验犯第Ι类错误的概率都是一样的,作多次检验会使犯第Ι 类错误的概率相应地增加,检验完成时,犯第Ι类错误的 概率将会很大。同时,随着检验的次数的增加,偶然因 素导致差别的可能性也会增加。
是由于行业本身所造成的,后者所形成的误差是
由系统性因素造成的可整,理pp称t 为系统误差
16
方差分析的基本思想和原理(两类方差)
1. 数据的误差用平方和(sum of squares)表示,又 构成方差。
采用方差分析方法很容易解决这样的问题,它是同时考 虑所有的样本数据,一次检验即可判断多个总体的均值 是否相同,这不仅排除了犯错误的累积概率,也提高了 检验的效率。
可整理ppt
4
7.1 方差分析的基本思想
7.1.1方差分析的有关概念 7.1.2方差分析的基本思想和原理 7.1.3方差分析中的基本假定 7.1.4假设问题的一般提法
第 7 章 方差分析与正交实验设计初步
7.1 方差分析的基本思想 7.2 单因素方差分析 7.3 双因素方差分析 7.4 正交实验设计初步
可整理ppt
1
学习目标
方差分析的基本思想和原理 单因子方差分析 多重比较 双因子方差分析的方法 实验设计方法与数据分析
可整理ppt
2
不同运动队的平均成绩之间是否有显著差异?
奥运会女子团体射箭 比赛,每个队有3名 运动员。进入最后决 赛的运动队需要进行 4组射击,每个队员 进行两次射击。这样, 每个组共射出6箭, 4组共射出24箭
在2008年8月10日进 行 的 第 29 届 北 京 奥 运会女子团体射箭比 赛中,获得前3名的 运动队最后决赛的成 绩如下表所示
可整理ppt
不同行业被投诉的次数是有明显差异的
同一个行业,不同企业被投诉的次数也明显不同
家电制造被投诉的次数较高,航空公司被投诉的次数 较低
2. 行业与被投诉次数之间有一定的关系
如果行业与被投诉次数之间没有关系,那么它们 被投诉的次数应该差不多相同,在散点图上所呈 现的模式也就应该很接近
可整理ppt
13
3仅从散点图上观察还不能提供充分的证据证明不同 行业被投诉的次数之间有显著差异
可整理ppt
14
方差分析的基本思想和原理
1. 比较两类误差(系统性误差、随机误差), 以检验均值是否相等; 2. 比较的基础是方差比;
3.如果系统(处理)误差明显地不同于随机误差, 则均值就是不相等的;反之,均值就是相等的;
4. 误差是由各部分的误差占总误差的比例来测 度的。
可整理ppt
15
方差分析的基本思想和原理(两类误差)
单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量
可整理ppt
7
什么是方差分析? (例题分析) 一个
分类
【 例 】为了对几个行业的服务质量进行评价,消费者协会 变量 在四个行业分别抽取了不同的企业作为样本。最近一年中消
费者对总共23家企业投诉的次数如下表
消费者对四个行业的投诉次数
1. 随机误差
▪ 因素的同一水平(总体)下,样本各观察值之间的差
异
▪ 比如,同一行业下不同企业被投诉次数是不同的 ▪ 这种差异可以看成是随机因素的影响,称为随机
误差
2. 系统误差
因素的不同水平(不同总体)下,各观察值之间的差异
比如,不同行业之间的被投诉次数之间的差异
这种差异可能是由于抽样的随机性所造成的,也可能
可整理ppt
5
7.1.1方差分析的有关概念
可整理ppt
6
什么是方差分析(ANOVA)?
1)检验多个总体均值是否相等
▪ 通过分析数据的误差判断各总体均值是否相
等
2)研究分类型自变量对数值型因变量的影响
一个或多个分类尺度的自变量
两个或多个 (k 个) 处理水平或分类
一个间隔或比率尺度的因变量
3)有单因素方差分析和双因素方差分析
行业
观测值
零售业
旅游业
航空公司 家电制造业
1
57
68
31
44
2
66
39
49
51
3
49
29
21
65
4
40
45
34
77
5
34
56
40
58
6
53
51
7
44
可整理ppt
8
什么是方差分析?(例题分析)
1. 分析四个行业之间的服务质量是否有显著差 异,也就是要判断“行业”对“投诉次数” 是否有显著影响
2. 作出这种判断最终被归结为检验这四个行业
被投诉次数的均值是否相等。怎样检验?
3. 若它们的均值相等,则意味着“行业”对投 诉次数是没有影响的,即它们之间的服务质 量没有显著差异;若均值不全相等,则意味 着“行业”对投诉次数是有影响的,它们之 间的服务质量有显著差异。
可整理ppt
wenku.baidu.com
9
方差分析中的其他有关概念
1.因素或因子(factor) ▪ 所要检验的对象 ▪ 要分析行业对投诉次数是否有影响,行业是要检验
2.水平或处理(treatment) ▪ 因子的不同表现 ▪ 零售业、旅游业、航空公司、家电制造业就是因子
的水平
3.观察值 ▪ 在每个因素水平下得到的样本数据 ▪ 每个行业被投诉的次数就是观察值
可整理ppt
10
4.试验
▪ 这里只涉及一个因素,因此称为单因素四水平的
试验
5.总体
▪ 因素的每一个水平可以看作是一个总体 ▪ 比如零售业、旅游业、航空公司、家电制造业可
以看作是四个总体
6.样本数据
▪ 被投诉次数可以看作是从这四个总体中抽取的样
本数据
可整理ppt
11
7.1.2方差分析的基本思想和原理
80
60
被投诉次数
40
20
0
0
零1 售业 2旅游业 3航空公司 4 家电制造 5
不同行业被投可整诉理pp次t 数的散点图
行业12
方差分析的基本思想和原理(图形分析)
1. 从散点图上可以看出
这种差异可能是由于抽样的随机性所造成的, 也有可能是系统性影响因素造成的。
4需要有更准确的方法来检验这种差异是否显著,也 就是进行方差分析
所以叫方差分析,因为虽然我们感兴趣的是均 值,但在判断均值之间是否有差异时则需要借 助于方差
这个名字也表示:它是通过对数据误差来源的 分析判断不同总体的均值是否相等。因此,进 行方差分析时,需要考察数据误差的来源
3
不同运动队的平均成绩之间是否有显著差异?
每个队伍的24箭成绩可以看作是该队伍射箭成绩的一个 随机样本。获得金牌、银牌和铜牌的队伍之间的射箭成 绩是否有显著差异呢?
如果采用第5章介绍的假设检验方法,用分布做两两的比 较,则需要做次数比较。这样做不仅繁琐,而且每次检 验犯第Ι类错误的概率都是一样的,作多次检验会使犯第Ι 类错误的概率相应地增加,检验完成时,犯第Ι类错误的 概率将会很大。同时,随着检验的次数的增加,偶然因 素导致差别的可能性也会增加。
是由于行业本身所造成的,后者所形成的误差是
由系统性因素造成的可整,理pp称t 为系统误差
16
方差分析的基本思想和原理(两类方差)
1. 数据的误差用平方和(sum of squares)表示,又 构成方差。
采用方差分析方法很容易解决这样的问题,它是同时考 虑所有的样本数据,一次检验即可判断多个总体的均值 是否相同,这不仅排除了犯错误的累积概率,也提高了 检验的效率。
可整理ppt
4
7.1 方差分析的基本思想
7.1.1方差分析的有关概念 7.1.2方差分析的基本思想和原理 7.1.3方差分析中的基本假定 7.1.4假设问题的一般提法
第 7 章 方差分析与正交实验设计初步
7.1 方差分析的基本思想 7.2 单因素方差分析 7.3 双因素方差分析 7.4 正交实验设计初步
可整理ppt
1
学习目标
方差分析的基本思想和原理 单因子方差分析 多重比较 双因子方差分析的方法 实验设计方法与数据分析
可整理ppt
2
不同运动队的平均成绩之间是否有显著差异?
奥运会女子团体射箭 比赛,每个队有3名 运动员。进入最后决 赛的运动队需要进行 4组射击,每个队员 进行两次射击。这样, 每个组共射出6箭, 4组共射出24箭
在2008年8月10日进 行 的 第 29 届 北 京 奥 运会女子团体射箭比 赛中,获得前3名的 运动队最后决赛的成 绩如下表所示
可整理ppt
不同行业被投诉的次数是有明显差异的
同一个行业,不同企业被投诉的次数也明显不同
家电制造被投诉的次数较高,航空公司被投诉的次数 较低
2. 行业与被投诉次数之间有一定的关系
如果行业与被投诉次数之间没有关系,那么它们 被投诉的次数应该差不多相同,在散点图上所呈 现的模式也就应该很接近
可整理ppt
13
3仅从散点图上观察还不能提供充分的证据证明不同 行业被投诉的次数之间有显著差异
可整理ppt
14
方差分析的基本思想和原理
1. 比较两类误差(系统性误差、随机误差), 以检验均值是否相等; 2. 比较的基础是方差比;
3.如果系统(处理)误差明显地不同于随机误差, 则均值就是不相等的;反之,均值就是相等的;
4. 误差是由各部分的误差占总误差的比例来测 度的。
可整理ppt
15
方差分析的基本思想和原理(两类误差)
单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量
可整理ppt
7
什么是方差分析? (例题分析) 一个
分类
【 例 】为了对几个行业的服务质量进行评价,消费者协会 变量 在四个行业分别抽取了不同的企业作为样本。最近一年中消
费者对总共23家企业投诉的次数如下表
消费者对四个行业的投诉次数
1. 随机误差
▪ 因素的同一水平(总体)下,样本各观察值之间的差
异
▪ 比如,同一行业下不同企业被投诉次数是不同的 ▪ 这种差异可以看成是随机因素的影响,称为随机
误差
2. 系统误差
因素的不同水平(不同总体)下,各观察值之间的差异
比如,不同行业之间的被投诉次数之间的差异
这种差异可能是由于抽样的随机性所造成的,也可能
可整理ppt
5
7.1.1方差分析的有关概念
可整理ppt
6
什么是方差分析(ANOVA)?
1)检验多个总体均值是否相等
▪ 通过分析数据的误差判断各总体均值是否相
等
2)研究分类型自变量对数值型因变量的影响
一个或多个分类尺度的自变量
两个或多个 (k 个) 处理水平或分类
一个间隔或比率尺度的因变量
3)有单因素方差分析和双因素方差分析
行业
观测值
零售业
旅游业
航空公司 家电制造业
1
57
68
31
44
2
66
39
49
51
3
49
29
21
65
4
40
45
34
77
5
34
56
40
58
6
53
51
7
44
可整理ppt
8
什么是方差分析?(例题分析)
1. 分析四个行业之间的服务质量是否有显著差 异,也就是要判断“行业”对“投诉次数” 是否有显著影响
2. 作出这种判断最终被归结为检验这四个行业
被投诉次数的均值是否相等。怎样检验?
3. 若它们的均值相等,则意味着“行业”对投 诉次数是没有影响的,即它们之间的服务质 量没有显著差异;若均值不全相等,则意味 着“行业”对投诉次数是有影响的,它们之 间的服务质量有显著差异。
可整理ppt
wenku.baidu.com
9
方差分析中的其他有关概念
1.因素或因子(factor) ▪ 所要检验的对象 ▪ 要分析行业对投诉次数是否有影响,行业是要检验