统计学第七章方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
▪这个名字也表示:它是通过对数据误差来源的 分析判断不同总体的均值是否相等。因此,进 行方差分析时,需要考察数据误差的来源
可编辑ppt
3
一、方差分析的内容
方差分析主要用来对多个总体均值是否相等作 出假设检验。
例:某饮料制造商生产一种新型饮料,共有四 种颜色: (1)橘黄、(2)粉红、(3)绿色、(4)无色。
2. 计算公式为
ni
xij
xi
j1
ni
(i 1,2,,k)
式中: ni为第 i 个总体的样本观察值个数 xij 为第 i 个总体的第 j 个观察值
可编辑ppt
16
构造检验的统计量
(计算全部观察值的总均值 )
1. 全部观察值的总和除以观察值的总个数
2. 计算公式为
k ni
k
xij
ni xi
x i1 j1 i1
可编辑ppt
5
要知道颜色是否对饮料销售有显著影响,就是 要知道四种颜色饮料销售量的均值是否有显著差异, 即进行下述假设检验:
H0: 1=2=3=4
H1: 四个总体均值不全相等
其中, i(I=1,2,3,4) 表示所有饮料(无色、粉红、橘黄、绿色) 销售量之均值。
样本来自于一 个相同的总体
样本来自于不同的总体
取值不影响其他样本点的取值) ▪比如,每个超市的销售量都与其他超市的销售量独立
可编辑ppt
8
1. 在上述假定条件下,判断颜色对销售量是否有 显著影响,实际上也就是检验具有同方差的四 个正态总体的均值是否相等的问题
2. 如果四个总体的均值相等,可以期望四个样本 的均值也会很接近
▪ 四个样本的均值越接近,我们推断四个总体均值
例4:一个儿童食品制造商生产儿童麦片,该制造商认为 以下三种因素影响麦片味道:
(1)麦片中小麦与玉米的比例;
(2)甜味剂类型的选择:糖、蜂蜜等;
(3)制作时间的长短。
该例中,食品制造商通过生产出不同类型的麦片并邀请儿 童进行品尝试验,最后发现:
(1)麦片成份及甜味剂类型对麦片食味有很大影响;
(2)制作时间对麦片食味没有影响。
如果原假设成立:说明某因素不同水平的影响不显著(无系统 性影响),只剩下随机性影响,因此组间方差与组内方差差别不 大,它们的比接近于1。
如果原假设不成立:说明某因素不同水平的影响显著(存在系 统性影响),组间方差与组内方差差别较大,它们的比远超出1。
组间方差 F 组内方差
可编辑ppt
12
二、单因素方差分析的步骤
n
n
式中:n n1 n2 nk
可编辑ppt
17
构造检验的统计量
(前例计算结果 )
表8-2 四种颜色饮料的销售量及均值
超市 (j)
无色(A1)
水平A ( i ) 粉色(A2) 橘黄色(A3)
该制造商想知道颜色是否对销售量有显著影响, 随机抽取了5家超市前一期的销售量(下表)进 行分析。
可编辑ppt
4
下表 四种饮料销售量情况
样本均值 样本方差 样本标准差
27.32 来自百度文库.67 1.64
29.56 2.14 1.46
26.44 3.31 1.82
31.46 1.66 1.29
▪四种颜色可以看作是四个总体
(1)每个总体的相应变量(因素)服从正态分布 ▪对于因素的每一个水平,其观察值是来自服从正态分布
总体的简单随机样本
▪比如,每种颜色饮料的销售量必需服从正态分布 (2)所有总体相应变量(因素)的方差相等2
▪对于各组观察数据,是从具有相同方差的总体中抽取的 ▪比如,四种颜色饮料的销售量的方差都相同 (3)不同观察值(水平)相互独立(每个样本点的
可编辑ppt
6
二、方差分析的假设
1、相关术语 因素:是一个独立的变量,是方差分析的研究 对象
(上例中的饮料颜色); 水平:因素中的内容
(上例中饮料的四种颜色:无色、粉色、橘 黄色、绿色 )
单因素方差分析:只针对一个因素进行分析; 多因素方差分析:同时针对多个因素进行分析。
可编辑ppt
7
2、进行方差分析必须满足如下假设
第七章 方差分析
一、 方差分析的基本问题 二、 单因素方差分析 三、 双因素方差分析
可编辑ppt
1
一、 方差分析的基本问题
方差分析(Analysis of Variance, ANOVA)是假设 检验的一种延续与扩展,它可以解决诸如多个均值是 否相等等方面的检验问题,在因素分析中具有一定的 优势。
至少有一个总体的均值是不同的
有系统误差
这意味着四个样本分别来自均值不同的四个正态总 体
f(X)
3 1 2 4
可编辑ppt
X
11
三、方差分析的原理
观察值之间的差异来自两个方面:
某因素不同水平的影响 (系统性影响)
其他随机因素的影响 (随机性影响)
水平间方差 (组间方差)
水平内方差 (组内方差)
• 颜色对销售量有影响
可编辑ppt
14
构造检验的统计量
1. 为检验H0是否成立,需确定检验的统计量 2. 构造统计量需要计算
▪ 水平的均值 ▪ 全部观察值的总均值 ▪ 离差平方和 ▪ 均方(MS)
可编辑ppt
15
构造检验的统计量
1. 假定从第(i个计总算体水中平抽取的一均个值容量)为ni的简单
随机样本,第i个总体的样本均值为该样本的 全部观察值总和除以观察值的个数
可编辑ppt
2
因此,食品制造商可以对麦片成份及甜味
剂类型给予充分的关注以生产更合儿童口味的 麦片,而对制作时间不必太介意。
方差分析可以用来分析不同因素(如上例
中小麦与玉米的比例、甜味剂类型、制作时 间)对总体特征是否有显著影响。
▪所以叫方差分析,因为虽然我们感兴趣的是均 值,但在判断均值之间是否有差异时则需要借 助于方差
• 提出假设 • 构造检验统计量 • 统计决策
可编辑ppt
13
提出假设
1. 一般提法
▪ H0: 1 = 2 =…= k (因素有k个水平) ▪ H1: 1 ,2 ,… ,k不全相等
2. 对前面的例子
▪ H0: 1 = 2 = 3 = 4
• 颜色对销售量没有影响
▪ H0: 1 ,2 ,3, 4不全相等
相等的证据也就越充分
▪ 样本均值越不同,我们推断总体均值不同的证据
就越充分
可编辑ppt
9
如果原假设成立,即H0: 1 = 2 = 3 = 4
四种颜色饮料销售的均值都相等 没有系统误差
这意味着每个样本都来自均值为、差为2 的同一正态总体
f(X)
1 2 3 4
可编辑ppt
X
10
如果备择假设成立,即H1: i (i=1,2,3,4)不全相 等
相关文档
最新文档