统计学:第七章 方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因此,食品制造商可以对麦片成份及甜味 剂类型给予充分的关注以生产更合儿童口味的 麦片,而对制作时间不必太介意。 方差分析可以用来分析不同因素(如上例 中小麦与玉米的比例、甜味剂类型、制作时 间)对总体特征是否有显著影响。
所以叫方差分析,因为虽然我们感兴趣的是均 值,但在判断均值之间是否有差异时则需要借 助于方差 这个名字也表示:它是通过对数据误差来源的 分析判断不同总体的均值是否相等。因此,进 行方差分析时,需要考察数据误差的来源
单因素方差分析:只针对一个因素进行分析; 多因素方差分析:同时针对多个因素进行分析。
2、进行方差分析必须满足如下假设 (1)每个总体的相应变量(因素)服从正态分布 对于因素的每一个水平,其观察值是来自服从正态分布
总体的简单随机样本 比如,每种颜色饮料的销售量必需服从正态分布
(2)所有总体相应变量(因素)的方差相等2 对于各组观察数据,是从具有相同方差的总体中抽取的 比如,四种颜色饮料的销售量的方差都相同 (3)不同观察值(水平)相互独立(每个样本点的
如果原假设成立:说明某因素不同水平的影响不显著(无系统 性影响),只剩下随机性影响,因此组间方差与组内方差差别不 大,它们的比接近于1。 如果原假设不成立:说明某因素不同水平的影响显著(存在系 统性影响),组间方差与组内方差差别较大,它们的比远超出1。
组间方差 F 组内方差
二、单因素方差分析的步骤 • 提出假设 • 构造检验统计量 • 统计决策
相等的证据也就越充分 样本均值越不同,我们推断总体均值不同的证据 就越充分

如果原假设成立,即H0: 1 = 2 = 3 = 4

四种颜色饮料销售的均值都相等 没有系统误差

这意味着每个样本都来自均值为、差为2 的同一正态总体
f(X)
1 2 3 4
X

提出假设
1.
一般提法

2.
H0: 1 = 2 =…= k (因素有k个水平) H1: 1 ,2 ,… ,k不全相等
对前面的例子 H0: 1 = 2 = 3 = 4
• 颜色对销售量没有影响 H0: 1 ,2 ,3, 4不全相等 • 颜色对销售量有影响
构造检验的统计量
n n 式中:n n1 n2 nk

n x
i 1
i i
构造检验的统计量
表8-2 四种颜色饮料的销售量及均值
超市 (j)
1 2 3 4 5
合计
(前例计算结果 )
水平A ( i )
粉色(A2)
31.2 28.3 30.8 27.9 29.6
取值不影响其他样本点的取值) 比如,每个超市的销售量都与其他超市的销售量独立
1.
2.
在上述假定条件下,判断颜色对销售量是否有 显著影响,实际上也就是检验具有同方差的四 个正态总体的均值是否相等的问题 如果四个总体的均值相等,可以期望四个样本 的均值也会很接近 四个样本的均值越接近,我们推断四个总体均值
27.32 2.67 1.64
29.56 2.14 1.46
26.44 3.31 1.82
31.46 1.66 1.29
四种颜色可以看作是四个总体
要知道颜色是否对饮料销售有显著影响,就是 要知道四种颜色饮料销售量的均值是否有显著差 异,即进行下述假设检验: H0: 1=2=3=4
H1: 四个总体均值不全相等
xi
x
j 1
ni
ij
ni
(i 1,2,, k )
式中: ni为第 i 个总体的样本观察值个数 xij 为第 i 个总体的第 j 个观察值
构造检验的统计量
1. 全部观察值的总和除以观察值的总个数 2. 计算公式为
x
(计算全部观察值的总均值 )
k ni kHale Waihona Puke Baidu
x
i 1 j 1
ij
一、方差分析的内容
方差分析主要用来对多个总体均值是否相等作 出假设检验。 例:某饮料制造商生产一种新型饮料,共有四 种颜色: (1)橘黄、(2)粉红、(3)绿色、(4)无色。 该制造商想知道颜色是否对销售量有显著影响, 随机抽取了5家超市前一期的销售量(下表)进 行分析。
下表
四种饮料销售量情况
样本均值 样本方差 样本标准差
如果备择假设成立,即H1: i (i=1,2,3,4)不全相 等

至少有一个总体的均值是不同的 有系统误差

这意味着四个样本分别来自均值不同的四个正态总

f(X)
3 1 2 4
X
三、方差分析的原理
观察值之间的差异来自两个方面: 某因素不同水平的影响 (系统性影响) 水平间方差 (组间方差) 其他随机因素的影响 (随机性影响) 水平内方差 (组内方差)
其中, i(I=1,2,3,4) 表示所有饮料(无色、粉红、橘黄、绿色) 销售量之均值。
样本来自于一 个相同的总体
样本来自于不同的总体
二、方差分析的假设
1、相关术语 因素:是一个独立的变量,是方差分析的研究 对象 (上例中的饮料颜色);
水平:因素中的内容 (上例中饮料的四种颜色:无色、粉色、橘 黄色、绿色 )
第七章 方差分析


一、 方差分析的基本问题 二、 单因素方差分析 三、 双因素方差分析
一、 方差分析的基本问题
方差分析(Analysis of Variance, ANOVA)是假设 检验的一种延续与扩展,它可以解决诸如多个均值是 否相等等方面的检验问题,在因素分析中具有一定的 优势。
例4:一个儿童食品制造商生产儿童麦片,该制造商认为 以下三种因素影响麦片味道: (1)麦片中小麦与玉米的比例; (2)甜味剂类型的选择:糖、蜂蜜等; (3)制作时间的长短。 该例中,食品制造商通过生产出不同类型的麦片并邀请儿 童进行品尝试验,最后发现: (1)麦片成份及甜味剂类型对麦片食味有很大影响; (2)制作时间对麦片食味没有影响。
1.
2.
为检验H0是否成立,需确定检验的统计量 构造统计量需要计算 水平的均值 全部观察值的总均值 离差平方和 均方(MS)
构造检验的统计量
1. 假定从第i个总体中抽取一个容量为 ni的简单 2.
随机样本,第i个总体的样本均值为该样本的 全部观察值总和除以观察值的个数 计算公式为
(计算水平的均值 )
相关文档
最新文档