统计学贾俊平第10章 方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

C 21.2 21.8 22.4 22 21.6 21.8 0.447 0.200
All rights reserved
基本思想
A 18.2 19.4 19.6 19 18.8 19 0.548 0.300 B 19.8 21 20 20.8 20.4 20.4 0.510 0.260 C 21.2 21.8 22.4 22 21.6 21.8 0.447 0.200
9
All rights reserved
实验设计
概念


广义理解是指实验研究课题设计,也就是 整个实验计划的拟定 狭义的理解是指实验单位的选取、重复数 目的确定及实验单位的分组 实验设计的目的是避免系统误差,控 制、降低实验误差,无偏估计处理效 应,从而对样本所在总体作出可靠、 正确的推断
10
20
All rights reserved
方差分析的概念

推断的可靠性低,检验的 I 型错误率大,如果每组 的显著水平皆为α,则全体比较的显著水平会高于 α



假设我们在.05的显著水平下要检定下列零假设: H0: u1=u2=u3 如果拆成下列三组零假设: H0: u1=u2 , H0: u1=u3 , H0: u2=u3 每个假设被「接受」的概率为.95,三个假设全部被接 受的概率为.953=.857,也就是说当假设为真但被推翻 的概率为(1 - 0.857) = 0.143 > 0.05 远高于显著水 平
All rights reserved
实验设计
实验设计三原则

重复

重复是指试验中同一处理实施在两个或两个 以上的试验单位上

随机化
随机化是指在对实验对象进行分组时必须使 用随机的方法,使对象进入各实验组的机会 相等,以避免试验对象分组时实验人员主观 倾向的影响 双盲

11
All rights reserved
C B A 15 17 19
27
21
23
25
27
All rights reserved
基本思想
A 18.2 19.4 19.6 19 18.8 19 0.548 0.300 B 19.8 21 20 20.8 20.4 20.4 0.510 0.260 C 21.2 21.8 22.4 22 21.6 21.8 0.447 0.200
15
All rights reserved
随机化区组设计
16
All rights reserved
因子设计
因子设计(factorial design)

感兴趣的因素有两个

如:小麦品种和施肥方式.假定有甲、乙两种施肥方式 ,这样三个小麦品种和两种施肥方式的搭配共有 3×2=6种。如果我们选择30个地块进行实验,每一种 搭配可以做5次试验,也就是每个品种(处理)的样本容 量为5,即相当于每个品种(处理)重复做了5次实验
样本均值 样本标准差 样本方差
因此检验各样本的均 值是否相同的问题涉 及比较样本内的方差 (组内方差)及样本 间的方差(组间方 差)。所以通常称之 为方差分析。
28
All rights reserved
基本原理
分析逻辑


假设从K个总体中抽取大小分别为n1, n2, n3…nk的K 个独立随机样本。我们对总体有下列的假设: 各总体皆为正态分布,且有共同相同的方差σ2。 以μ1, μ 2, … μ k 来表示总体的均值,单因子分析检 证下零假设 H0: μ 1= μ 2…= μ k vs. H1: 至少有两组均值不同
第10章
方差分析
10.1 方差分析引论 10.2 单因素方差分析 14.3 双因素方差分析
1
All rights reserved
1
导引——实验设计简介
2
All rights reserved
引例
Factor (Training Method)
Factor Levels (Groups)
All rights reserved
23
方差分析的概念

例:消费者很想知道哪种车型与油耗关系,比较 A, B, C三种车款每加仑可以行驶的里数如下:
A 18.2 19.4 19.6 19 18.8 19 0.548 0.300
24
样本平均 样本标准差 样本方差
B 19.8 21 20 20.8 20.4 20.4 0.510 0.260
实验中的术语
自变量与因变量

我们经常设计研究来了解造成某种现象变化的原 因 例如:我们想要了解为什么有时候种植西瓜会甜 有时候不会甜(甜度变动)


这种我们欲了解的变量称为因变量(dependent variable)、被解释变量、或反应变量(response variable)。 我们怀疑西瓜的甜度与栽种过程中是否施肥有关,将 某些西瓜种籽加以施肥处理,其它西瓜保持自然生长 ,这种造成因变量产生变化的变量称之为因子 (factor)或独立变项、 自变量(independent variable)
31
All rights reserved
基本原理
1 x 11 x 21 x 31 ﹕ x n1 , 1 2 x 12 x 22 x 32 ﹕ ﹕ x n2 , 2 … k x 1k x 2k x 3k ﹕ ﹕ ﹕ x nk,k
总样本的均值 x
j1 i 1 K nj
14
All rights reserved
随机化区组设计
随机化区组设计(randomized block design)

先按一定规则将实验单元划分为若干同质组,称 为“区组(Block)” 再将各种处理随机地指派给各个区组 分组后再将每个品种(处理)随机地指派给每一 个区组的设计就是随机化区组设计
样本内的方差很小
19
20.4
21.8
C B A 18 19 20
26
21
22
23
All rights reserved
基本思想
A 17 20.4 24 15.8 17.8 B 24.2 22 17.8 16.2 21.8 C 26 19.8 24.4 16 22.8
样本內的方差很大
19
20.4
21.8
All rights reserved
基本原理
分別來自k总的k个样本
1 x 11 x 21 x 31 ﹕ x n1 , 1
2 x 12 x 22 x 32 ﹕ ﹕ x n2 , 2

k x 1k x 2k x 3k ﹕ ﹕ ﹕ x nk,k
第k組样本 共有nk个观 察值
各组样本数可以不同,分别为n1, n2,„nk, 总样本数n= n1+n2+„+nk


考虑两个因素(可推广到多个因素)的搭配实验设计 称为因子设计 该设计主要用于分析两个因素及其交互作用对实 验结果的影响
17
All rights reserved
10.1 方差分析引论
18
All rights reserved
方差分析的概念
缘由

t 检验适用于样本均值与总体均值及两样本平均数 间的差异显著性检验, 但在生产和科学研究中经 常会遇到比较多个处理优劣的问题, 即需进行多 个均值间的差异显著性检验 大学中各专业间的学生智商是否有别? 三种不同的教学方法对于学生的成绩是否有 影响?
实验指标(experimental indicator)

为衡量实验结果的好坏或处理效应的高低 ,在实 验验中具体测定的性状或观测的项目称为试验指 标 学习时间、血糖含量、体高、体重等
4
All rights reserved
实验中的术语
实验因素(experimental factor)

实验中所研究的影响实验指标的因素叫试验因素 当实验中考察的因素只有一个时,称为单因 素实验 若同时研究两个或两个以上的因素对实验指 标的影响时,则称为两因素或多因素实验 实验因素常用大写字母A、B、C、„等表示
29
All rights reserved
基本原理
共有K个总体
μ1, σ1
μ2, σ2

i代表在样本中 的序号,i = 1,2, „nj
j代表样本组別,j = 1,2, …k
μk, σk
x21 x11 xn1,1 x31 Xi j
x22
xn2,2 x 12 x32
x1k x2k
xnk,k x3k
30
Randomly Assigned Units


21 hrs Dependent Variable (Response)
17 hrs
31 hrs
27 hrs
29 hrs
25 hrs
20 hrs
28 hrs
22 hrs
3
All rights reserved
实验中的术语
方差分析的概念
方差分析


方差分析法是一种在若干能相互比较的资料组中, 把产生变异的原因加以区分开来的方法与技术 研究分类型自变量对数值型因变量的影响 一个或多个分类尺度的自变量 一个间隔或比率尺度的因变量 有单因素方差分析和双因素方差分析 单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量
21
All rights reserved
方差分析的概念


因此我们需要在共同的显著水平α下,同时考虑多 个平均值的差异,我们以F分布来进行检验,称之 为方差分析 方差分析 (ANOVA, analysis of variance) 是由英国 统计学家R.A.Fisher于1923年提出
22
All rights reserved
实验设计

局部控制 ─ 实验条ห้องสมุดไป่ตู้的局部一致性

在实验环境或实验单位差异大的情况下 , 可将整个实验环境或实验单位分成若干个小 环境或小组,在小环境或小组内使非处理因 素尽量一致,这就是局部控制
12
All rights reserved
完全随机化设计
完全随机化设计(completely randomized design)
19
All rights reserved
方差分析的概念

检验过程烦琐

这种做法太浪费时间,因为比较几个母体可能产生很 多的比较组,例如比较五个母体的平均值差异,如果 以两两比较的方式,我们必须进行C52=10次的t-test。

无统一的试验误差,误差估计的精确性和检验的 灵敏性低

试验有5个处理 ,每个处理重复6次,共有30个观测值 。进行t检验时,每次只能利用两个处理共12个观测值 估计试验误差 ,误差自由度为 2(6-1)=10 ;若利用 整个试验的30个观测值估计试验误差 ,显然估计的精 确性高,且误差自由度为5(6-1)=25。
7
All rights reserved
实验中的术语
实验单位(experimental unit)

在实验中能接受不同实验处理的独立的实验载体 叫实验单位 在实验中,将一个处理实施在两个或两个以 上的实验单位上,称为处理有重复;一处理 实施的实验单位数称为处理的重复数
8
All rights reserved
5
All rights reserved
实验中的术语
因素水平(level of factor)

试验因素所处的某种特定状态或数量等级 称为因素水平,简称水平
6
All rights reserved
实验中的术语
因素水平与处理



因素水平为某因子(自变量)之特殊形式或不同 状态,例如我们可以将「施肥」细分成三个水平 :完全不施肥、施轻肥、施重肥 如果解释的因素为单一(施肥与否),称为单因子 分析,如果解释因子在两个以上(施肥与否+栽 种温度),称为多因子分析。 在单因素分析中,每一个因素水平皆称为一种处 理(treatment),多因子分析中,因子水平之组合称 为一种处理(施重肥+高温、无施肥+高温、施重 肥+低温、无施肥+低温…等


“处理”被随机地指派给试验单元的一种设计. Subjects are assumed to be homogeneous 只有一个因素 With 2 or more groups (or levels)
13
All rights reserved
完全随机化设计
高尔夫球的品牌对每次击球的球距有无影响?
H0 : u1 u2 u3
三种汽车每单位汽油 的里数皆相同
样本平均 样本标准差 样本方差
Q:我们所观察到的样 本均值差异是否大到 足以推翻上面的零假 设?
25
All rights reserved
基本思想
A 18.2 19.4 19.6 19 18.8 B 19.8 21 20 20.8 20.4 C 21.2 21.8 22.4 22 21.6
相关文档
最新文档