第7章 方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
All rights reserved
实验设计( 实验设计(续)
南审数统学院
实验设计三原则
重复 重复是指试验中同一处理实施在两个或两个 以上的试验单位上 随机化 随机化是指在对实验对象进行分组时必须使 用随机的方法,使对象进入各实验组的机会 相等,以避免试验对象分组时实验人员主观 倾向的影响 双盲
单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量
25
All rights reserved
方差分析的概念( 方差分析的概念(续)
南审数统学院
例:消费者很想知道哪种车型与油耗关系,比较 A, B, C三种车款每加仑可以行驶的里数如下:
A 18.2 19.4 19.6 19 18.8 19 0.548 0.300
C 21.2 21.8 22.4 22 21.6 21.8 0.447 0.200
H 0 : u1 = u2 = u3
三种汽车每单位汽油 的里数皆相同
Q:我们所观察到的样 本均值差异是否大到 足以推翻上面的零假 设?
28
All rights reserved
基本思想( 基本思想(续)
南审数统学院
情形1:样本内的 方差很小
9
All rights reserved
实验设计
南审数统学院
概念
广义理解是指实验研究课题设计,也就是 整个实验计划的拟定 狭义的理解是指实验单位的选取、重复数 目的确定及实验单位的分组 实验设计的目的是避免系统误差,控 制、降低实验误差,无偏估计处理效 应,从而对样本所在总体作出可靠、 正确的推断
事先设计好的实施在试验单位上的具体项目叫实 验处理,简称处理 进行单因素实验时,实验因素的一个水平就 是一个处理 在多因素实验时,实验因素的一个水平组合 就是一个处理
6
All rights reserved
几个常用术语( 几个常用术语(续)
南审数统学院
实验单位(experimental unit)
24
All rights reserved
方差分析的概念( 方差分析的概念(续)
南审数统学院
方差分析
方差分析法是一种在若干能相互比较的资料组中 ,把产生变异的原因加以区分开来的方法与技术 研究分类型自变量对数值型因变量的影响
一个或多个分类尺度的自变量 一个间隔或比率尺度的因变量
单因素方差分析和双因素方差分析
8
All rights reserved
几个术语
南审数统学院
自变量与因变量
我们经常设计研究来了解造成某种现象变化的原 因 例如:我们想要了解为什么有时候种植西瓜会甜 有时候不会甜(甜度变动)
这种我们欲了解的变量称为因变量(dependent variable)、被解释变量、或反应变量(response variable)。 我们怀疑西瓜的甜度与栽种过程中是否施肥有关,将 某些西瓜种籽加以施肥处理,其它西瓜保持自然生长 ,这种造成依变量产生变化的变量称之为因子 (factor)或独立变项、 自变量(independent variable) 。
16
All rights reserved
随机化区组设计( 随机化区组设计(续)
南审数统学院
17
All rights reserved
因子设计
南审数统学院
因子设计(factorial design)
感兴趣的因素有两个
如:小麦品种和施肥方式.假定有甲、乙两种施肥方式 ,这样三个小麦品种和两种施肥方式的搭配共有 3×2=6种。如果我们选择30个地块进行实验,每一种 搭配可以做5次试验,也就是每个品种(处理)的样本容 量为5,即相当于每个品种(处理)重复做了5次实验
13
All rights reserved
完全随机化设计( 完全随机化设计(续)
南审数统学院
Factor (Training Method) Factor Levels (Groups) Randomly Assigned Units 21 hrs Dependent Variable (Response) 27 hrs 29 hrs 17 hrs 25 hrs 20 hrs 31 hrs 28 hrs 22 hrs
12
All rights reserved
完全随机化设计
南审数统学院
完全随机化设计(completely randomized design)
“处理”被随机地指派给试验单元的一种设计. Subjects are assumed to be homogeneous 只有一个因素 With 2 or more groups (or levels)
23
All rights reserved
方差分析的概念( 方差分析的概念(续)
南审数统学院
因此我们需要在共同的显著水平α下,同时考虑多 个均值的差异,我们以F分布来进行检验,称之为 方差分析 方差分析 (analysis of variance) 是由英国统计学家 R.A.Fisher于1923年提出
考虑两个因素(可推广到多个因素)的搭配实验设计 称为因子设计 该设计主要用于分析两个因素及其交互作用对实 验结果的影响
18
All rights reserved
因子设计( 因子设计(续)
南审数统学院
19
All rights reserved
南审数统学院
7.2 方差分析基本思想
20
All rights reserved
为 衡 量 试 验结果的好坏或处理效应的高低 ,在 试验中具体测定的性状或观测的项目称为试验指 标 血糖含量、体高、体重等
3
All rights reserved
几个常用术语( 几个常用术语(续)
南审数统学院
实验因素(experimental factor)
实验中所研究的影响实验指标的因素叫试验因素 当实验中考察的因素只有一个时,称为单因 素实验; 若同时研究两个或两个以上的因素对实验指 标的影响时,则称为两因素或多因素实验。 实验因素常用大写字母A、B、C、…等表示。
14
All rights reserved
完全随机化设计( 完全随机化设计(续)
南审数统学院
高尔夫球的品牌与每次击球的球距有无影响?
15
All rights reserved
随机化区组设计
南审数统学院
随机化区组设计(randomized block design)
先按一定规则将实验单元划分为若干同质组,称 为“区组(Block)” 再将各种处理随机地指派给各个区组 分组后再将每个品种(处理)随机地指派给每一 个区组的设计就是随机化区组设计
A 18.2 19.4 19.6 ຫໍສະໝຸດ Baidu9 18.8
B 19.8 21 20 20.8 20.4
C 21.2 21.8 22.4 22 21.6
19
20.4
21.8
C B A 18 19 20
29
21
22
23
All rights reserved
基本思想( 基本思想(续)
南审数统学院
情形2:样本內的 方差很大
方差分析的概念
南审数统学院
缘由
t检验法适用于样本平均数与总体平均数及两样本 平均数间的差异显著性检验, 但在科学研究中经 常会遇到比较 多个处理优劣的问题, 即需进行多 个平均数间的差异显著性检验。 大学中各年级的同学智商是否有别? 三种不同的教学方法对于学生的成绩是否有 影响?
21
All rights reserved
11
All rights reserved
实验设计( 实验设计(续)
南审数统学院
局部控制 ─ 实验条件的局部一致性 在 实 验 环 境 或 实 验单位差异大的 情 况 下 ,可 将 整 个 实 验 环 境 或 实 验 单 位 分 成 若 干 个 小 环 境 或 小 组,在 小 环 境 或小组内使 非 处 理 因 素 尽 量 一 致,这就是局部控制 。
各个总体的方差必须相同
各组观察数据是从具有相同方差的总体中抽取的
各总体的观察值是独立的
27
All rights reserved
基本思想
南审数统学院
样本平均 样本标准差 样本方差
A 18.2 19.4 19.6 19 18.8 19 0.548 0.300
B 19.8 21 20 20.8 20.4 20.4 0.510 0.260
第7章 方差分析
南审数统学院
7.1 7.2 7.3 7.4
实验设计简介 方差分析基本思想 单因素方差分析 两因素方差分析
1
All rights reserved
南审数统学院
7.1 实验设计简介
2
All rights reserved
几个常用术语
南审数统学院
试验指标(experimental indicator)
22
All rights reserved
方差分析的概念( 方差分析的概念(续)
南审数统学院
推断的可靠性低,检验的 I 型错误率大,如果每组 的显著水平皆为α,则全体比较的显著水平会高于 α
假设我们在.05的显著水平下要检定下列零假设: H0: u1=u2=u3 如果拆成下列三组零假设: H0: u1=u2 , H0: u1=u3 , H0: u2=u3 每个假设被「接受」的概率为.95,三个假设全部被接 受的概率为.953=.857,也就是说当假设为真但被推翻 的概率为(1 - 0.857) = 0.143 > 0.05 远高于显著水 平
31
All rights reserved
基本思想( 基本思想(续)
南审数统学院
共有K个总体
µ1, σ1
µ2, σ2
L
i代表在样本中 的序号,i = 1,2, …nj
j代表样本组別,j = 1,2, …k
方差分析的概念( 方差分析的概念(续)
南审数统学院
检验过程烦琐
这种做法太浪费时间,因为比较几个总体可能产生很 多的比较组,例如比较五个总体的平均值差异,如果 以两两比较的方式,我们必须进行C52=10次的t-test。
无统一的试验误差,误差估计的精确性和检验的 灵敏性低
试验有5个处理 ,每个处理重复6次,共有30个观测值 。进行t检验时,每次只能利用两个处理共12个观测值 估计试验误差 ,误差自由度为 2(6-1)=10 ;若利用 整个试验的30个观测值估计试验误差 ,显然估计的精 确性高,且误差自由度为5(6-1)=25。
4
All rights reserved
几个常用术语( 几个常用术语(续)
南审数统学院
因素水平(level of factor)
试验因素所处的某种特定状态或数量等级 称为因素水平,简称水平
5
All rights reserved
几个常用术语( 几个常用术语(续)
南审数统学院
实验处理(treatment)
A 17 20.4 24 15.8 17.8
B 24.2 22 17.8 16.2 21.8
C 26 19.8 24.4 16 22.8
19
20.4
21.8
C B A 15 17 19
30
21
23
25
27
All rights reserved
基本思想( 基本思想(续)
南审数统学院
分析逻辑
假设从K个总体中抽取大小分别为n1, n2, n3…nk的K 个独立随机样本。我们对总体有下列的假设: 各总体皆为正态分布,且有共同相同的方差σ2。 以u1, u2, …uk 来表示总体的均值,单因子分析检证 下零假设 H0: u1=u2…=uk vs. H1: 至少有两组均值不同
26
样本平均 样本标准差 样本方差
B 19.8 21 20 20.8 20.4 20.4 0.510 0.260
C 21.2 21.8 22.4 22 21.6 21.8 0.447 0.200
All rights reserved
基本假设
南审数统学院
假设
每个总体都应服从正态分布
对于因素的每一个水平,其观察值是来自服从正态分 布总体的简单随机样本
在实验中能接受不同实验处理的独立的实验载体 叫实验单位 在实验中,将一个处理实施在两个或两个以 上的实验单位上,称为处理有重复;一处理 实施的实验单位数称为处理的重复数
7
All rights reserved
几个术语( 几个术语(续)
南审数统学院
因素水平与处理
因素水平为某因子(自变量)之特殊形式或不同 状态,例如我们可以将「施肥」细分成三个水平 :完全不施肥、施轻肥、施重肥 如果解释的因素为单一(施肥与否),称为单因子 分析,如果解释因子在两个以上(施肥与否+栽 种温度),称为多因子分析。 在单因素分析中,每一个因素水平皆称为一种处 理(treatment),多因子分析中,因子水平之组合称 为一种处理(施重肥+高温、无施肥+高温、施重 肥+低温、无施肥+低温…等
相关文档
最新文档