单因素方差分析-excel教程
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(4)若 F F0.10 ,则称因素A无显著影响(差异无
统计意义)。
单因素试验方差分析表
方差来源 平方和 自由度 均方和
组间 组内 总和
SS A
df A
MS A
SS A df A
SSE
df E
MSE
SSE df E
SST dfT
F值 F MSA
MSE
F 值临介值
F r 1, n r
简便计算公式:
两个因素的搭配还会对结果产生一种新的影响,这
时的双因素方差分析称为有交互作用的双因素方差 分 析 或 可 重 复 双 因 素 方 差 分 析 (Two-factor with
replication )
观测值
消费者对四个行业的投诉次数
行业
零售业
旅游业
航空公司
家电制造业
1
57
68
31
44
2
66
39
49
51
3
49
29
21
65
4
40
45
34
77
5
34
56
40
58
6
53
51
7
44
1. 分析四个行业之间的服务质量是否有显著差 异,作出这种判断需要检验这四个行业被投 诉次数的均值是否相等
2. 如果它们的均值相等,就意味着“行业”对 投诉次数是没有影响的,即它们之间的服务 质量没有显著差异;
SSA
r i1
Ti 2 ni
T2 n
SSE
r i1
ni
T 2 X ij n j 1
r2 i
i1 i
ni
r
其中 Ti Xij , T Ti
j 1
i 1
同一水平 下观测值 之和
所以观测 值之和
方差分析步骤
【例】为了对几个行业的服务质量进行评价,消费者协会在 四个行业分别抽取了不同的企业作为样本。最近一年中消费 者对总共23家企业投诉的次数如下表
灯泡
寿命
1 2 3 4 5 678
灯丝
甲 1600 1610 1650 1680 1700 1720 1800
乙 1580 1640 1640 1700 1750
丙 1460 1550 1600 1620 1640 1740 1660 1820
丁 1510 1520 1530 1570 1680 1600
1. 分析两个因素(行因素Row和列因素Column)对试验 结果的影响
2. 如果两个因素对试验结果的影响是相互独立的,分 别判断行因素和列因素对试验数据的影响,这时的
双因素方差分析称为无交互作用的双因素方差分析 或 无 重 复 双 因 素 方 差 分 析 (Two-factor without
replication) 3. 如果除了行因素和列因素对试验数据的单独影响外,
3. 如果均值不全相等,则意味着“行业”对投 诉次数是有影响的,它们之间的服务质量有 显著差异
分析步骤
• 提Leabharlann Baidu假设 • 构造检验统计量 • 统计决策
提出假设
1. 一般提法
▪ H0: 1 = 2 =…= k ▪ H1: 1 ,2 ,… ,k不全相等
2. 注意:拒绝原假设,只表明至少有两个总 体的均值不相等,并不意味着所有的均值 都不相等
r ni
2
SSE
Xij X i
i1 j1
组内误差平方和
反映的是重复试验种随机误差的大小。
由272页4可得:
SST
2
~ 2 n 1,
SSA
2
~ 2 r 1,
SSE
2
~ 2 nr
将
SST
2
,
SS A
2
,
SSE
2
的自由度分别记作 dfT , df A , dfE
则 F SSA dfA ~ F r 1, n r
得H0 的拒绝域为:F F r 1, n r F 单侧检验
思考:为什么此处只做单侧检验?
结论:方差分析实质上是假设检验,从分析离差 平方和入手,找到F统计量,对同方差的多个正态总体 的均值是否相等进行假设检验。单因素试验中两个水 平的均值检验可用第九章的双样本均值检验法。
约定
注意:在方差分析表中,习惯于作如下规定:
ni
(i 1,2,, k)
式中: ni为第 i 个总体的样本观察值个数
xij 为第 i 个总体的第 j 个观察值
构造检验的统计量
(计算全部观察值的总均值)
1. 全部观察值的总和除以观察值的总个数 2. 计算公式为
k ni
k
xij
ni xi
x i1 j1 i1
n
n
式中:n n1 n2 nk
4164.608696=1456.608696+2708
构造检验的统计量
(F分布与拒绝域)
不拒绝H0
拒绝H0
0
F
F(k-1,n-k)
F 分布
统计决策
▪ 将统计量的值F与给定的显著性水平的临
界值F进行比较,作出对原假设H0的决策
▪ 根据给定的显著性水平,在F分布表中查找与
第一自由度df1=k-1、第二自由度df2=n-k 相应的 临界值 F
SSE dfE
(记 SSA dfA MSA, SSE dfE MSE ,称作均方和)
则 F SSA dfA ~ F r 1, n r MSA
SSE dfE
MSE
(记 SSA dfA MSA, SSE dfE MSE ,称作均方和)
对给定的检验水平 ,由 PF F r 1, n r
引例
灯泡的使用寿命——试验指标
灯丝的配料方案——试验因素(唯一的一个)
四种配料方案(甲乙丙丁)——四个水平
因此,本例是一个四水平的单因素试验。
用X1,X2,X3,X4分别表示四种灯泡的使用寿命,即为 四个总体。假设X1,X2,X3,X4相互独立,且服从方差 相同的正态分布,即Xi~N(i,2)(i=1,2,3,4)
▪ 第2步:选择“数据分析”选项
▪ 第3步:在分析工具中选择“单因素方差分析” ,
然后选择“确定”
▪ 第4步:当对话框出现时
▪
在“输入区域”方框内键入数据单元格区域
▪
在方框内键入0.05(可根据需要确定)
▪
在“输出选项”中选择输出区域
补充概念:双因素方差分析
(two-way analysis of variance)
的一个样本:X i1, X i2 ,...X ini .
因此, X i1, X i2 ,...X ini 相互独立,且与 X i 同分布。
我们的目的是通过试验数据来判断因素 A 的不 同水平对试验指标是否有影响。
单因素试验资料表
水平
重复 试验结果 A1 A2 ... Ar
1
X11 X 21 ... X r1
构造检验的统计量
(例题分析)
构造检验的统计量
(计算总误差平方和 SST)
1. 全部观察值 xij与总平均值 x 的离差平方和
2. 反映全部观察值的离散状况
3. 其计算公式为
k ni
SST
xij x 2
i1 j1
▪ 前例的计算结果:
SST = (57-47.869565)2+…+(58-47.869565)2
=115.9295
构造检验的统计量
(计算水平项平方和 SSA)
1. 各组平均值 xi (i 1,2,, k)与总平均值 x 的离差
平方和
2. 反映各总体的样本均值之间的差异程度,又称组
间平方和
3. 该平方和既包括随机误差,也包括系统误差
4. 计算公式为
k ni
k
SSA xi x2 ni xi x2
▪ 若F>F ,则拒绝原假设H0 ,表明均值之间的
差异是显著的,所检验的因素对观察值有显著 影响
▪ 若F<F ,则不拒绝原假设H0 ,不能认为所检
验的因素对观察值有显著影响
单因素方差分析表
(基本结构)
单因素方差分析
(例题分析)
用Excel进行方差分析
用Excel进行方差分析
▪ 第1步:选择“工具”下拉菜单
基本概念
试验指标——试验结果。
可控因素——在影响试验结果的众多因素中,可人为 控制的因素。
水平——可控因素所处的各种各种不同的状态。每个 水平又称为试验的一个处理。
单因素试验——如果在一项试验中只有一个因素改变, 其它的可控因素不变,则该类试验称为 单因素试验。
引例
例1 (灯丝的配料方案优选)某灯泡厂用四种配料方案制成的灯 丝生产了四批灯泡,在每批灯泡中作随机抽样,测量其使用寿 命(单位:小时),数据如下:
(1)若 F F0.01,则称因素的差异极显著(极有统计意
** 义),或称因素A的影响高度显著,这时作标记
;
(2)若 F0.05 F F0.01 ,则称因素的差异显著(差异
* 有统计意义),或称因素A的影响显著,作标记 ;
(3)若 F0.1 F F0.05 ,则称因素A有一定影响,作
* 标记( );
本例问题归结为检验假设 H0:1= 2= 3= 4 是否成立
单因素试验的方差分析
设 A 表示欲考察的因素,它的 r个不同水平,对 应的指标视作 r 个总体 X1, X 2,...X r . 每个水平下,我 们作若干次重复试验:n1, n2 ,...nr .(可等重复也可不 等重复),同一水平的 ni 个结果,就是这个总体 X i
i1 j1
▪ 前例的计算结果:SSE = 2708
构造检验的统计量
(三个平方和的关系)
▪ 总离差平方和(SST)、误差项离差平方和
(SSE)、水平项离差平方和 (SSA) 之间的关 系
k ni
k
k ni
xij x 2 ni xi x2
xij xi 2
i1 j1
i1
i1 j1
SST = SSA + SSE ▪ 前例的计算结果:
i1 j1
i 1
▪ 前例的计算结果:SSA = 1456.608696
构造检验的统计量
(计算误差项平方和 SSE)
1. 每个水平或组的各样本数据与其组平均值的离差
平方和
2. 反映每个样本各观察值的离散状况,又称组内平
方和
3. 该平方和反映的是随机误差的大小
4. 计算公式为
k ni
SSE
xij xi 2
...
... ... ... ...
ni
X 1n1
X 2n2
... X rnr
ni
列和Ti Xij
T1
j 1
列平均Xi Ti ni X 1
(水平组内平均值)
T2 ... X 2 ...
r
Tr 总和 Ti i 1
Xr
X
1 n
r i 1
ni X i
(总平均值)
r
其中诸 ni 可以不一样,n ni i 1
第十一章 方差分析
学习要求
基本概念:
指标、 因素、 水平、 单因素方差分析、 双因素方差分析
基本步骤 掌握单因素方差分析的基本方法
引言
在工农业生产和科研活动中,我们经常遇到这样 的问题:影响产品产量、质量的因素很多,例如影 响农作物的单位面积产量有品种、施肥种类、施肥 量等许多因素。我们要了解这些因素中哪些因素对 产量有显著影响,就要先做试验,然后对测试结果 进行分析,作出判断。方差分析就是分析测试结果 的一种方法。
构造检验的统计量
构造统计量需要计算
▪ 水平的均值 ▪ 全部观察值的总均值 ▪ 误差平方和 ▪ 均方(MS)
构造检验的统计量
(计算水平的均值)
1. 假定从第i个总体中抽取一个容量为ni的简单
随机样本,第i个总体的样本均值为该样本的 全部观察值总和除以观察值的个数
2. 计算公式为
ni
xij
xi
j 1
例:五个水稻品种单位产量的观测值
品种 重复
A1 A2 A3 A4 A5
1 2 3
3
xij
j 1
xi
41 33 38 37 31 39 37 35 39 34 40 35 35 38 34
120 105 108 114 99
40 35 36 38 33
53
xij 546
i1 j 1
53
xij 15 36.4
检验假设:
H0 : 1 2 ... r
r
考察统计量 SST
ni
2
Xij X
总离差平方和
i1 j1
经恒等变形,可分解为: SST SSA SSE
其中
r ni
2
SSA
Xi X
i1 j1
组间平方和(系
如果H0 成立,则SSA 较小。 统离差平方和)
反映的是各水平平均值偏离总平均值的偏离程度。
i1 j 1
纵向个体间的差异称为随机误差(组内差异),由试验造 成;横向个体间的差异称为系统误差(组间差异),由因素的 不同水平造成。
单因素试验的方差分析的数学模型
首先,我们作如下假设:
1. Xi ~ N i , 2 , i 1, 2,...r 具有方差齐性。
2. X1, X 2,...X r 相互独立,从而各子样也相互独立。