第5章 方差分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x1=27.3;x2=29.5;x3=26.4;x4=31.4
① 提出假设 H0:i=j; H1:ij ② 计算LSD(t0.025(16)=2.12)
③ 检验
LSD 2.12 2.4428 1 1 2.096 5 5
• |x1-x2|= |27.3-29.5| =2.2>2.096,颜色1与颜色2的销售量有显著差异 • |x1-x3|= |27.3-26.4| =0.9<2.096,颜色1与颜色3的销售量没有显著差异 • |x1-x4|= |27.3-31.4| =4.1>2.096,颜色1与颜色4的销售量有显著差异 • |x2-x3|= |29.5-26.4| =3.1>2.096,颜色2与颜色3的销售量有显著差异 • |x2-x4|= |29.5-31.4| =1.9<2.096,颜色2与颜色4的销售量没有显著差异 • |x3-x4|= |26.4-31.4| =5>2.096, 颜色3与颜色4的销售量有显著差异
方差分析中的基本假定
(1)每个总体都应服从正态分布(分布的正态性) (2)各组观察数据,是从具有相同方差的总体中抽取的 (3)观察值是独立的
例5.1数学成绩分析
40名学生随机分成5个班,每个班 的班主任负责不同科目
– A表示班主任教数学 – B表示班主任教语文 – C表示班主任教生物 – D表示班主任教地理 – E表示班主任教物理
用方差分析的方法检验5组不同班 主任的学生数学成绩是否有显著 差异
ABCDE 76 76 62 65 67 78 67 70 68 71 65 70 69 68 72 72 64 73 71 69 71 67 71 61 74 72 83 69 69 79 83 72 73 65 76 79 73 69 69 84
– 单因素实验:当研究中只考察一个因素 – 双因素(多因素)实验:同时研究两个或两个以上的因素
• 因素水平/水平:因素所处的某种特定状态或数量等级, 用代表该因素的字母加添足标表示,如A1、A2、…,B1、 B2、…
• 处理:事先设计好的实施在实验单位上的具体项目
– 在单因素实验中,一个处理就是实验因素的某一水平 – 在多因素实验中,实验因素的一个水平组合就是一个处理
橘黄色
26.5
31.2
27.9
28.7
28.3
25.1
25.1
30.8
28.5
29.1
27.9
24.2
27.2
29.6
26.5
绿色
30.8 29.6 32.4 31.7 32.8
• 设 1 为无色饮料的平均销量,2为粉色饮 料的销量,设 3 为橘黄色饮料的平均销量
4为绿色饮料的销量。
• 则原问题转化为以下假设检验:
– 随机样本Xij可以视为其总体均值ij与随机误差εij之和 Xij=μij+ εij
– εij服从N(0,σ2)分布,并且εij之间相互独立于是有 Xij= μ+ ai+bj + εij
称为“无交互影响的双因素(一元)模型”
Xij的构成 (各方案的总体均值)
μ 总体均值
αi(= μi• - μ) bi(= μ•j - μ)
H 0
:
1
2
3
4
H 1
:
上述均值不相等。
– μ表示总体X的均值,
– μi表示总体Ai的均值,
– 方案i的主效应ai=μi-μ反映颜色Ai对销售量的影响
– 随机样本Xij,可以视为各个方案的总体均值μi与随机误
差之和:Xij= i + ij
– 由于Xij是来自Ai的观察值,于是有
57
62
51
55
49
49
46
60
48
45
54
55
54
56
47
53
55
47
家电制造业 70 68 63 69 60
解题过程
• 设4,四则个需行要业检被验投如诉下次假数设的均值分别为,1,2,3,
– H0:1=2=3=4=(四个行业的服务质量无显著差异) – H1: 1,2,3,4不全相等(有显著差异)
(2)检验的统计量为
xi xj
t
xi xj
=
MSE
1 ni
1 nj
2 ni
2 nj
m n
~ t(m(n 1))
2
xij x i
i 1 j 1
2 * fE
(3)若|t|t,拒绝H0;若|t|<t,不能拒绝H0
(颜色) A3(绿色) 27.9 25.1 24.2 26.5 26.5
A4(桔色) 30.8 29.6 32.4 32.8 32.8
总平均销量
27.32 29.56 26.44 31.46
28.695
例5.1的单因素方差分析表
方差来源
离差平方和 自由 度
均方和
F值 检验结论
因素A(颜色) SA=76.85 fA=3 MSA=25.615 F=10.485 **
– 将k个处理的观测值作为一个整体看待,把观测值总变 异的平方和及自由度分解为相应于不同变异来源的平 方和及自由度,进而获得不同变异来源总体方差估计 值
– 通过计算这些总体方差的估计值的比例,检验各样本 所属总体平均数是否相等
方差分析基本概念
• 因素:影响实验结果的条件,常用大写字母A、B、C、… 等表示
主效应
ij X ij ai bj = X ij i. .j
m n
2
mn
2
ST
xij x
xij xi xi x
i1 j 1
i1 j 1
m n
2
mn
2
xij xi
xi x
i1 j 1
i1 j 1
SE SA
• 假设每个水平下总体Ai的服从正态分布, 各观测值相互独立,且方差相等,则上式
ABCDE
① 建立假设
解题过程
H0:1=2=3=4=5
76 76 62 65 67 78 67 70 68 71
② 平方和
ST=1160.4,SA=314.4
65 70 69 68 72
SE=ST-SA=1160.4-314.4=864
72 64 73 71 69
③ 自由度
fA=?,fE=?
•为了对几个行业的服务质量进行评价
– 在零售业、旅游业、航空公司、家电制造业分别抽取了不同的样本 – 记录了一年中消费者对总共23家服务企业投诉的次数
•试分析这四个行业的服务质量是否有显著差异?(=0.05)
观察值 (j)
1 2 3 4 5 6 7
消费者对四个行业的投诉次数
零售业
行业(A)
旅游业
航空公司
子转化为:
m n
2
xij x
mn
2
mn
2
xij x i x i x
ST / 2 i 1 j 1 2
i 1 j 1
2
i 1 j 1 2
= SE / 2
+
SA / 2
• ② 总体离差的自由度分解
fT nm 1,fE m(n 1),fA m 1
r
n
ij
i 1 j 1
–
第i行总体的平均:
i
1 n
n
ij
j 1
–
第j列总体平均:
1 r
j
r
ij
i 1
– Ai的主效应:
ai i
– Bj的主效应:
bj j
– 如果Ai与Bj间不存在交互效应,就有 μij=μ+ ai+bj
μij=μ+ ai+bj
F>F0.05,p<0.05,拒绝原假设,故在不同班主任的班级中数学成绩有显 著不同
⑥ 方差分析表
方差来源 离差平方和 自由度
因素A
314.4
4
随机干扰E 846
35
总和T
1160.4
39
均方和 F值
78.6 F=3.252 24.17
检验结论 *
注:*表示在0.05水平上显著
例5.3 服务质量分析
分析过程(续)
③ 将离差均方化,得均方和(为了具有可比性)
MSA=SA/fA MSE=SE/fE
④ 比较,计算F值:F=MSA/ MSE ⑤ 检验,所示看F统计量是否落在接受域还是拒绝域中
–若F≤F0.05(fA,fE) ,则无显著影响,记为/ –若F0.05(fA,fE) <F<F0.01(fA,fE) ,则影响较显著,记为* –若F>F0.01(fA,fE) ,则影响特别显著,记为**
因素A1 因素A2 … 因素Ar
双因素方差分析的数据结构表
因素B1
因素B2
…
x11
x12
…
x21
x22
…Fra Baidu bibliotek
…
…
…
xr1
xr2
…
因素Bn x1n x2n …
xrn
表中,x 表示因素A 和因素B 下的试验效果的观察值
把Xij分解为因素A和因素B的效应和均值以及随机误差的和。
–
总体Xij的总平均:
1 r n
• 计算结果如下:
方差来源 离差平方和 自由度 均方和
因素A
845.2174
随机干扰E 362
总和T
1207.217
281.7391 19.05263
F值
检验结论
14.78741
注,F0.05(3,19)=3.13,F0.01(3,19)=5.01.
5.2.2 多个总体均值的多重比较检验
• 通过方差分析F检验,如果最终结论是否定了原假设,那 么我们知道至少两个水平的总体均值是不同的。但是不知 道哪两个或者哪几个均值不同。如果要回答这个问题,就 需要多重比较。
基于统计量 xi x j 的LSD方法的 操作步骤为
1、 计算LSD。(xi x j 的临界值 )
2、 检验
LSD t 2
MSE
1 ni
1 nj
若| xi x |jLSD,拒绝H0,若| xi x j |<LSD,接受H0
实例分析
针对例5.1,根据前面的计算结果有:
Xij= i +ij=ai++ ij (i=1,2,…,4;j=1,2, …,5)
分析过程
① 分解总体离差平方和
– 总体销售量离差平方和ST有两个来源
• 一是由水平不同造成的不同水平下平均销售量差异SA • 一是由除了颜色之外的随机干扰造成的、同一水平下的销售量差异SE
– 其中,m表示因素A(颜色)的水平数m=4,n表示观测次数n=5
• LSD方法:由Fisher提出的最小显著差异方法,是对检验 两个总体均值是否相等的t检验方法的总体方差估计加以 修正(用MSE来代替)而得到的,可用于判断均值之间差异
LSD的操作步骤
(1)提出假设
– H0:i=j(第i个总体的均值等于第j个总体的均值)
– H1:ij(第i个总体的均值不等于第j个总体的均值)
随机干扰E
SE=39.08 fE=16 MSE=2.443
总和T
ST=115.93 fT=19
注:
– F0.05(3,16)=3.24, F0.01(3,16)=5.29 – 由于F=10.458> F0.01(fA,fE) – 所以颜色对饮料销售量有特别显著影响
方差分析基本原理
• 方差分析的实质:检验多个总体均值是否有显著 性差异(观测值变异原因的数量分析)
第5章 方差分析
• 某饮料生产企业研制出一种新型饮料
– 饮料的颜色:橘黄色、粉色、绿色和无色透明 – 饮料的营养含量、味道、价格、包装相同 – 收集该饮料的销售情况的超级市场地理位置相似、经营规模相仿
• 试分析饮料的颜色是否对销售量产生影响
超市
1 2 3 4 5
四色饮料在五家超市的销售情况
无色
粉色
71 67 71 61 74
④ 均方
MSA=SA/fA=314.4/4=78.6
72 83 69 69 79
MSE=SE/fE=846/35=24.17
83 72 73 65 76
⑤ F检验
F=MSA/MSE=78.6/24.17=3.252
79 73 69 69 84
查F分布表(单侧)F0.05(4,35)=2.64,
接受域
拒绝域
f0.05
单因素方差分析表
方差来源
因素A 随机干扰E
总和T
离差平方和
SA SE ST
自由度 均方和
fA
MSA
fE
MSE
fT
F值 F=MSA/MSE
检验结论
销售量(箱)
试验批号
各水平下平均
1
2
3
4
5
销售量Xi
A1(粉色) 26.5 28.7 25.1 29.1 27.2
因素
A2(无色) 31.2 28.3 30.8 27.9 29.6
5.3 双因素方差分析
• 双因素:是指问题中有两个(反映条件或前提的)变量
– Ar是变量A的一个取值(又称因素A的一个水平) – Bn是变量B的一个取值(又称因素B的一个水平)
• 假设在Ai与Bj下的总体Xij,服从N(μij,σ2)分布,且 相互独立,无交互作用。设在双因素各种水平的组 合下进行试验,得到数据结构如下表。