MBA统计学方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

143.8
188.5
212.3
135.7
153.5
198.6
SPSS中的 数据形式
饲料例子继续:
饲料fodder为自变量单因子;重量增加 weight 为因变量一个数量变量 SPSS计算 机数据形式有所不同
A 133.8
B 151.2
饲料 C
193.4
D 225.8
125.3
149.0
185.3
主效应就是每个自变量对因变量的 单独影响;而交互效应是当两个或 更多的自变量的某些水平同时出现 时除了主效应之外的附加影响
9 1 方差分析
只考虑主效应;不考虑交互效应及协变量
拿我们例子来说;当单独考虑时;假定主动促销比 被动促销可以多产生8万元效益;而有售后服务比 没有售后服务多产生9万元效益 那么在没有交互 作用时;同时采取主动促销和售后服务会产生8+ 9=17万元的效益称为可加的
a.R Squared = .981 (Adjusted R Squared = .977)
• 促销promot的F检验统计量其自由度来自 promot 和 error 的 自 由 度 :2;20 取 值 为 13
880;p值为0 000更精确些是0 0001658 而售 后 服 务 的 F 检 验 统 计 量 为 25 497;p 值 为 0
[SERVICE=1.000]a
.
.
.
.
.
a.This parameter is set to zero because it is redund
• 这个模型还可以有截距;这时的SPSS默认约束是 固 计定实a际3=b上2=等0;于而截目距前的的没估有计截加距上的有a1;截a2距;a3时的估的
• a由1;于a2约;a束3的条估件计不一样;所以各种软件的各种选项 的估计不尽相同;但相对大小是不会变的
但如果存在交互效应;那么同时采取主动促销和 售后服务会产生一个附加的效应即交互效应可能 是正面的;也可能是负面的;这时的总效应就不是 17万元了
9 1 方差分析
只考虑主效应;不考虑交互效应及协变量
如只考虑主效应 用y表示销售额;ai表示促 销下标表示不同水平;bj表示售后服务;则 相应的只有主效应的线性模型为:
224.6
143.1
162.7
182.8
220.4
128.9
143.8
188.5
212.3
135.7
均值A= 133 36
153.5
均值B= 152 04
198.6
均值C=189 72
均值D= 220 78
对数据的描述性输出SPSS
ANOVACONTRASTS/POST HOCLSD;T2/OPTIONDES ;HOMO /MEAN PLOT
S S TS S A S S B S S E
p
q
pq
q (yi.y)2p (y.jy)2 (yijyi.y.jy)2
i 1
j 1
i 1j 1
其中; SSA 有自由度 p1; SSB有自由度 q1;
SSE 有自由度 p1q1;在正态分布的假设下; 如
果各组增重均值相等零假设; 则
F A M M S S E A S S E S S / ( A p / ( p 1 ) ( q 1 ) 1 ) ;F B M M S S E B S S E S S / ( B p / ( q 1 ) ( q 1 ) 1 )
[SERVICE-=9..0401]7 1.865 -5.049 .000 -13.307 -5.527
[SERVICE=1.000]a
.
.
.
.
.
a.This parameter is set to zero because it is redund
• 这里的估计只有相对意义 一定要放在模型中;或
者考虑同 b1b2等等
这里的自变量就是定性变量的因子 及可能出现的称为协变量 covariate的定量变量
分析结果是由一个方差分析表表示 的
方差分析
原理为:把因变量的值随着自变量的不同 取值而得到的变化进行分解;使得每一个自 变量都有一份贡献;最后剩下无法用已知的 原因解释的则看成随机误差的贡献
然后用各自变量的贡献和随机误差的贡献 进行比较F检验;以判断该自变量的不同水 平是否对因变量的变化有显著贡献 输出就
[PROMOT=312..0700]8 1.865 17.539 .000 28.818 36.598
[PROMOT=420..0303]3 1.865 21.628 .000 36.443 44.223
[SERVICE-=9..0401]7 1.865 -5.049 .000 -13.307 -5.527
• 没有交互作用的模型可以从下面点图中直观看出 图10 1 中下面两条折线分别连接了有及没有售后服务时三种促 销状况的销售均值 由于模型选择为无交互作用;所以这 两条线是平行的 从该图可以看出;两个因子效应综合效 应是简单的加7.417 257.224
Sig. .000
PROMOT 579.250
2 289.625 13.880
.000
SERVICE 532.042
1 532.042 25.497
.000
Error 417.333
20 20.867
Total 21887.000
24
试验设计问题
试验设计模型可以说就是回归模型的 一种 试验设计问题本身有很大一部分 是如何设计试验;使得人们有可能用最 少的资源得到最好的结果
这里;我们不打算详细讨论如何设计试 验;而把主要精力放在试验设计数据的 方差分析和建立线性模型上
方差分析
方差分析analysis of variance;ANOVA是分析各个自变 量对因变量影响的一种方法
该表说明各饲料之间有显著不同
方差分析表的说明:
比较一元总体的 ANOVA
WEIGHT重量
Between Groups(处理)
Sum of
Df
Mean
F Sig.
Squares(平方和)
自由 度
Square(均方)
SSB
P-1 MSB=SSB/(p-1)
F=
P(F>Fa)
MSB/MSE
Within Groups
统计学
─从数据到结论
第九章 方差分析
试验设计问题
一个养蟹户要遇到许多影响生产的因 素或因子factor;如水温;饲料;水质等
要想稳定高产;就要进行各种因素的不 同水平level的搭配组合试验
这里的水平就是一个因素可能取的值 如有三种饲料;那饲料因素就有三个水 平 而如果水温有四种水平;则水温和 饲料就有12种可能的搭配









;


a1a3
a2a3
Parameter Estimates
Dependent Variable: SALES
95% Confidence Interval
Parameter B Std. Error t
Sig.Lower BoUupnpder Bound
[PROMOT=2.80.04]58 1.865 15.260 .000 24.568 32.348
Tot 19 171.52 34.31137 7.87157 al
154.9730
188.0481 125.3 225.8
四种饲料的箱图
240
220
200
180
160
8
140
120
100
N=
5
5
5
4
A
B
C
D
fodder
Mean of WEIGHT
四种饲料的均值图
240
220
200
180
160
140
(误差)
Total(总和)
SSE SST
n-p MSE=SSE/(n-p) n-1
这里n 为观测值数目p 为水平数;Fa 满足 PF>Fa=a 这是自由度为 p1和np 的 F分布的概率
Test of Homogeneity of Variances A robust test
Levene Statistic df1 df2 Sig.
B 5 152.04 6.95723 3.11137 143.4015 160.6785 143.8 162.7
C 5 189.72 6.35035 2.83996 181.8350 197.6050 182.8 198.6
D 4 220.78 6.10594 3.05297 211.0591 230.4909 212.3 225.8
由SPSS可以得到方差分析表:
ANOVA
WEIGHT
Between Groups Within Groups
Total
Sum of Squares
20538.698
Df Mean Square F Sig. 3 6846.233 157.467 .000
652.159
15
21190.858 18
43.477
000更精确些是0 00006135 R2为0 981
• 对于这个模型;参数估计为
Parameter Estimates
Dependent Variable: SALES
95% Confidence Interval
Parameter B Std. Error t
Sig.Lower BoUupnpder Bound
ab yijkijijk, i1 ,2,3 ,j1 ,2,k1 ,2,3 ,4 (或 有 常 数 项 时 为 :yijkmaibjijk)
• 这里的下标i代表促销的水平;下标j代表是 否有售后服务;下标k代表每种ij组合中的 第k个观测;最后一项ijk为随机误差
公式:总平方和=组间平方和+组内平方和
.024
3 15 .995
这是SPSS输出之一;明白即可;不用记住
F 3;15分布密度图
F0 053;15
面积=0 05
SPSS操作
pare Means→One Way ANOVA: fodder饲料 → Factor Weight重量 → Dependent List Options:
Descriptive Homogeneity of Variance Mean Plot
S S T S S B S S E n i(yi y)2 (y ij yi)2
i 1
i 1j 1
其中; SST 有自由度 n1; SSB有自由度 p1;
SSE 有自由度 np;在正态分布的假设下; 如
果各组增重均值相等零假设; 则
FMSBSSB/(p1) MSE SSE/(np)
有自由度为 p1 和np 的F 分布
Descriptives WEIGHT
N Mean
Std.
Deviation
Std. Error
95% Confidence Interval for
Mean Lower Bound
Upper Bound
Minim Maxim um um
A 5 133.36 6.80794 3.04460 124.9068 141.8132 125.3 143.1
销售数据sales txt
研究这个数目的主要目的是看销售额因变量是否 受到促销方式 售后服务和奖金这三个自变量的 影响头两个是定性变量;亦称为因子;分别有3个 和2个水平;而定量变量奖金是协变量以及怎样 的影响
9 1 方差分析
只考虑主效应;不考虑交互效应及协变量
首先假定因变量受到的仅有主效应 main effect而没有交互效应 interaction和协变量的影响
120
A
B
C
D
fodder
线性模型:
m y iji ij, i 1 ,...,p , j 1 ,...,n i
模型中的假定:
m y i1 ,y i2 ,...,y in i N (i,2 ) ,i 1 ,...,p
涉及的检验: H0: m1=…=mp
公式:总平方和=组间平方和+组内平方和
p
p n i
是F值和检验的一些p值
下面看一个例子
单因素方差分析回顾
饲料比较数据; n=19头猪; 用p=4种饲料喂 养一段时间后的重量增加问题: 四种饲料 是否不同
A 133.8
B 151.2
饲料 C
193.4
D 225.8
125.3
149.0
185.3
224.6
143.1
162.7
182.8
220.4
128.9
[PROMOT=2.80.04]58 1.865 15.260 .000 24.568 32.348
[PROMOT=312..0700]8 1.865 17.539 .000 28.818 36.598
[PROMOT=420..0303]3 1.865 21.628 .000 36.443 44.223
分别有自由度为 p1 和p1q1 及自由度为q1 和p1q1的F 分布
• 用我们数据拟合这个模型;SPSS输出为
Tests of Between-Subjects Effects
Dependent Variable: SALES
Type III Sum
Sourceof Squares df Mean Square F
相关文档
最新文档