多元方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
a R Squared = .958 (Adjusted R Squared = .924) Note: SS.Cor Model=SS.Mouse+SS.ETROGEN
有协变量的方差分析例(既有定性变量又有定量变量):存在 混杂因素的方差分析. 数据: 镉作业工人年龄(age 协变量), 接触粉尘时间(time:分2组作为因子)和肺活量(vitalcp 因变 量)(data12.06) (自变量:一个连续变量,一个定性变量)
或者
yij m ai xb ij , i 1,..., p, j 1,..., ni
在相应的正态假设下 检验: H0: a1=…=ap (=0) H0: b=0
SPSS: GLM-General factorial-Model-Full-Factorial
加上一个covariate
MSB SSB /( p 1) F MSE SSE /(n p )
有自由度为 p-1 和n-p 的F 分布.
由SPSS可以得到方差分析表:
(比较一元总体的) ANOVA
WEIGHT(重量)
Df Sum of Mean Squares(平方和) 自由 Square(均方) 度
F
F= MSB/MSE
A (1) B (2) C (3) D (4)
160
140
120
Levels of Mouse Effects on WUTERI
100
80
60
Leabharlann Baidu
40 20
N= 3 3 3 3
160
A
B
C
D
140
mouse
120
100
80
Levels of Etrogen Effects on WUTERI
60
WUTERI
分别有自由度为 p-1 和(p-1)(q-1) 及自由度 为q-1 和(p-1)(q-1)的F 分布.
SPSS: GLM-General Factorial-Model, custom (main effect)
Tests of Between-Subjects Effects Dependent Variable: XXX
F (3,15)分布密度图
F0.05(3,15)
面积=0.05
由SPSS可以得到方差分析表:
ANOVA
WEIGHT
Sum of Squares
Df Mean Square
F
Sig.
Between Groups
Within Groups Total
20538.698
652.159 21190.858
Source Corrected Model Intercept Effect A Effect B Error Total Corrected Total Type III Sum of Squares SS.c … df
P+ q-2
Mean Square MSS.c …
F
MSS.c/MSE
Sig.
饲料
A 133.8 125.3
143.1 128.9 135.7
均值A= 133.36
B 151.2 149.0
162.7 143.8 153.5
均值B= 152.04
C 193.4 185.3
182.8 188.5 198.6
均值C=189.72
D 225.8 224.6
220.4 212.3
均值D= 220.78
单因变量多因素 方差分析
4个种系大白鼠各三只分别用3种不同剂量雌 激素. 关心(因变量)子宫重量(WUTERI)和其 他两(自变量)因子的关系(受何种影响) (data12.03) (该例是最简单的两因子方差分析)
种系
(MOUSE)
雌激素剂量(ETROGEN) 0.2 (1) 0.4 (2) 0.8 (3) 106 42 70 42 116 68 111 63 145 225 314 192
多元方差分析
多元方差分析
• 单因素方差分析, • 有协变量的方差分析 • 单因变量多因素方差分析 • 多因变量线性模型的方差分析 • 重复测量设计的方差分析, • 方差成分分析
单因素方差分析回顾
饲料比较数据, n=19头猪, 用p=4种饲 料喂养一段时间后的重量增加 (data12.01)问题: 四种饲料是否不同?
2.83996 3.05297 7.87157
143.4015
181.8350 211.0591 154.9730
160.6785
197.6050 230.4909 188.0481
143.8
182.8 212.3 125.3
162.7
198.6 225.8 225.8
Tot al
四种饲料的箱图
240 220 200
40 20
N= 4 4 4
0.2
0.4
0.8
etrogen
简单两因子单因变量线性模型:
yij ai b j ij , i 1,..., p, j 1,..., q
或者
yij m ai b j ij , i 1,..., p, j 1,..., q
Upper Bound 9.803 -4.670E-02 .924 .
Parameter Estimates Dependent Variable:肺活量
B Std. Error t Sig. 95% Confidence Interval Lower Bound 6.151 -.127 -.323 .
Parameter Intercept AGE [TIME=1] [TIME=2] 7.977 -8.700E-02 .300 0a .886 .020 .303 . 8.998 -4.447 .993 . .000 .000 .330 .
在相应的正态假设下 检验: H0: a1=…=ap (=0) H0: b1=… = bq (=0)
公式:总平方和=组间平方和+组内平方和
SST SSA SSB SSE q ( y i. y ) 2 p ( y . j y ) 2 ( yij y i. y . j y ) 2
暴露于镉尘年段对肺活量的影响
7
6
年龄和肺活量的散点图
6
5
5
4
4
3
3
2
肺活量
肺活量
1
N= 12 16
2 30 40 50 60 70
大于等于 10 年
不足 10 年
暴露于镉尘年段
年龄
有协变量的方差分析模型:
yij ai x b ij , i 1,..., p, j 1,..., ni
各种SPSS输出:
(ANOVA-CONTRASTS/POST HOC-LSD,T2/OPTION-DES.,HOMO./MEAN PLOT)
Descriptives WEIGHT
N
Mean
Std. Deviation
Std. Error
95% Confidence Interval for Mean Lower Bound
124.9068
Minim um
Upper Bound 141.8132 125.3
Maxim um
A
5
133.36
6.80794
3.04460
143.1
B
C D
5
5 4
19
152.04
189.72 220.78 171.52
6.95723
6.35035 6.10594 34.31137
3.11137
SPSS操作
Compare Means→One Way ANOVA: fodder(饲料) → Factor Weight(重量) → Dependent List Options: Descriptive Homogeneity of Variance Mean Plot
还可以做饲料各个水平之 间的对比等更多的检验 (比如两两对比)
2
检验: H0: m1=…=mp
公式:总平方和=组间平方和+组内平方和
SST SSB SSE ni ( y i y ) ( yij y i )
2 i 1 i 1 j 1 p p ni 2
其中, SST 有自由度 n-1, SSB有自由度 p-1, SSE 有自由度 n-p,在正态分布的假设下, 如 果各组增重均值相等(零假设), 则
3
15 18
6846.233
43.477
157.467 .000
该表说明各饲料之间有显著不同.
Test of Homogeneity of Variances (A robust test)
Levene Statistic .024
df1 3
df2 15
Sig. .995
这是SPSS输出之一,明白即可,不用记住
Tests of Between-Subjects Effects Dependent Variable: 肺活量
Source Corrected Model Intercept Type III Sum of Squares 11.085a 41.936 df 2 1 Mean Square 5.543 41.936 F 10.073 76.216 Sig. .001 .000
1
…
SSA p-1 SSB q-1 SSE 1)(q-1) … pq SST=SSA+SSB+SSE Pq-1
(p-
MSA MSA/MSE MSB MSB/MSE MSE
Note: SS.c=SSA+SSB
SPSS:
GLM-General Factorial -Model, custom (main effect)
i 1 j 1 i 1 j 1 p q p q
其中, SSA 有自由度 p-1, SSB有自由度 q-1, SSE 有自由度 (p-1)(q-1),在正态分布的假设下, 如果各组增重均值相等(零假设), 则
)1 q(/ BSS BSM BF })1 q ()1 p ({/ ESS ESM )1 p (/ ASS ASM AF })1 q ()1 p ({/ ESS ESM
180
8
160
四种饲料的均值图
240
5 4
140
120 100
N= 5 5
220
A
B
C
D
fodder
200
180
Mean of WEIGHT
160
140
120 A B C D
fodder
线性模型:
yij mi ij , i 1,..., p, j 1,..., ni
假设:
yi1 , yi 2 ,..., yini N ( mi , ), i 1,..., p
(白鼠子宫重量数据)
Tests of Between-Subjects Effects Dependent Variable: WUTERI
Source Corrected Model Intercept MOUSE ETROGEN Error Total Corrected Total Type III Sum of Squares 12531.667a 100467.000 6457.667 6074.000 543.333 113542.000 13075.000 df 5 1 3 2 6 12 11 Mean Square 2506.333 100467.000 2152.556 3037.000 90.556 F 27.677 1109.452 23.771 33.537 Sig. .000 .000 .001 .001
AGE
TIME Error
10.881
.542 13.755
1
1 25
10.881
.542 .550
19.775
.985
.000
.330
Total
Corrected Total
483.625
24.841
28
27
a R Squared = .446 (Adjusted R Squared = .402)
饲料 A 133.8 125.3 143.1 128.9 B 151.2 149.0 162.7 143.8 C 193.4 185.3 182.8 188.5 D 225.8 224.6 220.4 212.3
135.7
153.5
198.6
饲料例子(继续):
饲料(fodder)为自变量(单因子),重量 增加(weight) 为因变量(一个数量变 量) (SPSS计算机数据形式有所不同)
Sig.
P(F>Fa)
Between Groups(处理)
Within Groups
SSB
SSE SST
P-1
MSB=SSB/(p-1)
n-p n-1
MSE=SSE/(n-p)
(误差)
Total(总和)
这里n 为观测值数目p 为水平数,Fa满足 P(F>Fa)=a.这是自由度为p-1和n-p的F分布的概率