第10章 方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
并且所有的 xij 相互独立. 令ε xij − µ j ( j 1, 2, ⋅⋅⋅, r= ; i 1, 2, ⋅⋅⋅, n j ) ,则 ε ij 是在水平 Aj 下做第 i 次观察时由于随 = = ij 机因素的影响而产生的随机误差,且 ε ij 相互独立.所以可得如下的数据结构:
= = µ j + ε ij , j 1, 2, ⋅⋅⋅, r= ; i 1, 2, ⋅⋅⋅, n j ij x 2 ε ij ~ N (0, σ ),
µ= i⋅
1 s µi⋅ − µ ,= i 1, 2, ⋅⋅⋅, r ; ∑ µij , α= i s j =1
1 r = µ⋅ j − µ ,= j 1, 2, ⋅⋅⋅, s . ∑ µij , β i r i =1
称 µ 为总平均,称 α i 为水平 Ai 的效应, β i 为水平 B j 的效应,记
10.1.3
双因素无重复试Βιβλιοθήκη Baidu的方差分析
1.数学模型 设有两个因素 A , B ,因素 A 有 r 个水平 A1 , A2 , ⋅⋅⋅, Ar ,因素 B 有 s 个水平 B1 , B2 , ⋅⋅⋅, Bs , 对因素 A , B 的每对组合 ( Ai , B j ), = i 1, 2, ⋅⋅⋅, r , = j 1, 2, ⋅⋅⋅, s ,作一次试验,试验数据记为 xij , 设 xij 相互独立,且设 xij ~ N ( µij , σ 2 ) .此时数据结构的数学模型可以写成如下形式:
ˆ = x 是 µ 的无偏估计; (1) µ
ˆ j = x⋅ j 是 µ j 的无偏估计; (2) µ
ˆ= (3) α x⋅ j − x 是 α j 的无偏估计; j SE 2 是 σ 的无偏估计; n−r (5) µ j − µ k 的置信度为 1 − α 的置信区间为 ˆ = (4) σ
2
SE 1 1 SE 1 1 ( + ), x⋅ j − x⋅k + tα / 2 (n − r ) ( + ) . x⋅ j − x⋅k − tα / 2 (n − r ) n − s n j nk n − s n j nk 10.1.2 双因素等重复试验的方差分析
其中 µ , α i , β j , γ ij , σ 都是未知参数.
2
i= 1, ⋅⋅⋅, r , j = 1, ⋅⋅⋅, s, k = 1, ⋅⋅⋅, t
这样假设检验问题可以表述成如下的三个假设检验问题:
H 01 : α1 = α 2 = ⋅⋅⋅ = α r = 0; ↔ H11 : α1 , ⋅⋅⋅, α r 不全为零; H 02 : β1 = β 2 = ⋅⋅⋅ = β s = 0; ↔ H12 : β1 , ⋅⋅⋅, β s 不全为零; H 03 : γ ij = 0, i= 1, ⋅⋅⋅, r , j = 1, ⋅⋅⋅, s; ↔ H13 : γ ij 不全为零.
上式称为单因素方差分析的数学模型.单因素方差分析的主要任务主要可归结为以下两个: (1) 在给定的显著水平 α 下检验假设:
H 0 : µ1 = µ2 = ⋅⋅⋅ = µr ; ↔ H1 : µ1 , µ2 , ⋅⋅⋅, µr 不全相等;
(2) 估计参数 µ1 , ⋅⋅⋅, µ r , σ .
2
3.统计分析 总平方和 = ST
186
平方和
自由度
均方
SA
r −1
S A /(r − 1)
F比 S A /(r − 1) FA = S E /((r − 1)( s − 1))
因素 B 误差 总和
SB SE ST
s −1
S B /( s − 1) S E /(r − 1)( s − 1)
FA =
S B /( s − 1) S E /((r − 1)( s − 1))
= x j ~ N ( µ j , σ 2 ), j 1, 2, ⋅⋅⋅, r .
在水平 A j 下进行 n j 次试验,得到取自总体 x j 的容量为 n j 的样本 x1 j , ⋅⋅⋅, xn j j ( j = 1, 2, ⋅⋅⋅,
r ) .于是有
= xij ~ N ( µ j , σ 2 ), j 1, 2, ⋅⋅⋅, r= ; i 1, 2, ⋅⋅⋅, n j ,
2. 统计分析 总平方和 = ST
r s t
= i 1= j 1= k 1
∑∑∑ ( xijk − x )2 ,其中 x =
r i =1
1 r s t xijk , ∑∑∑ rst = i 1= j 1= k 1 1 s t xijk , i= 1, ⋅⋅⋅, r , ∑∑ st = j 1= k 1
= i 1= j 1
r
s
3.假设检验
185
(1)
σ2
SE
~ χ 2 (rs (t − 1)) ,
(2) 当 H 01 为真时, (3) 当 H 02 为真时, (4) 当 H 03 为真时,
σ
SA
2
~ χ 2 (r = − 1) ,从而 FA ~ χ 2 (s= − 1) ,从而 FB
S A /(r − 1) ~ F (r − 1, rs (t − 1)) ; S E /(rs (t − 1)) S B /( s − 1) ~ F ( s − 1, rs (t − 1)) ; S E /(rs (t − 1))
= j 1= i 1
∑∑ ( x
SA
r
nj
⋅j
− x )2 .
σ
SE
2
~ χ 2 (n − r ) ,
σ2
~ χ 2 (r − 1) ,且 S E 与 S A 相互独立.从而
= F
S A / (r − 1) ~ F (r − 1, n − r ) . S E / (n − r )
对给定的检验水平 α ,若 F ≥ Fα (r − 1, n − r ) ,则拒绝原假设 H 0 ,即认为因素 A 影响显著. 5.参数估计
1 r t xijk , j = 1, ⋅⋅⋅, s , ∑∑ rt= i 1= k 1
因素 A 的效应平方和 = S A st 因素 B 的效应平方和 = S B rt
r s t
∑ ( xi⋅⋅ − x )2 ,其中 xi⋅⋅ =
s j =1
∑ ( x⋅ j⋅ − x )2 ,其中 x⋅ j⋅ =
2
1 t 误差平方和 = S E ∑∑∑ ( xijk − xij ⋅ ) ,其中 xij⋅ = ∑ xijk , i= 1, ⋅⋅⋅, r ; j = 1, ⋅⋅⋅, s , t k =1 = i 1= j 1= k 1
S A× B t ∑∑ ( xij⋅ − xi⋅⋅ − x⋅ j ⋅ + x ) 2 . A , B 的交互效应平方和=
= FB
10.2 习题详解
1.三台机器制造同一种产品,记录五天的产量如下: 机器
A1
138 144
A2
163 148 152 146 157
A3
155 144 159 147 153
日产量
135 149 143
试在显著性 α = 0.05 下检验这三台机器的日产量是否有显著差异. 解 对假设检验问题 H 0 : µ = µ = µ3 1 2 取检验统计量 F =
S A /(r − 1) ≥ Fα (r − 1, rs (t − 1)) , S E /(rs (t − 1))
H 02 拒绝域为 = FB
拒绝域为 FA× B H 03 =
S B /( s − 1) ≥ Fα ( s − 1, rs (t − 1)) , S E /(rs (t − 1))
S A× B /[(r − 1)( s − 1)] ≥ Fα ((r − 1)( s − 1), rs (t − 1)) . S E /(rs (t − 1))
于是数据就有如下结构
xijk = µij + ε ijk , i= 1, ⋅⋅⋅, r ; j = 1, ⋅⋅⋅, s; k = 1, ⋅⋅⋅, t , 2 ε ijk ~ N (0, σ )
上式就是双因素方差分析的数学模型. 引入如下记号:
184
µ=
µ= ⋅j
1 r s µij ; ∑∑ rs= i 1= j 1
(r − 1)( s − 1)
rs − 1
取显著性水平为 α ,得 H 01 ↔ H11 的拒绝域为
= FA
得 H 02 ↔ H12 的拒绝域为
S A /(r − 1) ≥ Fα (r − 1, (r − 1)( s − 1)) , S E /((r − 1)( s − 1)) S B /( s − 1) ≥ Fα ( s − 1, (r − 1)( s − 1)) . S E /((r − 1)( s − 1))
= = µ + α i + β j + ε ij= j 1, 2, ⋅⋅⋅, s , i 1, 2, ⋅⋅⋅, r ; x ij r s , 2 = = ε N σ α β ~ (0, ), 0, 0 ∑ ∑ ij i j = i 1= j 1
其中 µ 为总平均, α i 为水平 Ai 的效应, β j 为水平 B j 的效应,且 µ , α i , β j , σ 2 均为未知参数. 此时要检验假设有以下两个:
γ ij = µij − µi⋅ − µ⋅ j + µ , i= 1, ⋅⋅⋅, r ; j = 1, ⋅⋅⋅, s ,
则 µij = µ + α i + β j + γ ij ,称 γ ij 为水平 Ai 和水平 B j 的交互效应,于是数据的结构可以写成如 下的数学模型:
x =µ + α + β + γ + ε , i j ij ijk ijk 2 ε ijk ~ N (0, σ ), r s r s ∑ = = = = α i 0, ∑ β j 0, ∑ γ ij ∑ γ ij 0, = j 1 = i 1= j 1 i 1 =
= i 1, 2, ⋅⋅⋅, r ; = j 1, 2, ⋅⋅⋅, s; = 次 试 验 , 试 验 数 记 为 xijk , 设 xijk ~ N ( µij , σ ), k 1, 2, ⋅⋅⋅, t . 令
2
ε= xijk − µij= (i 1, 2, ⋅⋅⋅, r ; = j 1, 2, ⋅⋅⋅, s; = k 1, 2, ⋅⋅⋅, t ) ,则 ε ijk 相互独立,且 ε ijk ~ N (0, σ 2 ) . ijk
1.数学模型 设有两个 A , B 作用于试验的指标,因素 A 有 r 个水平 A1 , A2 , ⋅⋅⋅, Ar ,因素 B 有 s 个水平
= i 1, 2, ⋅⋅⋅, r ; = j 1, 2, ⋅⋅⋅, s 都作 t (t ≥ 2) B1 , B2 , ⋅⋅⋅, Bs ,对因素 A, B 的水平的每对组合 ( Ai , B j ),
σ
SB
2
S A× B
σ2
~ χ 2 ((r − 1)( s − 1)) ,从而
= FA× B
S A× B /[(r − 1)( s − 1)] ~ F ((r − 1)( s − 1), rs (t − 1)) . S E /(rs (t − 1))
对于显著性水平 α , H 01 拒绝域为 = FA
H 01 : α1 = α 2 = ⋅⋅⋅ = α r = 0; ↔ H11 : α1 , ⋅⋅⋅, α r 不全为零; H 02 : β1 = β 2 = ⋅⋅⋅ = β s = 0; ↔ H12 : β1 , ⋅⋅⋅, β s 不全为零.
与双因素等重复试验方差分析的讨论过程类似,可以得到方差分析表: 方差来源 因素 A
= j 1= i 1
∑∑ ( xij − x )2 ,其中 x =
r
nj
1 r j xij . ∑∑ n= j 1= i 1
183
n
1 误差平方和 = S E ∑∑ ( xij − x⋅ j ) ,其中 x⋅ j = nj = j 1= i 1
2
r
nj
∑x
i =1
nj
ij
.
因素 A 的效应平方和 = SA 4.假设检验 当 H 0 成立时,则
第 10 章 方差分析
10.1 内容提要
10.1.1 单因素试验的方差分析
1.单因素试验 为了考察某个因素 A 对所研究的随机变量 X 的影响,我们在试验中让其他因素保持不变, 而仅让因素 A 改变,这样的试验称为单因素试验. 2.数学模型 设因素 A 有 r 个不同的水平 A1 , A2 , ⋅⋅⋅, Ar , 在水平 A j 下的总体记为 x j , = j 1, 2, ⋅⋅⋅, r ,并 设 x1 , x2 , ⋅⋅⋅, xr 相互独立且
= = µ j + ε ij , j 1, 2, ⋅⋅⋅, r= ; i 1, 2, ⋅⋅⋅, n j ij x 2 ε ij ~ N (0, σ ),
µ= i⋅
1 s µi⋅ − µ ,= i 1, 2, ⋅⋅⋅, r ; ∑ µij , α= i s j =1
1 r = µ⋅ j − µ ,= j 1, 2, ⋅⋅⋅, s . ∑ µij , β i r i =1
称 µ 为总平均,称 α i 为水平 Ai 的效应, β i 为水平 B j 的效应,记
10.1.3
双因素无重复试Βιβλιοθήκη Baidu的方差分析
1.数学模型 设有两个因素 A , B ,因素 A 有 r 个水平 A1 , A2 , ⋅⋅⋅, Ar ,因素 B 有 s 个水平 B1 , B2 , ⋅⋅⋅, Bs , 对因素 A , B 的每对组合 ( Ai , B j ), = i 1, 2, ⋅⋅⋅, r , = j 1, 2, ⋅⋅⋅, s ,作一次试验,试验数据记为 xij , 设 xij 相互独立,且设 xij ~ N ( µij , σ 2 ) .此时数据结构的数学模型可以写成如下形式:
ˆ = x 是 µ 的无偏估计; (1) µ
ˆ j = x⋅ j 是 µ j 的无偏估计; (2) µ
ˆ= (3) α x⋅ j − x 是 α j 的无偏估计; j SE 2 是 σ 的无偏估计; n−r (5) µ j − µ k 的置信度为 1 − α 的置信区间为 ˆ = (4) σ
2
SE 1 1 SE 1 1 ( + ), x⋅ j − x⋅k + tα / 2 (n − r ) ( + ) . x⋅ j − x⋅k − tα / 2 (n − r ) n − s n j nk n − s n j nk 10.1.2 双因素等重复试验的方差分析
其中 µ , α i , β j , γ ij , σ 都是未知参数.
2
i= 1, ⋅⋅⋅, r , j = 1, ⋅⋅⋅, s, k = 1, ⋅⋅⋅, t
这样假设检验问题可以表述成如下的三个假设检验问题:
H 01 : α1 = α 2 = ⋅⋅⋅ = α r = 0; ↔ H11 : α1 , ⋅⋅⋅, α r 不全为零; H 02 : β1 = β 2 = ⋅⋅⋅ = β s = 0; ↔ H12 : β1 , ⋅⋅⋅, β s 不全为零; H 03 : γ ij = 0, i= 1, ⋅⋅⋅, r , j = 1, ⋅⋅⋅, s; ↔ H13 : γ ij 不全为零.
上式称为单因素方差分析的数学模型.单因素方差分析的主要任务主要可归结为以下两个: (1) 在给定的显著水平 α 下检验假设:
H 0 : µ1 = µ2 = ⋅⋅⋅ = µr ; ↔ H1 : µ1 , µ2 , ⋅⋅⋅, µr 不全相等;
(2) 估计参数 µ1 , ⋅⋅⋅, µ r , σ .
2
3.统计分析 总平方和 = ST
186
平方和
自由度
均方
SA
r −1
S A /(r − 1)
F比 S A /(r − 1) FA = S E /((r − 1)( s − 1))
因素 B 误差 总和
SB SE ST
s −1
S B /( s − 1) S E /(r − 1)( s − 1)
FA =
S B /( s − 1) S E /((r − 1)( s − 1))
= x j ~ N ( µ j , σ 2 ), j 1, 2, ⋅⋅⋅, r .
在水平 A j 下进行 n j 次试验,得到取自总体 x j 的容量为 n j 的样本 x1 j , ⋅⋅⋅, xn j j ( j = 1, 2, ⋅⋅⋅,
r ) .于是有
= xij ~ N ( µ j , σ 2 ), j 1, 2, ⋅⋅⋅, r= ; i 1, 2, ⋅⋅⋅, n j ,
2. 统计分析 总平方和 = ST
r s t
= i 1= j 1= k 1
∑∑∑ ( xijk − x )2 ,其中 x =
r i =1
1 r s t xijk , ∑∑∑ rst = i 1= j 1= k 1 1 s t xijk , i= 1, ⋅⋅⋅, r , ∑∑ st = j 1= k 1
= i 1= j 1
r
s
3.假设检验
185
(1)
σ2
SE
~ χ 2 (rs (t − 1)) ,
(2) 当 H 01 为真时, (3) 当 H 02 为真时, (4) 当 H 03 为真时,
σ
SA
2
~ χ 2 (r = − 1) ,从而 FA ~ χ 2 (s= − 1) ,从而 FB
S A /(r − 1) ~ F (r − 1, rs (t − 1)) ; S E /(rs (t − 1)) S B /( s − 1) ~ F ( s − 1, rs (t − 1)) ; S E /(rs (t − 1))
= j 1= i 1
∑∑ ( x
SA
r
nj
⋅j
− x )2 .
σ
SE
2
~ χ 2 (n − r ) ,
σ2
~ χ 2 (r − 1) ,且 S E 与 S A 相互独立.从而
= F
S A / (r − 1) ~ F (r − 1, n − r ) . S E / (n − r )
对给定的检验水平 α ,若 F ≥ Fα (r − 1, n − r ) ,则拒绝原假设 H 0 ,即认为因素 A 影响显著. 5.参数估计
1 r t xijk , j = 1, ⋅⋅⋅, s , ∑∑ rt= i 1= k 1
因素 A 的效应平方和 = S A st 因素 B 的效应平方和 = S B rt
r s t
∑ ( xi⋅⋅ − x )2 ,其中 xi⋅⋅ =
s j =1
∑ ( x⋅ j⋅ − x )2 ,其中 x⋅ j⋅ =
2
1 t 误差平方和 = S E ∑∑∑ ( xijk − xij ⋅ ) ,其中 xij⋅ = ∑ xijk , i= 1, ⋅⋅⋅, r ; j = 1, ⋅⋅⋅, s , t k =1 = i 1= j 1= k 1
S A× B t ∑∑ ( xij⋅ − xi⋅⋅ − x⋅ j ⋅ + x ) 2 . A , B 的交互效应平方和=
= FB
10.2 习题详解
1.三台机器制造同一种产品,记录五天的产量如下: 机器
A1
138 144
A2
163 148 152 146 157
A3
155 144 159 147 153
日产量
135 149 143
试在显著性 α = 0.05 下检验这三台机器的日产量是否有显著差异. 解 对假设检验问题 H 0 : µ = µ = µ3 1 2 取检验统计量 F =
S A /(r − 1) ≥ Fα (r − 1, rs (t − 1)) , S E /(rs (t − 1))
H 02 拒绝域为 = FB
拒绝域为 FA× B H 03 =
S B /( s − 1) ≥ Fα ( s − 1, rs (t − 1)) , S E /(rs (t − 1))
S A× B /[(r − 1)( s − 1)] ≥ Fα ((r − 1)( s − 1), rs (t − 1)) . S E /(rs (t − 1))
于是数据就有如下结构
xijk = µij + ε ijk , i= 1, ⋅⋅⋅, r ; j = 1, ⋅⋅⋅, s; k = 1, ⋅⋅⋅, t , 2 ε ijk ~ N (0, σ )
上式就是双因素方差分析的数学模型. 引入如下记号:
184
µ=
µ= ⋅j
1 r s µij ; ∑∑ rs= i 1= j 1
(r − 1)( s − 1)
rs − 1
取显著性水平为 α ,得 H 01 ↔ H11 的拒绝域为
= FA
得 H 02 ↔ H12 的拒绝域为
S A /(r − 1) ≥ Fα (r − 1, (r − 1)( s − 1)) , S E /((r − 1)( s − 1)) S B /( s − 1) ≥ Fα ( s − 1, (r − 1)( s − 1)) . S E /((r − 1)( s − 1))
= = µ + α i + β j + ε ij= j 1, 2, ⋅⋅⋅, s , i 1, 2, ⋅⋅⋅, r ; x ij r s , 2 = = ε N σ α β ~ (0, ), 0, 0 ∑ ∑ ij i j = i 1= j 1
其中 µ 为总平均, α i 为水平 Ai 的效应, β j 为水平 B j 的效应,且 µ , α i , β j , σ 2 均为未知参数. 此时要检验假设有以下两个:
γ ij = µij − µi⋅ − µ⋅ j + µ , i= 1, ⋅⋅⋅, r ; j = 1, ⋅⋅⋅, s ,
则 µij = µ + α i + β j + γ ij ,称 γ ij 为水平 Ai 和水平 B j 的交互效应,于是数据的结构可以写成如 下的数学模型:
x =µ + α + β + γ + ε , i j ij ijk ijk 2 ε ijk ~ N (0, σ ), r s r s ∑ = = = = α i 0, ∑ β j 0, ∑ γ ij ∑ γ ij 0, = j 1 = i 1= j 1 i 1 =
= i 1, 2, ⋅⋅⋅, r ; = j 1, 2, ⋅⋅⋅, s; = 次 试 验 , 试 验 数 记 为 xijk , 设 xijk ~ N ( µij , σ ), k 1, 2, ⋅⋅⋅, t . 令
2
ε= xijk − µij= (i 1, 2, ⋅⋅⋅, r ; = j 1, 2, ⋅⋅⋅, s; = k 1, 2, ⋅⋅⋅, t ) ,则 ε ijk 相互独立,且 ε ijk ~ N (0, σ 2 ) . ijk
1.数学模型 设有两个 A , B 作用于试验的指标,因素 A 有 r 个水平 A1 , A2 , ⋅⋅⋅, Ar ,因素 B 有 s 个水平
= i 1, 2, ⋅⋅⋅, r ; = j 1, 2, ⋅⋅⋅, s 都作 t (t ≥ 2) B1 , B2 , ⋅⋅⋅, Bs ,对因素 A, B 的水平的每对组合 ( Ai , B j ),
σ
SB
2
S A× B
σ2
~ χ 2 ((r − 1)( s − 1)) ,从而
= FA× B
S A× B /[(r − 1)( s − 1)] ~ F ((r − 1)( s − 1), rs (t − 1)) . S E /(rs (t − 1))
对于显著性水平 α , H 01 拒绝域为 = FA
H 01 : α1 = α 2 = ⋅⋅⋅ = α r = 0; ↔ H11 : α1 , ⋅⋅⋅, α r 不全为零; H 02 : β1 = β 2 = ⋅⋅⋅ = β s = 0; ↔ H12 : β1 , ⋅⋅⋅, β s 不全为零.
与双因素等重复试验方差分析的讨论过程类似,可以得到方差分析表: 方差来源 因素 A
= j 1= i 1
∑∑ ( xij − x )2 ,其中 x =
r
nj
1 r j xij . ∑∑ n= j 1= i 1
183
n
1 误差平方和 = S E ∑∑ ( xij − x⋅ j ) ,其中 x⋅ j = nj = j 1= i 1
2
r
nj
∑x
i =1
nj
ij
.
因素 A 的效应平方和 = SA 4.假设检验 当 H 0 成立时,则
第 10 章 方差分析
10.1 内容提要
10.1.1 单因素试验的方差分析
1.单因素试验 为了考察某个因素 A 对所研究的随机变量 X 的影响,我们在试验中让其他因素保持不变, 而仅让因素 A 改变,这样的试验称为单因素试验. 2.数学模型 设因素 A 有 r 个不同的水平 A1 , A2 , ⋅⋅⋅, Ar , 在水平 A j 下的总体记为 x j , = j 1, 2, ⋅⋅⋅, r ,并 设 x1 , x2 , ⋅⋅⋅, xr 相互独立且