4 方差分析(ANOVA)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SSE = ∑∑ (Yij Yi )
i =1 j =1 k ni 2
或
SSE = ∑ (n 1) Si2
i =1
k
2010/8/30
11
檢定多個母體平均數是否相同
因子變異數(平均變異 因子變異數 平均變異) 平均變異
MSF = SSF k 1
隨機變異數(平均變異 隨機變異數 平均變異) 平均變異
B A C A
B牌 减自: 下限 中心 上限 --------+---------+---------+---------+C牌 1.4348 2.1000 2.7652 (---*---) --------+---------+---------+---------+-1.5 0.0 1.5 3.0
Level N Mean 廠牌A 5 98.00 廠牌B 5 111.00 廠牌C 5 101.00
Individual 95% CIs For Mean Based on Pooled StDev StDev --------+---------+---------+---------+12.57 (---------*----------) 5.43 (---------*---------) 4.24 (---------*---------) --------+---------+---------+---------+96.0 104.0 112.0 120.0
Y1 Y2
Y1
2010/8/30
Y2
Y3
来自百度文库13
檢定多個母體平均數是否相同
F檢定統計量 檢定統計量
MSF F= ~ Fk 1, n k ∑i MSE
決策法則
若 F > Fk 1,∑ ni k ,α ,則拒絕 H 0 。 若 F ≤ Fk 1,∑ ni k ,α ,則接受 H 0 。
2010/8/30
Pooled StDev = 0.395
2010/8/30
24
圖形
Boxplot of A牌, B牌, C牌
12.0 11.5 11.0 10.5 D ata 10.0 9.5 9.0 8.5 A牌 B牌 C牌
2010/8/30
25
多重比較
單一信賴區間
(Yi Yj ) t
v,α 2
MSE 1 + 1 ≤ i j ≤ (Yi Yj ) + t α MSE 1 + 1 v, ni nj ni nj 2
R-sq(adj)一般是用在多個變量的時候,其主要在看增加了 變量之後其相應的迴歸的解釋能力是否增加。
2010/8/30
21
圖形結果
Boxplot of 廠牌A, 廠牌B, 廠牌C
120
110
D ata
100
90
80 廠牌A 廠牌B 廠牌C
2010/8/30
22
練習二
設自A,B,C三個廠牌的汽車各取五部汽車,分 別測量每部汽車每公升汽油行駛里程之樣本資 料如下表,問在ALFA=0.05下,三個廠牌汽車 每公升汽油平均行駛里程是否相同
ANOVA(變異數分析)
易腾涂顺章
p1
13 變異數分析
學習目的
1. 2. 3. 4. 5. 6. 7. 8. 討論變異數分析的一般觀念,變異數分析的方法與步驟。 學習檢定多個母體平均數是否相同。 學習如何做多重比較。 了解實驗設計的意義。 學習一因子變異數分析-完全隨機設計方法。 了解一因子變異數分析-隨機集區設計方法。 學習二因子變異數分析的方法 利用 minitab 統計軟體來做變異數分析
26
進行minitab的one-way ANOVA分析
2010/8/30
27
進行多重比較
2010/8/30
28
Turkey’s檢定
Tukey 95% 同时置信区间 所有配对比较 单组置信水平 = 97.94%
A牌 减自: 下限 中心 上限 --------+---------+---------+---------+B牌 -0.3052 0.3600 1.0252 (---*----) C牌 1.7948 2.4600 3.1252 (---*----) --------+---------+---------+---------+-1.5 0.0 1.5 3.0
2010/8/30
5
檢定多個母體平均數是否相同
變異數分析的步驟
(1) 設立兩個假設 (2) 選取
MSF 為檢定統計量 MSE
(3) 決定決策法則 (4) 下結論
2010/8/30
6
表13.1 可樂裝填機的測試結果
2010/8/30
7
變異數分析的假設
變異數分析的假設 假設因子對依變數的影響效果是固定的。亦即 為一常數
Level A牌 B牌 C牌
N 5 5 5
Individual 95% CIs For Mean Based on Pooled StDev Mean StDev -----+---------+---------+---------+---8.860 0.230 (---*--) 9.220 0.396 (---*---) 11.320 0.507 (---*---) -----+---------+---------+---------+---9.0 10.0 11.0 12.0
C
B
2010/8/30
29
Fisher exact test
Fisher 95% 两水平差值置信区间 所有配对比较 同时置信水平 = 88.44%
A牌 减自: 下限 中心 +B牌 -0.1837 0.3600 0.9037 (--*---) C牌 1.9163 2.4600 3.0037 (--*---) --------+---------+---------+---------+-1.5 0.0 1.5 3.0 上限 --------+---------+---------+---------
2010/8/30
2
本章結構
數分 析 變異
檢定多個 母體平均 數是否相 同
多重比較
實驗設計
一因子變異 數分析 -隨 機集區設計
二因子變 異數分析
Excel 的使用
單 信 一 賴 區 間 聯 信 合 賴 區 間
一因子變 異數分析 -完全 -完全 隨機設計
2010/8/30
3
變異數分析的意義
變異數分析的意義
A牌 8.5 8.9 9.1 9 8.8
2010/8/30
B牌 8.7 9 9.2 9.7 9.5
C牌 10.5 11.5 11.8 11.6 11.2
23
結果
One-way ANOVA: A牌, B牌, C牌 Source DF SS MS F P Factor 2 17.652 8.826 56.70 0.000 Error 12 1.868 0.156 Total 14 19.520 S = 0.3945 R-Sq = 90.43% R-Sq(adj) = 88.84%
檢定三個或三個以上的母體平均數是否相等的統計方法,或 檢定因子對依變數是否有影響的統計方法。
2010/8/30
4
補充(不可以使用雙母體檢定的原因)
若有三個母體,而要檢定兩個母體平均數是否 相等,須檢定C(3,2)=3次,每次犯型I錯誤的 機率為0.05,則三次犯型I錯誤為:1-(10.05)^3=0.1426。 因此要檢定3個或3個以上的母體平均數相等的 3 3 假設應該使用變異數分析的方法才行。
Pooled StDev = 8.28
按目前的樣本數我們無法 拒絕三者裝填平均數相等的假設
20
2010/8/30
R-sq vs R-sq(adj)
R =
2
(Yi Y ) 2 ∑ (Yi Y ) 2 ∑
i =1 i =1 n
n
SSR = SST
R
2
adj
(n 1) = 1 (1 R 2 ) (n k 1)
k nj ij k nj k nj k nj
∑∑ (Y
i =1 j =1 k nj
Y ) = ∑∑ (Yij Yi ) + ∑∑ (Yi Y ) + 2∑∑ (Yij Yi )(Yi Y )
2 2 2 i =1 j =1 i =1 j =1 i =1 j =1
∑∑ (Y
i =1 j =1 k nj i =1 j =1
14
表13.3 變異數分析表
變異來源 平方和 (SS) 自由度 (df) 平均平方和 (MS) F
因子(組間) 隨機(組內) 總和
SSF SSE SST
MSF MSF = SSF k 1 MSE SSE ∑ ni k MSE = ∑ ni k ∑ ni 1
k 1
2010/8/30
15
表13.4 變異數分析表
MSE = SSE ∑ ni k
2010/8/30
12
為真與不真的組間變 圖13.2 H 0 為真與不真的組間變異
H 0 為真時 1 = 2 = 3 E ( MSF ) = σ 2 Y1 , Y2 , Y3 的組間變異較小
Y _3 H 0 不真時 i 不會全等 E ( MSF ) > σ 2 Y1 , Y2 , Y3 的組間變異較大
聯合信賴區間
k 若有k個小母體,則可求 m = C2 個母體均數差 1 α 的聯合信賴區 間如下:
Yi Yj ± t
∑ni k ,α / 2m
MSE
1 1 + ni n j
其中 t∑ni k ,α / 2m 是指在自由度為 ∑ni k 的t分配右尾機率為 α / 2m 的臨界值。
2010/8/30
2010/8/30
10
檢定多個母體平均數是否相同
總變異
總變異 = 組間變異 + 隨機變異 SST = SSF + SSE
因子引起的變異(組間變異) 因子引起的變異(組間變異)
SSF = ∑∑ (Yi Y )
i =1 j =1
k
ni
2
或
SSF = ∑ ni (Yi Y )2
i =1
k
隨機變異(組內變異) 隨機變異(組內變異)
8
圖13.1 虛無假設與對立假設的關係
H 0 為真時
1 = 2 = 3 =
H 0 不為真時
1
2010/8/30
2
3
9
ANOVA的數學意義
k nj ij
∑∑ Y
Y=
i =1 j =1
n
Yij Y = (Yi Y ) + (Yij Yi ) (Yi Y ) for between (Yij Yi ) for within
表13.5 可樂裝填機裝填量的變異數分析
2010/8/30
18
Minitab的執行方法
2010/8/30
19
結果
One-way ANOVA: 廠牌 廠牌 廠牌 廠牌A, 廠牌B, 廠牌C Source DF SS MS F P Factor 2 463.3 231.7 3.38 0.068 Error 12 822.0 68.5 Total 14 1285.3 S = 8.276 R-Sq = 36.05% R-Sq(adj) = 25.39%
ij
Yi )(Yi Y ) = ∑ (Yi Y )∑ (Yij Yi ) = ∑ (Yi Y ) × 0 = 0
i =1 j =1 k i =1 k nj nj 2 2
k
nj
k
(Yij Y ) = ∑∑ (Yij Yi ) + ∑∑ (Yi Y ) 2 ∑∑
i =1 j =1 i =1 j =1
B A C A
B牌 减自: 下限 中心 上限 --------+---------+---------+--------+C牌 1.5563 2.1000 2.6437 (---*---) --------+---------+---------+---------+-1.5 0.0 1.5 3.0 2010/8/30
C B
30
生產線產能是否相同例題
假設多公司為調查三條生產線所生產的” 花生糖”的平均重量是否相等,分別自 三條生產線上隨機抽取六件成品,並分 別記錄重量,經計算得下列資料
2010/8/30
31
表13.8
i
而不是隨機變數。 每個小母體均為常態分配,表為: Y ~ N ( ,σ ), i = 1,, k 。
2 i i i
變異數齊一性(Homogeneity),即σ = σ ,每個小母體的變異數
2 2 1
均相等。 抽樣方法為獨立簡單隨機抽樣,即自 k 個小母體分別抽取獨立 之隨機樣本。
2010/8/30
變異來源
平方和 (SS)
自由度 (df)
平均平方和 (MS)
F值
因子 隨機 總和
463.33 822 1285.33
2 12 14
231.66 68.5
3.38
2010/8/30
16
圖13.4 可樂裝填機裝填數量的檢定
f (F )
F2 ,12
3.38 接受域
3.89 拒絕域
F
2010/8/30
17
i =1 j =1 k ni 2
或
SSE = ∑ (n 1) Si2
i =1
k
2010/8/30
11
檢定多個母體平均數是否相同
因子變異數(平均變異 因子變異數 平均變異) 平均變異
MSF = SSF k 1
隨機變異數(平均變異 隨機變異數 平均變異) 平均變異
B A C A
B牌 减自: 下限 中心 上限 --------+---------+---------+---------+C牌 1.4348 2.1000 2.7652 (---*---) --------+---------+---------+---------+-1.5 0.0 1.5 3.0
Level N Mean 廠牌A 5 98.00 廠牌B 5 111.00 廠牌C 5 101.00
Individual 95% CIs For Mean Based on Pooled StDev StDev --------+---------+---------+---------+12.57 (---------*----------) 5.43 (---------*---------) 4.24 (---------*---------) --------+---------+---------+---------+96.0 104.0 112.0 120.0
Y1 Y2
Y1
2010/8/30
Y2
Y3
来自百度文库13
檢定多個母體平均數是否相同
F檢定統計量 檢定統計量
MSF F= ~ Fk 1, n k ∑i MSE
決策法則
若 F > Fk 1,∑ ni k ,α ,則拒絕 H 0 。 若 F ≤ Fk 1,∑ ni k ,α ,則接受 H 0 。
2010/8/30
Pooled StDev = 0.395
2010/8/30
24
圖形
Boxplot of A牌, B牌, C牌
12.0 11.5 11.0 10.5 D ata 10.0 9.5 9.0 8.5 A牌 B牌 C牌
2010/8/30
25
多重比較
單一信賴區間
(Yi Yj ) t
v,α 2
MSE 1 + 1 ≤ i j ≤ (Yi Yj ) + t α MSE 1 + 1 v, ni nj ni nj 2
R-sq(adj)一般是用在多個變量的時候,其主要在看增加了 變量之後其相應的迴歸的解釋能力是否增加。
2010/8/30
21
圖形結果
Boxplot of 廠牌A, 廠牌B, 廠牌C
120
110
D ata
100
90
80 廠牌A 廠牌B 廠牌C
2010/8/30
22
練習二
設自A,B,C三個廠牌的汽車各取五部汽車,分 別測量每部汽車每公升汽油行駛里程之樣本資 料如下表,問在ALFA=0.05下,三個廠牌汽車 每公升汽油平均行駛里程是否相同
ANOVA(變異數分析)
易腾涂顺章
p1
13 變異數分析
學習目的
1. 2. 3. 4. 5. 6. 7. 8. 討論變異數分析的一般觀念,變異數分析的方法與步驟。 學習檢定多個母體平均數是否相同。 學習如何做多重比較。 了解實驗設計的意義。 學習一因子變異數分析-完全隨機設計方法。 了解一因子變異數分析-隨機集區設計方法。 學習二因子變異數分析的方法 利用 minitab 統計軟體來做變異數分析
26
進行minitab的one-way ANOVA分析
2010/8/30
27
進行多重比較
2010/8/30
28
Turkey’s檢定
Tukey 95% 同时置信区间 所有配对比较 单组置信水平 = 97.94%
A牌 减自: 下限 中心 上限 --------+---------+---------+---------+B牌 -0.3052 0.3600 1.0252 (---*----) C牌 1.7948 2.4600 3.1252 (---*----) --------+---------+---------+---------+-1.5 0.0 1.5 3.0
2010/8/30
5
檢定多個母體平均數是否相同
變異數分析的步驟
(1) 設立兩個假設 (2) 選取
MSF 為檢定統計量 MSE
(3) 決定決策法則 (4) 下結論
2010/8/30
6
表13.1 可樂裝填機的測試結果
2010/8/30
7
變異數分析的假設
變異數分析的假設 假設因子對依變數的影響效果是固定的。亦即 為一常數
Level A牌 B牌 C牌
N 5 5 5
Individual 95% CIs For Mean Based on Pooled StDev Mean StDev -----+---------+---------+---------+---8.860 0.230 (---*--) 9.220 0.396 (---*---) 11.320 0.507 (---*---) -----+---------+---------+---------+---9.0 10.0 11.0 12.0
C
B
2010/8/30
29
Fisher exact test
Fisher 95% 两水平差值置信区间 所有配对比较 同时置信水平 = 88.44%
A牌 减自: 下限 中心 +B牌 -0.1837 0.3600 0.9037 (--*---) C牌 1.9163 2.4600 3.0037 (--*---) --------+---------+---------+---------+-1.5 0.0 1.5 3.0 上限 --------+---------+---------+---------
2010/8/30
2
本章結構
數分 析 變異
檢定多個 母體平均 數是否相 同
多重比較
實驗設計
一因子變異 數分析 -隨 機集區設計
二因子變 異數分析
Excel 的使用
單 信 一 賴 區 間 聯 信 合 賴 區 間
一因子變 異數分析 -完全 -完全 隨機設計
2010/8/30
3
變異數分析的意義
變異數分析的意義
A牌 8.5 8.9 9.1 9 8.8
2010/8/30
B牌 8.7 9 9.2 9.7 9.5
C牌 10.5 11.5 11.8 11.6 11.2
23
結果
One-way ANOVA: A牌, B牌, C牌 Source DF SS MS F P Factor 2 17.652 8.826 56.70 0.000 Error 12 1.868 0.156 Total 14 19.520 S = 0.3945 R-Sq = 90.43% R-Sq(adj) = 88.84%
檢定三個或三個以上的母體平均數是否相等的統計方法,或 檢定因子對依變數是否有影響的統計方法。
2010/8/30
4
補充(不可以使用雙母體檢定的原因)
若有三個母體,而要檢定兩個母體平均數是否 相等,須檢定C(3,2)=3次,每次犯型I錯誤的 機率為0.05,則三次犯型I錯誤為:1-(10.05)^3=0.1426。 因此要檢定3個或3個以上的母體平均數相等的 3 3 假設應該使用變異數分析的方法才行。
Pooled StDev = 8.28
按目前的樣本數我們無法 拒絕三者裝填平均數相等的假設
20
2010/8/30
R-sq vs R-sq(adj)
R =
2
(Yi Y ) 2 ∑ (Yi Y ) 2 ∑
i =1 i =1 n
n
SSR = SST
R
2
adj
(n 1) = 1 (1 R 2 ) (n k 1)
k nj ij k nj k nj k nj
∑∑ (Y
i =1 j =1 k nj
Y ) = ∑∑ (Yij Yi ) + ∑∑ (Yi Y ) + 2∑∑ (Yij Yi )(Yi Y )
2 2 2 i =1 j =1 i =1 j =1 i =1 j =1
∑∑ (Y
i =1 j =1 k nj i =1 j =1
14
表13.3 變異數分析表
變異來源 平方和 (SS) 自由度 (df) 平均平方和 (MS) F
因子(組間) 隨機(組內) 總和
SSF SSE SST
MSF MSF = SSF k 1 MSE SSE ∑ ni k MSE = ∑ ni k ∑ ni 1
k 1
2010/8/30
15
表13.4 變異數分析表
MSE = SSE ∑ ni k
2010/8/30
12
為真與不真的組間變 圖13.2 H 0 為真與不真的組間變異
H 0 為真時 1 = 2 = 3 E ( MSF ) = σ 2 Y1 , Y2 , Y3 的組間變異較小
Y _3 H 0 不真時 i 不會全等 E ( MSF ) > σ 2 Y1 , Y2 , Y3 的組間變異較大
聯合信賴區間
k 若有k個小母體,則可求 m = C2 個母體均數差 1 α 的聯合信賴區 間如下:
Yi Yj ± t
∑ni k ,α / 2m
MSE
1 1 + ni n j
其中 t∑ni k ,α / 2m 是指在自由度為 ∑ni k 的t分配右尾機率為 α / 2m 的臨界值。
2010/8/30
2010/8/30
10
檢定多個母體平均數是否相同
總變異
總變異 = 組間變異 + 隨機變異 SST = SSF + SSE
因子引起的變異(組間變異) 因子引起的變異(組間變異)
SSF = ∑∑ (Yi Y )
i =1 j =1
k
ni
2
或
SSF = ∑ ni (Yi Y )2
i =1
k
隨機變異(組內變異) 隨機變異(組內變異)
8
圖13.1 虛無假設與對立假設的關係
H 0 為真時
1 = 2 = 3 =
H 0 不為真時
1
2010/8/30
2
3
9
ANOVA的數學意義
k nj ij
∑∑ Y
Y=
i =1 j =1
n
Yij Y = (Yi Y ) + (Yij Yi ) (Yi Y ) for between (Yij Yi ) for within
表13.5 可樂裝填機裝填量的變異數分析
2010/8/30
18
Minitab的執行方法
2010/8/30
19
結果
One-way ANOVA: 廠牌 廠牌 廠牌 廠牌A, 廠牌B, 廠牌C Source DF SS MS F P Factor 2 463.3 231.7 3.38 0.068 Error 12 822.0 68.5 Total 14 1285.3 S = 8.276 R-Sq = 36.05% R-Sq(adj) = 25.39%
ij
Yi )(Yi Y ) = ∑ (Yi Y )∑ (Yij Yi ) = ∑ (Yi Y ) × 0 = 0
i =1 j =1 k i =1 k nj nj 2 2
k
nj
k
(Yij Y ) = ∑∑ (Yij Yi ) + ∑∑ (Yi Y ) 2 ∑∑
i =1 j =1 i =1 j =1
B A C A
B牌 减自: 下限 中心 上限 --------+---------+---------+--------+C牌 1.5563 2.1000 2.6437 (---*---) --------+---------+---------+---------+-1.5 0.0 1.5 3.0 2010/8/30
C B
30
生產線產能是否相同例題
假設多公司為調查三條生產線所生產的” 花生糖”的平均重量是否相等,分別自 三條生產線上隨機抽取六件成品,並分 別記錄重量,經計算得下列資料
2010/8/30
31
表13.8
i
而不是隨機變數。 每個小母體均為常態分配,表為: Y ~ N ( ,σ ), i = 1,, k 。
2 i i i
變異數齊一性(Homogeneity),即σ = σ ,每個小母體的變異數
2 2 1
均相等。 抽樣方法為獨立簡單隨機抽樣,即自 k 個小母體分別抽取獨立 之隨機樣本。
2010/8/30
變異來源
平方和 (SS)
自由度 (df)
平均平方和 (MS)
F值
因子 隨機 總和
463.33 822 1285.33
2 12 14
231.66 68.5
3.38
2010/8/30
16
圖13.4 可樂裝填機裝填數量的檢定
f (F )
F2 ,12
3.38 接受域
3.89 拒絕域
F
2010/8/30
17