邱皓政2007统计原理与分析技术10__多因子变异数分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
: ..
Yq 2
:
(AB interaction effect)
A Y2. 主 要 效 果
Y p.
Y1 p
Y2 p
..
Y pq
M ean
Y.1
Y.2
.. . B主要效果q
Y
YG
5
拆解公式
SS Total SS
n p
A
q
SS B SS
2 ijk
AB
SS W
2 Y ijk
SS total
全體 男 3 .1 6 3 .0 9 6 .6 2 4 .1 4 小計 2 .7 8 3 .0 9 6 .4 0 3 .4 4
註:依變項為目前薪資,並以萬元 為單位。
表 1 0 Fra Baidu bibliotek8 各 平 方 和 的 數 據
S o u rc e M odel A B A *B E rro r T o ta l 1 3 7 9 .1 6 2 7 9 .19 4 3 .3 7 .2 0 2 .0 3 1
A 因子的單純主要效果檢定: 當 限 定 於 B 因 子 之 b 1 水 準 時 : H 1: μ A1B1? μ A2B1 當 限 定 於 B 因 子 之 b 2 水 準 時 : H 1: μ A1B2? μ A2B2 當 限 定 於 B 因 子 之 b 3 水 準 時 : H 1: μ A1B3? μ A2B3 B 因子的單純主要效果檢定: 當 限 定 於 A 因 子 之 a 1 水 準 時 : H 1: μ A1B1? μ A1B2? μ A1B3 當 限 定 於 A 因 子 之 a 2 水 準 時 : H 1: μ A2B1? μ A2B2? μ A2B3
.2 6 .2 3 .0 6 .0 1
3 5 5 .4 9 1 4 1 .1 6 4 8 .9 6 1 4 .3 2 1 0 2 3 .6 8 1 3 7 9 .1 6
.2 6 .1 2 .0 5 .0 1
3 5 5 .4 9 1 4 1 .1 6 4 8 .9 6 1 4 .3 2 1 0 2 3 .6 8 1 3 7 9 .1 6
15
一般 女 一般職員 保全 管理人員 T o ta l 4 .7 2 2 .6 7 2 .5 5 男 3 .2 7 3 .1 2 6 .5 7 4 .4 5 小計 2 .8 3 3 .1 2 6 .3 4 3 .6 0 2 .3 1 女 2 .3 1
少數 男 2 .9 0 3 .0 7 7 .6 0 3 .2 2 小計 2 .6 2 3 .0 7 7 .6 0 2 .8 7 4 .7 2 2 .6 0 女 2 .5 0
• 時機
– 共變數分析(ANCOVA):共變數必須最先進入模型,而且 共變數的SS不應受到其他各變異源的影響。 – 多項式迴歸模式:在較高階項進入之前,較低階項的SS應先 予以計算 – 純巢狀模式(purely nested model)(第一個被分析的效應會 套在第二層效應裏,第二層效應又巢套在第三更高階的效應 裡時。)
2
多因子設計(factorial design)
• 研究者同時採用兩個或以上的自變項XA、XB… 對於某一個依變項的影響
– 當研究者所使用的自變項是類別變項,依變項是 連續變項時,所使用的統計分析技術稱為多因子 變異數分析(Factorial ANOVA)
– 研究中包含兩個自變項,稱為二因子變異數 分析(two-way analysis of variance),依此 類推。
12
• 型II平方和
– 變異源SS的計算,調整了模型當中其他與該 變異源無關聯的變異源的關係。 – 可以讓研究者得知某一個變異源在排除所有 效應後的淨效果,在特殊情況下可以使用之, 例如特殊的巢狀模型。 – 僅有主要效果的模型中,型II平方和是一種 完全排除的淨效果檢驗
• 例如多元迴歸模型,就是以此一方法來排除獨變 項之間共變的影響
量化研究法二 統計原理與分析技術
第10章
多因子變異數分析
Analysis of Variance with Factorial Design
基本定義
• 平均數考驗方法
– 變異數分析是一套應用於探討平均數差異的統 計方法 – 當研究者所欲分析的資料是不同樣本的平均數, 也就是探討類別變項對於連續變項的影響,平 均數的差異成為主要分析重點 – 超過兩個以上的平均數的考驗,其原理是運用F 考驗來檢驗平均數間的變異量是否顯著的高於 隨機變異量,又稱為變異數分析
8
單純主要效果考驗摘要表(完全獨立設計)
變異來源 A 因子效果 在 b1 條 件 下 在 b2 條 件 下 在 b3 條 件 下 B 因子效果 在 a1 條 件 下 在 a2 條 件 下 組 內 (誤 差 )
SS
df
MS
F
S S A |b1 S S A |b2 S S A |b3
p -1 p -1 p -1
.2 6 .1 2 .0 5 .0 1
A: 性 別 , B: 種 族 別
16
表 1 0 .9 有 遺 漏 細 格 下 各 平 方 和 的 數據
S o u rc e M odel A B C A *B A *C B *C A *B * C E rro r T o ta l 1 3 7 9 .1 6 2 7 9 .19 8 9 4 .39 4 3 .3 7 .2 0 2 .6 4 8 .0 3 1
7
單純(簡單)主要效果(simple main effects)
• 交互效果顯著,需進行單純主要效果的事後檢驗。
– 當交互效果顯著時,反應出兩個因子對於依變項的影響互相有所關 連,因此個別主要效果的意義不再值得信賴,
• 以AB兩個獨變項為例:
– A因子單純主要效果(simple main effect of the A factor):「在考慮B 的不同水準條件下,檢視A因子對於依變項的影響」,分別檢驗在 b1、b2、b3三種限定條件下的A效果。 – B因子單純主要效果(simple main effect of the B factor): 「在考慮 A的不同水準條件下,檢視B因子對於依變項的影響」,分別檢驗 在a1與a2兩種限定條件下的B因子效果。
– 導因於誤差的變異:
• 指各細格內的原始分數的變動情形,屬於隨機性誤差。
4
二因子變異數分析的平均數雙向表 與組間效果
獨變項 B 水準 1 水準 1 獨 變 項 : A 水準 p : 水準 2 水準 2 .. 水準 q M ean
Y1 1
Y21
..
Y q1
Y1 .
Y1 2
Y21 .. AB交互效果
2
n p
Y ijk
2
j 1 k 1
q
n
p
( Y ijk ) nq
2
j 1
p
q
( Y ijk ) np
q
2
( Y ijk ) npq
2
k 1
SS w
(Y
i 1 j 1 k 1
ijk
Y jk )
2
2 Y ijk
– 僅適用於只有主要效果(沒有交互效果)的 變異數分析模型中
13
• 型III平方和
– 變異源SS的計算,調整了它與模型當中其他 所有變異源的關係 – 是最嚴格的控制關係,排除效果最徹底 – 適合對於各組人數不等時的不平衡ANOVA 分析,可以將各細格人數差異的影響降至最 低 – 細格樣本數多非相等,應以型III平方和來進 行變異數的估計
S S A | b 1 /d f A S S A | b 2 /d f A S S A | b 3 /d f A
M S A |b 1 /M S w M S A |b 2 /M S w M S A |b 3 /M S w
S S B |a1 S S B |a2 SSw
q -1 q -1 N -pq
S S B | a 1 /d f B S S B | a 2 /d f B S S w /d f w
14
• 型IV平方和
– 適用於當ANOVA當中存在著遺漏細格(空 白細格)(missing cells)(多因子交互影響 的各細格中,有某一個細格完全沒有數據時 ) 的情況下 – 利用遺漏以外的細格的對比加以估計,然後 平均分配到較高階變異源,使得其他未遺漏 細格的變異源得以補入SS當中 – 若有遺漏細格時,以型I、II、III來計算SS會 產生低估的現象
SS
2
T yp e I
2
T yp e II
2
T yp e III
2
T yp e IV
2
9 7 5 .0 6 2 7 9 .19 6 7 2 .9 0 3 .7 9 1 2 .2 5 .0 3 6 .9 0 .0 0 4 0 4 .1 0 1 3 7 9 .1 6
SS
2
T yp e I
2
T yp e II
2
T yp e III
2
T yp e IV
2
3 5 5 .4 9 2 7 9 .1 9 6 1 .9 8 1 4 .3 2 1 0 2 3 .6 8 1 3 7 9 .1 6
.2 6 .2 1 .0 6 .0 1
3 5 5 .4 9 2 9 7 .7 9 6 1 .9 8 1 4 .3 2 1 0 2 3 .6 8 1 3 7 9 .1 6
p
(Y
i 1 j 1 k 1
j.
YG )
p
( Y ijk ) npq
2
2
SS
A
nq (Y
j 1
YG )
2
( Y iik ) nq
2
( Y ijk ) npq
j 1
SS B
np (Y
k 1
q
.k
YG )
M S B |a 1 /M S w M S B |a 2 /M S w
9
多因子變異數分析的圖示
• 交互作用
6 平 均 5 數 4 3 2 1 0 b1 b2 B因子 b3 a1 a2
6 平 均 5 數 4 3 2 1 0 b1 b2 B因子
a1 a2
b3
(a)非次序性關係
6 平 均 5 數 4 3 2 1 0 b1 b2 B因子 b3 a1 a2
2
q
( Y ijk ) np
2
( Y ijk ) npq
2
2
k 1
SS
AB
n [Y
j 1 k 1 p q
p
q
jk
Y G ( Y j . Y G ) (Y. k Y G )]
n (Y
j 1 k 1 p q
jk
Y j . Y. k Y G )
Y ijk
2
j 1 k 1
n
6
二因子變異數分析假設考驗決策樹
表示顯著後的決策 表示不顯著的決策 k=2 拒 絕 H0 顯著 k3 顯著 顯著 單純主要效果 不顯著 交互效果 拒 絕 H0 k=2 顯著 k3 顯著 主要效果 不顯著 不顯著 接 受 H0 多重比較 不顯著 接 受 H0 拒 絕 H0 不顯著 接 受 H0 接 受 H0 多重比較 拒 絕 H0
(b)次序性關係
(c)部分非次序性關係
10
交互效果不顯著的主要效果圖示
• 主要效果
6 平 均 5 數 4 3 2 1 0 b1 b2 B因子 b3 a1 a2 mean
6 平 均 5 數 4 3 2 1 0 b1 b2 B因子
a1 a2 mean
b3
(a)A與B主要效果不顯著
6 平 均 5 數 4 3 2 1 0 b3 mean B因子 a1 a2 mean
(b)A與B主要效果均顯著
6 平 均 5 數 4 3 2 1 0 b1 b2 B因子 b3 a1 a2 mean
(c)A主要效果顯著但B不顯著
(d)B主要效果顯著但A不顯著
11
型I、II、III、IV平方和
• 型I平方和
– 階層化拆解原理(hierarchical decomposition of the sum-ofsquares method) – 每一個變異源的SS在計算時,會針對模型中已存在的其他變 異源的相互關係而加以調整。 – 先進入模型者不受控制,晚進入模型者則會被先進入模式的 變項控制住,得到邊際影響力(marginal influences)
• SSB的複雜化
– 組間離均差平方和(SSB):「組間變異」 視不同的因子有不同的效果考驗程序
3
變異拆解
• 拆解原理
– 依變項的總變異可切割成「導因於自變項影響的變異」與「導 因於誤差的變異」兩個部份。 – 導因於自變項影響的變異:
• 主要效果(Main effects)的平均數變異: 指各自變數不同水準在依變項 上得分的平均數的變動情形。這些平均數又稱為邊緣平均數 (marginal means)。 • 交互效果(Interaction effects)的平均數變異:指自變數交叉影響下在依 變項上得分的平均數的變動情形。這些平均數又稱為細格平均數 (cell means)。
Yq 2
:
(AB interaction effect)
A Y2. 主 要 效 果
Y p.
Y1 p
Y2 p
..
Y pq
M ean
Y.1
Y.2
.. . B主要效果q
Y
YG
5
拆解公式
SS Total SS
n p
A
q
SS B SS
2 ijk
AB
SS W
2 Y ijk
SS total
全體 男 3 .1 6 3 .0 9 6 .6 2 4 .1 4 小計 2 .7 8 3 .0 9 6 .4 0 3 .4 4
註:依變項為目前薪資,並以萬元 為單位。
表 1 0 Fra Baidu bibliotek8 各 平 方 和 的 數 據
S o u rc e M odel A B A *B E rro r T o ta l 1 3 7 9 .1 6 2 7 9 .19 4 3 .3 7 .2 0 2 .0 3 1
A 因子的單純主要效果檢定: 當 限 定 於 B 因 子 之 b 1 水 準 時 : H 1: μ A1B1? μ A2B1 當 限 定 於 B 因 子 之 b 2 水 準 時 : H 1: μ A1B2? μ A2B2 當 限 定 於 B 因 子 之 b 3 水 準 時 : H 1: μ A1B3? μ A2B3 B 因子的單純主要效果檢定: 當 限 定 於 A 因 子 之 a 1 水 準 時 : H 1: μ A1B1? μ A1B2? μ A1B3 當 限 定 於 A 因 子 之 a 2 水 準 時 : H 1: μ A2B1? μ A2B2? μ A2B3
.2 6 .2 3 .0 6 .0 1
3 5 5 .4 9 1 4 1 .1 6 4 8 .9 6 1 4 .3 2 1 0 2 3 .6 8 1 3 7 9 .1 6
.2 6 .1 2 .0 5 .0 1
3 5 5 .4 9 1 4 1 .1 6 4 8 .9 6 1 4 .3 2 1 0 2 3 .6 8 1 3 7 9 .1 6
15
一般 女 一般職員 保全 管理人員 T o ta l 4 .7 2 2 .6 7 2 .5 5 男 3 .2 7 3 .1 2 6 .5 7 4 .4 5 小計 2 .8 3 3 .1 2 6 .3 4 3 .6 0 2 .3 1 女 2 .3 1
少數 男 2 .9 0 3 .0 7 7 .6 0 3 .2 2 小計 2 .6 2 3 .0 7 7 .6 0 2 .8 7 4 .7 2 2 .6 0 女 2 .5 0
• 時機
– 共變數分析(ANCOVA):共變數必須最先進入模型,而且 共變數的SS不應受到其他各變異源的影響。 – 多項式迴歸模式:在較高階項進入之前,較低階項的SS應先 予以計算 – 純巢狀模式(purely nested model)(第一個被分析的效應會 套在第二層效應裏,第二層效應又巢套在第三更高階的效應 裡時。)
2
多因子設計(factorial design)
• 研究者同時採用兩個或以上的自變項XA、XB… 對於某一個依變項的影響
– 當研究者所使用的自變項是類別變項,依變項是 連續變項時,所使用的統計分析技術稱為多因子 變異數分析(Factorial ANOVA)
– 研究中包含兩個自變項,稱為二因子變異數 分析(two-way analysis of variance),依此 類推。
12
• 型II平方和
– 變異源SS的計算,調整了模型當中其他與該 變異源無關聯的變異源的關係。 – 可以讓研究者得知某一個變異源在排除所有 效應後的淨效果,在特殊情況下可以使用之, 例如特殊的巢狀模型。 – 僅有主要效果的模型中,型II平方和是一種 完全排除的淨效果檢驗
• 例如多元迴歸模型,就是以此一方法來排除獨變 項之間共變的影響
量化研究法二 統計原理與分析技術
第10章
多因子變異數分析
Analysis of Variance with Factorial Design
基本定義
• 平均數考驗方法
– 變異數分析是一套應用於探討平均數差異的統 計方法 – 當研究者所欲分析的資料是不同樣本的平均數, 也就是探討類別變項對於連續變項的影響,平 均數的差異成為主要分析重點 – 超過兩個以上的平均數的考驗,其原理是運用F 考驗來檢驗平均數間的變異量是否顯著的高於 隨機變異量,又稱為變異數分析
8
單純主要效果考驗摘要表(完全獨立設計)
變異來源 A 因子效果 在 b1 條 件 下 在 b2 條 件 下 在 b3 條 件 下 B 因子效果 在 a1 條 件 下 在 a2 條 件 下 組 內 (誤 差 )
SS
df
MS
F
S S A |b1 S S A |b2 S S A |b3
p -1 p -1 p -1
.2 6 .1 2 .0 5 .0 1
A: 性 別 , B: 種 族 別
16
表 1 0 .9 有 遺 漏 細 格 下 各 平 方 和 的 數據
S o u rc e M odel A B C A *B A *C B *C A *B * C E rro r T o ta l 1 3 7 9 .1 6 2 7 9 .19 8 9 4 .39 4 3 .3 7 .2 0 2 .6 4 8 .0 3 1
7
單純(簡單)主要效果(simple main effects)
• 交互效果顯著,需進行單純主要效果的事後檢驗。
– 當交互效果顯著時,反應出兩個因子對於依變項的影響互相有所關 連,因此個別主要效果的意義不再值得信賴,
• 以AB兩個獨變項為例:
– A因子單純主要效果(simple main effect of the A factor):「在考慮B 的不同水準條件下,檢視A因子對於依變項的影響」,分別檢驗在 b1、b2、b3三種限定條件下的A效果。 – B因子單純主要效果(simple main effect of the B factor): 「在考慮 A的不同水準條件下,檢視B因子對於依變項的影響」,分別檢驗 在a1與a2兩種限定條件下的B因子效果。
– 導因於誤差的變異:
• 指各細格內的原始分數的變動情形,屬於隨機性誤差。
4
二因子變異數分析的平均數雙向表 與組間效果
獨變項 B 水準 1 水準 1 獨 變 項 : A 水準 p : 水準 2 水準 2 .. 水準 q M ean
Y1 1
Y21
..
Y q1
Y1 .
Y1 2
Y21 .. AB交互效果
2
n p
Y ijk
2
j 1 k 1
q
n
p
( Y ijk ) nq
2
j 1
p
q
( Y ijk ) np
q
2
( Y ijk ) npq
2
k 1
SS w
(Y
i 1 j 1 k 1
ijk
Y jk )
2
2 Y ijk
– 僅適用於只有主要效果(沒有交互效果)的 變異數分析模型中
13
• 型III平方和
– 變異源SS的計算,調整了它與模型當中其他 所有變異源的關係 – 是最嚴格的控制關係,排除效果最徹底 – 適合對於各組人數不等時的不平衡ANOVA 分析,可以將各細格人數差異的影響降至最 低 – 細格樣本數多非相等,應以型III平方和來進 行變異數的估計
S S A | b 1 /d f A S S A | b 2 /d f A S S A | b 3 /d f A
M S A |b 1 /M S w M S A |b 2 /M S w M S A |b 3 /M S w
S S B |a1 S S B |a2 SSw
q -1 q -1 N -pq
S S B | a 1 /d f B S S B | a 2 /d f B S S w /d f w
14
• 型IV平方和
– 適用於當ANOVA當中存在著遺漏細格(空 白細格)(missing cells)(多因子交互影響 的各細格中,有某一個細格完全沒有數據時 ) 的情況下 – 利用遺漏以外的細格的對比加以估計,然後 平均分配到較高階變異源,使得其他未遺漏 細格的變異源得以補入SS當中 – 若有遺漏細格時,以型I、II、III來計算SS會 產生低估的現象
SS
2
T yp e I
2
T yp e II
2
T yp e III
2
T yp e IV
2
9 7 5 .0 6 2 7 9 .19 6 7 2 .9 0 3 .7 9 1 2 .2 5 .0 3 6 .9 0 .0 0 4 0 4 .1 0 1 3 7 9 .1 6
SS
2
T yp e I
2
T yp e II
2
T yp e III
2
T yp e IV
2
3 5 5 .4 9 2 7 9 .1 9 6 1 .9 8 1 4 .3 2 1 0 2 3 .6 8 1 3 7 9 .1 6
.2 6 .2 1 .0 6 .0 1
3 5 5 .4 9 2 9 7 .7 9 6 1 .9 8 1 4 .3 2 1 0 2 3 .6 8 1 3 7 9 .1 6
p
(Y
i 1 j 1 k 1
j.
YG )
p
( Y ijk ) npq
2
2
SS
A
nq (Y
j 1
YG )
2
( Y iik ) nq
2
( Y ijk ) npq
j 1
SS B
np (Y
k 1
q
.k
YG )
M S B |a 1 /M S w M S B |a 2 /M S w
9
多因子變異數分析的圖示
• 交互作用
6 平 均 5 數 4 3 2 1 0 b1 b2 B因子 b3 a1 a2
6 平 均 5 數 4 3 2 1 0 b1 b2 B因子
a1 a2
b3
(a)非次序性關係
6 平 均 5 數 4 3 2 1 0 b1 b2 B因子 b3 a1 a2
2
q
( Y ijk ) np
2
( Y ijk ) npq
2
2
k 1
SS
AB
n [Y
j 1 k 1 p q
p
q
jk
Y G ( Y j . Y G ) (Y. k Y G )]
n (Y
j 1 k 1 p q
jk
Y j . Y. k Y G )
Y ijk
2
j 1 k 1
n
6
二因子變異數分析假設考驗決策樹
表示顯著後的決策 表示不顯著的決策 k=2 拒 絕 H0 顯著 k3 顯著 顯著 單純主要效果 不顯著 交互效果 拒 絕 H0 k=2 顯著 k3 顯著 主要效果 不顯著 不顯著 接 受 H0 多重比較 不顯著 接 受 H0 拒 絕 H0 不顯著 接 受 H0 接 受 H0 多重比較 拒 絕 H0
(b)次序性關係
(c)部分非次序性關係
10
交互效果不顯著的主要效果圖示
• 主要效果
6 平 均 5 數 4 3 2 1 0 b1 b2 B因子 b3 a1 a2 mean
6 平 均 5 數 4 3 2 1 0 b1 b2 B因子
a1 a2 mean
b3
(a)A與B主要效果不顯著
6 平 均 5 數 4 3 2 1 0 b3 mean B因子 a1 a2 mean
(b)A與B主要效果均顯著
6 平 均 5 數 4 3 2 1 0 b1 b2 B因子 b3 a1 a2 mean
(c)A主要效果顯著但B不顯著
(d)B主要效果顯著但A不顯著
11
型I、II、III、IV平方和
• 型I平方和
– 階層化拆解原理(hierarchical decomposition of the sum-ofsquares method) – 每一個變異源的SS在計算時,會針對模型中已存在的其他變 異源的相互關係而加以調整。 – 先進入模型者不受控制,晚進入模型者則會被先進入模式的 變項控制住,得到邊際影響力(marginal influences)
• SSB的複雜化
– 組間離均差平方和(SSB):「組間變異」 視不同的因子有不同的效果考驗程序
3
變異拆解
• 拆解原理
– 依變項的總變異可切割成「導因於自變項影響的變異」與「導 因於誤差的變異」兩個部份。 – 導因於自變項影響的變異:
• 主要效果(Main effects)的平均數變異: 指各自變數不同水準在依變項 上得分的平均數的變動情形。這些平均數又稱為邊緣平均數 (marginal means)。 • 交互效果(Interaction effects)的平均數變異:指自變數交叉影響下在依 變項上得分的平均數的變動情形。這些平均數又稱為細格平均數 (cell means)。