CH12变异数分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第12章 變異數分析 第358頁
12.8
範例12.1 股票投資佔總資產 辨識方法 的比例
虛無假設: H0: µ = µ = µ = µ 1 2 3 4 這些母體平均數之間沒有差異。
對立假設:
H1: 至少兩個平均數不等 下一個步驟是決定檢定統計量。
第12章 變異數分析 第357頁
12.9
檢定統計量
第12章 變異數分析 第359頁
12.14
範例12.1 股票投資佔總資產 計算 的比例
因此,代表處理平方和的處理間變異為:
SST
j 1
k
n j(x j x )
2
8 4 ( 4 4 .4 0 5 0 .1 8 ) 1 3 1(5 2 .4 7 5 0 .1 8 )
2 2
2
範例12.1 股票投資佔總資產 計算 的比例
在我們的範例中,可求出
M ST SST k 1
SSE n-k
3, 7 3 8 .8 3
1, 2 4 6 .2 7
M SE
1 6 1, 8 7 1.3 362
4 4 7 .1 6
F
M ST M SE
1, 2 4 6 .2 7 4 4 7 .1 6
第12章 變異數分析 第359-360頁
12.12
範例12.1 股票投資佔總資產 計算 的比例
根據:
SST
j 1
k
n j(x j x )
2
如果: x1 x 2 x 3 x 4 則 SST = 0 ,因此一個小的SST值支持虛無假設。 在這個檢定中(如同在其他所有統計檢定中)要 回答的關鍵問題是,檢定統計量必須多大,我們 才能判定拒絕虛無假設?
L S D t / 2 1 1 M SE n nj i
自由度是 = n k
Fisher 的最小顯著差異法
什麼是關鍵數字 NCritical ?在第11章,我們介紹信賴區間估 計量是:
( x1 x 2 ) t / 2 1 1 sp n1 n2
2
假設區間不包括 0 ,我們可以推斷母體平均數不同。所以 另一個引導雙尾檢定的方式為測定是否
SST
j 1
k
n j(x j x )
2
假如樣本平均數之間存在著大的差異,至少有一些樣本平均數與總平均數非常的不同, 產生一個大的 SST 數值。則拒絕虛無假設,傾向對立假設是合理的。
第12章 變異數分析 第358頁
12.10
檢定統計量
我們利用在11章討論過的方法,在母體變異數是 相等的情況下,計算兩個母體共同變異數的混合 估計量
必要條件的違背
假如資料不是呈常態分配,我們能夠以等同於一 因子變異數分析的無母數方法取代,它是 Kruskal-Wallis 檢定。 假如母體變異數不相等,我們能夠使用幾種方法 去校正這個問題。 但是,這些校正的測量方法超出本書的程度範圍。
第12章 變異數分析 第365頁
12.25
多重比較
= 所有觀測值的總平均數= n n1 + n2 +…+ nk 且 k 為母體的個數。
x
j 1 i 1
k
n
j
x ij
,其中n =
第12章 變異數分析 第358頁
12.4
一因子變異數分析
我們要測量的單位稱為實驗單位(experiment unit)。 用來區分母體的標準稱為因子(factor)。 每一個母體皆稱為一個因子水準(factor level) 。
sp
2
( n 1 1) s1 ( n 2 1) s 2
2
2
n1 n 2 2
其中
t
( x1 x 2 ) 1 1 sp n1 n2
2
分子測量樣本平均數之間的差異,分母測量樣本 之間的變異。
第12章 變異數分析
12.11
檢定統計量
處理間變異(between-treatments variation) 以SST表示,處 理內變異(within-treatments variation)記為SSE。 誤差平方和(sum of squares for error):
在範例中,p-值 = P(F > 2.79) 使用Excel P(F > 2.79)=FDIST (2.79,3,362)=.0405。 圖12.2 說明範例12.1 的抽樣分配。
第12章 變異數分析 第362頁
12.19
範例12.1 股票投資佔總資產 計算 的比例源自文库
第12章 變異數分析 第363頁 圖12.2
因為µ = µ = µ = µ 是我們所感興趣的假設,因 1 2 3 4 此各樣本平均數之間近似程度的測量我們也會感 興趣。
測量樣本平均數之間彼此近似程度的統計量被稱 為處理間變異(between-treatments variation) ,以 SST表示,其代表處理平方和(sum of squares for treatments)。表示為: 所有觀測值的總平均數 母體的個數
12.20
範例12.1 股票投資佔總資產 計算 的比例
第12章 變異數分析 第364頁
12.21
範例12.1 股票投資佔總資產 詮釋 的比例
p-值為.0405是夠小的,所以我們拒絕虛無假設 (H0: µ = µ = µ = µ ) 偏好對立假設 (H1: 至少兩 1 2 3 4 個母體平均數不同) 。
多重比較
兩個平均數被認為是不同的,假設它們樣本平均 數間的差異是大於一個臨界值。對此,一般的通 式是, 假設 x i - x j N C ritical
然後我們推斷 i 和 j不同。
我們相信較大的樣本平均數差異與一個較大的母 體平均數差異是有關聯的。
第14章 變異數分析
12.27
x1 x 2
大於
t / 2 1 1 sp n2 n1
2
12.28
第14章 變異數分析 第372-373頁
Fisher 的最小顯著差異法
因為MSE 將會是一個比sp2 更佳的估計量。因此,以 MSE 取代前述的檢定統計量和信賴區間估計量公式中的sp2 。因 此我們定義最小顯著差異(least significant difference, LSD) 為一個決定每一對母體平均數間是否存在著差異的簡單辦 法,是將兩樣本平均數間差異的絕對值與LSD 做比較:
第12章 變異數分析 第357頁
12.6
範例12.1 股票投資佔總資產 的比例
年齡的類別為
年輕人(35 歲以下) 中年初期(35 到49 歲) 中年後期(50 到65 歲) 年長者(65 歲以上)
該分析師特別感興趣的是決定股票的擁有是否因 年齡而異。Xm14-01 這些資料是否允許分析師決定股票的擁有比率在 四個年齡群之間存有差異?
意即存在著證據可以推論總資產投資於股票的百 分比至少在兩個年齡類別是不等的。
第12章 變異數分析 第364頁
12.22
變異數分析(ANOVA) 表
變異數分析(ANOVA) 表(analysis of variance) 。
F- 統計量=MST/MSE
第12章 變異數分析 第363頁 表12.2&表12.3
第12章 變異數分析 第357頁
12.7
範例12.1 股票投資佔總資產 專有名詞 的比例
總資產投資於股市的百分比稱為反應變數;實際百 分比稱為反應值。 用來區分母體的標準稱為因子(factor)。 年齡類別是我們感興趣的,這是需要考慮的唯一類 別 (因此, 有“一因子”變異數分析的名稱)。 每一個母體皆稱為一個因子水準。 在本範例中有四個因子水準:年輕人、中年初期、 中年後期與年長者。
SSE
j 1 i 1
k
nj
( x ij x j )
2
SSE
j 1
k
( n j 1)s
2 j
其中sj2 是樣本j 的樣本變異數。因此,SSE 是k 個樣本的 合併或混合變異數。這是我們在13.1 節中一個計算的推 廣,其中我們使用兩個母體共同變異數的混合估計量( 表 示為sp 2) 以檢定和估計介於兩個平均數之間的差異。
第12章 變異數分析 第358頁
12.5
範例12.1 股票投資佔總資產 的比例 Xm14-01
在過去10 年間,證券經紀商做生意的方法已經有 了極大的改變。網路交易已經變得非常普遍,線 上交易的花費最低只需要$7。現在投資於股票市 場比從前更簡單且更便宜。 這些改變產生哪些影響? 為了協助回答此問題,一位財務分析師隨機抽樣 366 個美國家庭,並且要求每一個家庭報告家中戶 長的年齡以及他們的金融資產投資在股票市場的 比例。
第12章 變異數分析 第360-361頁
12.16
均方
處理的均方: M S T
SST k 1 SSE nk
誤差的均方:M S E
檢定統計量: F
M ST M SE
在反應變數是常態分配的條件下,檢定統計量服 從自由度為 k-1 和 n-k 的F-分配。
第12章 變異數分析 第361頁
12.17
第 12 章
變異數分析
12.1
變異數分析
統計實作人員比較兩個或更多個區間資料的母 體,這個方法稱為變異數分析(analysis of variance)。 變異數分析: 極為有用和普及的程序 決定母體平均數之間是否存在著差異 這個程序的運作是藉由分析樣本的變異數
第12章 變異數分析 第356頁
12.2
一因子變異數分析
下圖說明獨立樣本的抽樣設計:
第12章 變異數分析 第356頁 圖12.1
12.3
一因子變異數分析
變數X 稱為反應變數(response variable),其數值 稱為反應值(responses)。 xij = 第 j 個樣本的第i 個觀測值 例如:x35 為第5個樣本的第3個觀測值。
2 .7 9
F = 2.79 是否在拒絕域中? p-值是多少?
第12章 變異數分析 第362頁
12.18
範例12.1 股票投資佔總資產 詮釋 的比例
計算 F-統計量(F-statistic)的目的是決定SST的值 是否夠大去拒絕虛無假設。假如SST是大的,F 將會很大。 p-值 = P(F > Fstat)
第12章 變異數分析 第359頁
12.13
範例12.1 股票投資佔總資產 計算 的比例
我們計算樣本平均數與總平均數為:
x 1 4 4 .4 0 x 2 5 2 .4 7 x 3 5 1 .1 4 x 4 5 1 .8 4 x 5 0 .1 8
n1 8 4 n2 131 n3 9 3 n4 58
我們從一因子變異數分析得到結論:至少有兩個 處理平均數不同,我們經常需要知道哪幾個處理 平均數造成這些差異性。 我們將會提出三種方法來決定哪些母體平均數是 不同的: Fisher的最小顯著差異法 Bonferroni 校正 Tukey的多重比較方法
第12章 變異數分析 第370頁
12.26
s1 386 . 55 , s 2 469 . 44 , s 3 4 7 1 . 82 , s 4 444 . 79
2 2 2 2
因此,誤差平方和為:
S S E ( n1 1) s1 ( n 2 1) s 2 ( n 3 1) s 3 ( n 4 1) s 4
12.23
檢查必要的條件
變異數分析的F- 檢定要求隨機變數是具有相等 變異數的常態分配。只要對每一個樣本繪製直方 圖,就可以容易地用圖形檢查常態性的條件。 變異數的同質性可由列印樣本標準差或變異數檢 視之。樣本變異數的相似性讓我們能夠假設母體 變異數是相等的。
第12章 變異數分析 第365頁
12.24
9 3 (5 1 .1 4 5 0 .1 8 ) 5 8 (5 1 .8 4 5 0 .1 8 ) 3, 7 3 8 .8
2
SST = 3,738.8這個值是不是夠大去指出母體平均數 不同?
第12章 變異數分析 第359頁
12.15
範例12.1 股票投資佔總資產 計算 的比例
我們計算樣本變異數如下:
2 2 2 2
(8 4 1)(3 8 6 .5 5 ) (1 3 1 1)( 4 6 9 .4 4 ) (9 3 1) ( 4 7 1 .8 2 ) (5 8 1)( 4 4 4 .7 9 ) 1 6 1, 8 7 1 .3
我們需要檢定統計量來證明SST和SSE的相關性。
12.8
範例12.1 股票投資佔總資產 辨識方法 的比例
虛無假設: H0: µ = µ = µ = µ 1 2 3 4 這些母體平均數之間沒有差異。
對立假設:
H1: 至少兩個平均數不等 下一個步驟是決定檢定統計量。
第12章 變異數分析 第357頁
12.9
檢定統計量
第12章 變異數分析 第359頁
12.14
範例12.1 股票投資佔總資產 計算 的比例
因此,代表處理平方和的處理間變異為:
SST
j 1
k
n j(x j x )
2
8 4 ( 4 4 .4 0 5 0 .1 8 ) 1 3 1(5 2 .4 7 5 0 .1 8 )
2 2
2
範例12.1 股票投資佔總資產 計算 的比例
在我們的範例中,可求出
M ST SST k 1
SSE n-k
3, 7 3 8 .8 3
1, 2 4 6 .2 7
M SE
1 6 1, 8 7 1.3 362
4 4 7 .1 6
F
M ST M SE
1, 2 4 6 .2 7 4 4 7 .1 6
第12章 變異數分析 第359-360頁
12.12
範例12.1 股票投資佔總資產 計算 的比例
根據:
SST
j 1
k
n j(x j x )
2
如果: x1 x 2 x 3 x 4 則 SST = 0 ,因此一個小的SST值支持虛無假設。 在這個檢定中(如同在其他所有統計檢定中)要 回答的關鍵問題是,檢定統計量必須多大,我們 才能判定拒絕虛無假設?
L S D t / 2 1 1 M SE n nj i
自由度是 = n k
Fisher 的最小顯著差異法
什麼是關鍵數字 NCritical ?在第11章,我們介紹信賴區間估 計量是:
( x1 x 2 ) t / 2 1 1 sp n1 n2
2
假設區間不包括 0 ,我們可以推斷母體平均數不同。所以 另一個引導雙尾檢定的方式為測定是否
SST
j 1
k
n j(x j x )
2
假如樣本平均數之間存在著大的差異,至少有一些樣本平均數與總平均數非常的不同, 產生一個大的 SST 數值。則拒絕虛無假設,傾向對立假設是合理的。
第12章 變異數分析 第358頁
12.10
檢定統計量
我們利用在11章討論過的方法,在母體變異數是 相等的情況下,計算兩個母體共同變異數的混合 估計量
必要條件的違背
假如資料不是呈常態分配,我們能夠以等同於一 因子變異數分析的無母數方法取代,它是 Kruskal-Wallis 檢定。 假如母體變異數不相等,我們能夠使用幾種方法 去校正這個問題。 但是,這些校正的測量方法超出本書的程度範圍。
第12章 變異數分析 第365頁
12.25
多重比較
= 所有觀測值的總平均數= n n1 + n2 +…+ nk 且 k 為母體的個數。
x
j 1 i 1
k
n
j
x ij
,其中n =
第12章 變異數分析 第358頁
12.4
一因子變異數分析
我們要測量的單位稱為實驗單位(experiment unit)。 用來區分母體的標準稱為因子(factor)。 每一個母體皆稱為一個因子水準(factor level) 。
sp
2
( n 1 1) s1 ( n 2 1) s 2
2
2
n1 n 2 2
其中
t
( x1 x 2 ) 1 1 sp n1 n2
2
分子測量樣本平均數之間的差異,分母測量樣本 之間的變異。
第12章 變異數分析
12.11
檢定統計量
處理間變異(between-treatments variation) 以SST表示,處 理內變異(within-treatments variation)記為SSE。 誤差平方和(sum of squares for error):
在範例中,p-值 = P(F > 2.79) 使用Excel P(F > 2.79)=FDIST (2.79,3,362)=.0405。 圖12.2 說明範例12.1 的抽樣分配。
第12章 變異數分析 第362頁
12.19
範例12.1 股票投資佔總資產 計算 的比例源自文库
第12章 變異數分析 第363頁 圖12.2
因為µ = µ = µ = µ 是我們所感興趣的假設,因 1 2 3 4 此各樣本平均數之間近似程度的測量我們也會感 興趣。
測量樣本平均數之間彼此近似程度的統計量被稱 為處理間變異(between-treatments variation) ,以 SST表示,其代表處理平方和(sum of squares for treatments)。表示為: 所有觀測值的總平均數 母體的個數
12.20
範例12.1 股票投資佔總資產 計算 的比例
第12章 變異數分析 第364頁
12.21
範例12.1 股票投資佔總資產 詮釋 的比例
p-值為.0405是夠小的,所以我們拒絕虛無假設 (H0: µ = µ = µ = µ ) 偏好對立假設 (H1: 至少兩 1 2 3 4 個母體平均數不同) 。
多重比較
兩個平均數被認為是不同的,假設它們樣本平均 數間的差異是大於一個臨界值。對此,一般的通 式是, 假設 x i - x j N C ritical
然後我們推斷 i 和 j不同。
我們相信較大的樣本平均數差異與一個較大的母 體平均數差異是有關聯的。
第14章 變異數分析
12.27
x1 x 2
大於
t / 2 1 1 sp n2 n1
2
12.28
第14章 變異數分析 第372-373頁
Fisher 的最小顯著差異法
因為MSE 將會是一個比sp2 更佳的估計量。因此,以 MSE 取代前述的檢定統計量和信賴區間估計量公式中的sp2 。因 此我們定義最小顯著差異(least significant difference, LSD) 為一個決定每一對母體平均數間是否存在著差異的簡單辦 法,是將兩樣本平均數間差異的絕對值與LSD 做比較:
第12章 變異數分析 第357頁
12.6
範例12.1 股票投資佔總資產 的比例
年齡的類別為
年輕人(35 歲以下) 中年初期(35 到49 歲) 中年後期(50 到65 歲) 年長者(65 歲以上)
該分析師特別感興趣的是決定股票的擁有是否因 年齡而異。Xm14-01 這些資料是否允許分析師決定股票的擁有比率在 四個年齡群之間存有差異?
意即存在著證據可以推論總資產投資於股票的百 分比至少在兩個年齡類別是不等的。
第12章 變異數分析 第364頁
12.22
變異數分析(ANOVA) 表
變異數分析(ANOVA) 表(analysis of variance) 。
F- 統計量=MST/MSE
第12章 變異數分析 第363頁 表12.2&表12.3
第12章 變異數分析 第357頁
12.7
範例12.1 股票投資佔總資產 專有名詞 的比例
總資產投資於股市的百分比稱為反應變數;實際百 分比稱為反應值。 用來區分母體的標準稱為因子(factor)。 年齡類別是我們感興趣的,這是需要考慮的唯一類 別 (因此, 有“一因子”變異數分析的名稱)。 每一個母體皆稱為一個因子水準。 在本範例中有四個因子水準:年輕人、中年初期、 中年後期與年長者。
SSE
j 1 i 1
k
nj
( x ij x j )
2
SSE
j 1
k
( n j 1)s
2 j
其中sj2 是樣本j 的樣本變異數。因此,SSE 是k 個樣本的 合併或混合變異數。這是我們在13.1 節中一個計算的推 廣,其中我們使用兩個母體共同變異數的混合估計量( 表 示為sp 2) 以檢定和估計介於兩個平均數之間的差異。
第12章 變異數分析 第358頁
12.5
範例12.1 股票投資佔總資產 的比例 Xm14-01
在過去10 年間,證券經紀商做生意的方法已經有 了極大的改變。網路交易已經變得非常普遍,線 上交易的花費最低只需要$7。現在投資於股票市 場比從前更簡單且更便宜。 這些改變產生哪些影響? 為了協助回答此問題,一位財務分析師隨機抽樣 366 個美國家庭,並且要求每一個家庭報告家中戶 長的年齡以及他們的金融資產投資在股票市場的 比例。
第12章 變異數分析 第360-361頁
12.16
均方
處理的均方: M S T
SST k 1 SSE nk
誤差的均方:M S E
檢定統計量: F
M ST M SE
在反應變數是常態分配的條件下,檢定統計量服 從自由度為 k-1 和 n-k 的F-分配。
第12章 變異數分析 第361頁
12.17
第 12 章
變異數分析
12.1
變異數分析
統計實作人員比較兩個或更多個區間資料的母 體,這個方法稱為變異數分析(analysis of variance)。 變異數分析: 極為有用和普及的程序 決定母體平均數之間是否存在著差異 這個程序的運作是藉由分析樣本的變異數
第12章 變異數分析 第356頁
12.2
一因子變異數分析
下圖說明獨立樣本的抽樣設計:
第12章 變異數分析 第356頁 圖12.1
12.3
一因子變異數分析
變數X 稱為反應變數(response variable),其數值 稱為反應值(responses)。 xij = 第 j 個樣本的第i 個觀測值 例如:x35 為第5個樣本的第3個觀測值。
2 .7 9
F = 2.79 是否在拒絕域中? p-值是多少?
第12章 變異數分析 第362頁
12.18
範例12.1 股票投資佔總資產 詮釋 的比例
計算 F-統計量(F-statistic)的目的是決定SST的值 是否夠大去拒絕虛無假設。假如SST是大的,F 將會很大。 p-值 = P(F > Fstat)
第12章 變異數分析 第359頁
12.13
範例12.1 股票投資佔總資產 計算 的比例
我們計算樣本平均數與總平均數為:
x 1 4 4 .4 0 x 2 5 2 .4 7 x 3 5 1 .1 4 x 4 5 1 .8 4 x 5 0 .1 8
n1 8 4 n2 131 n3 9 3 n4 58
我們從一因子變異數分析得到結論:至少有兩個 處理平均數不同,我們經常需要知道哪幾個處理 平均數造成這些差異性。 我們將會提出三種方法來決定哪些母體平均數是 不同的: Fisher的最小顯著差異法 Bonferroni 校正 Tukey的多重比較方法
第12章 變異數分析 第370頁
12.26
s1 386 . 55 , s 2 469 . 44 , s 3 4 7 1 . 82 , s 4 444 . 79
2 2 2 2
因此,誤差平方和為:
S S E ( n1 1) s1 ( n 2 1) s 2 ( n 3 1) s 3 ( n 4 1) s 4
12.23
檢查必要的條件
變異數分析的F- 檢定要求隨機變數是具有相等 變異數的常態分配。只要對每一個樣本繪製直方 圖,就可以容易地用圖形檢查常態性的條件。 變異數的同質性可由列印樣本標準差或變異數檢 視之。樣本變異數的相似性讓我們能夠假設母體 變異數是相等的。
第12章 變異數分析 第365頁
12.24
9 3 (5 1 .1 4 5 0 .1 8 ) 5 8 (5 1 .8 4 5 0 .1 8 ) 3, 7 3 8 .8
2
SST = 3,738.8這個值是不是夠大去指出母體平均數 不同?
第12章 變異數分析 第359頁
12.15
範例12.1 股票投資佔總資產 計算 的比例
我們計算樣本變異數如下:
2 2 2 2
(8 4 1)(3 8 6 .5 5 ) (1 3 1 1)( 4 6 9 .4 4 ) (9 3 1) ( 4 7 1 .8 2 ) (5 8 1)( 4 4 4 .7 9 ) 1 6 1, 8 7 1 .3
我們需要檢定統計量來證明SST和SSE的相關性。