Ch3相关与变异数分析.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
若Xij為屬量的連續變數,則該式即為迴歸 分析模型,將在下一章介紹。
若Yi為屬質變數,則變為logistic regression or probit or logit model,本課程將會介紹 logistic regression model
Ch.3相關與變異數分析
多變量分析—管理上的應用
16
Ch.3相關與變異數分析
多變量分析—管理上的應用
4
變數之間的關係
在社會科學的研究中第一步通常是要找出人、 事、物之間的相關方向及程度
進一步則是找出變數之間的「因果關係」 將變數分為兩類:自變數和應變數 下面關係函數,x為自變數,y為應變數
y f ( xi )
自變數的個數與內涵也是決定研究方法的因素, 多變量探討的就是多個自變數與多個應變數的 關係
Ch.3相關與變異數分析
多變量分析—管理上的應用
3
變數的內涵
屬量變數
▪ 當一個變數可以量化、計算,而且其值的大 小可以做有意義的比較時,則稱為屬量變數
屬質變數
▪ 當一個變數的內容是屬於敘述性的(如:快 樂/憂鬱、男/女),則即使我們可以將其 量化,這些量化之後的數值不但在邏輯上不 能運算,其大小的比較也沒有意義,這種變 數即稱為屬質變數
多變量分析—管理上的應用
24
結果解讀
假設有A、B二個因子,其處理數分別為a、b,每一種處 理只抽取1個樣本時(此即為二因子未重複試驗的情況), 其資料結構如下:
Ch.3相關與變異數分析
多變量分析—管理上的應用
25
ANOVA表
Ch.3相關與變異數分析
多變量分析—管理上的應用
26
實例與應用3-2
Ch.3相關與變異數分析
多變量分析—管理上的應用
34
變異數Case- One-Way ANOVA對話框
Ch.3相關與變異數分析
多變量分析—管理上的應用
35
One-Way ANOVA: Options子對話框
Ch.3相關與變異數分析
多變量分析—管理上的應用
36
One-Way ANOVA: Post Hoc Multiple Comparisons子對話框
▪ 提示:變異數分析雖以變異數為分析對象,但主要檢 定的是各分群間的平均數是否相等。
Ch.3相關與變異數分析
多變量分析—管理上的應用
13
應用時機
▪ 如果我們分析研究所學生「多變量分析」成績 與其大學背景(理、工、法、商)是否有關?
▪ 我們會依照學生背景來分組 (理、工、法、 商),分別計算各組同學多變量分析成績的組 內變異、組間變異與總變異,以檢定不同背景 的學生,其成績的平均值是否相等。
Ch.3相關與變異數分析
多變量分析—管理上的應用
5
變數的內涵會影響到分析方法的選擇
Ch.3相關與變異數分析
多變量分析—管理上的應用
6
Ch.3相關與變異數分析
多變量分析—管理上的應用
7
相關分析(1)
應用時機
▪ 相關分析主要是用於判定多個變數之間是否有 線性關係,以及這種關係的方向和程度,特別 適用於變數皆為屬量變數的情況
多變量分析—管理上的應用
9
相關分析(2)
結果解讀
▪ 相關係數可以告訴我們兩件事:(1)相關的方向; (2)相關的程度
▪ 相關分析只能判定兩變數間是否有「線性相關 性」、「相關的程度和方向」,但不能判定變 數之間是否有「因果關係」和「非線性關係」
▪ 相關係數的數值介於-1~1之間
• 若r=1,則x,y變數為完全符合正比的直線相關 • 若r=0,則x,y變數完全無線性關係 • 若r=-1,則x,y變數為完全符合反比的直線相關
Ch.3相關與變異數分析
多變量分析—管理上的應用
10
實例與應用3-1-根據相關係數解釋結果
相關係數矩陣(correlation matrix)
Ch.3相關與變異數分析
多變量分析—管理上的應用
11
如果我們把實例3.1中的會計成績以「等級」 來評分,分為A,B,C,D四等,雖然可以換成 1,2,3,4,不過仍然是屬質的內涵
F test
ANOVA
Ch.3相關與變異數分析
多變量分析—管理上的應用
27
多重比較檢定的原理(補充,林震岩,智勝)
當變異數分析F值達顯著水準,表示至少有兩組平 均數之間有顯著差異存在,還必須檢定到底哪幾 組平均數之間有顯著不同,故須進行多重比較檢 定(multiple comparison test,或稱Post Hoc檢定) 來檢驗。
Ch.3相關與變異數分析
多變量分析—管理上的應用
8
統計模型:係以相關係數來表示
令x,y 分別為兩個隨機變數
母體相關係數
xy
Covx,
x y
y
樣本相關係數r
n i1
xi x
yi
y
n 1
sxy
n
2
n
2 sxsy
xi x
yi y
i 1
i 1
n 1
n 1
Ch.3相關與變異數分析
明道大學管理學院碩士班
多變量分析
授課教授 葉純志 助理教授
Ch.3相關與變異數分析
多變量分析—管理上的應用
1
相關與變異數分析
2
前言
我們常會探討:
▪ 消費者收入vs.刷卡金額 ▪ 經濟成長率vs.失業率 ▪ 大學生經濟 vs.統計、會計成績
均在探討二個或以上「變數」之間的關係
本章我們以兩個變數之間的關係為例,說 明相關分析與變異數分析的適用狀況以及 分析結果所能夠呈現的資料
▪ 利用隨機集區設計(randomized block design) 的方法,在每個集區中隨機抽取k個樣本,再將 這些樣本隨機指定到k個處理中,再進行每組樣 本數為1的二因子變異數分析,可大幅縮減樣本 數。這樣的作法一般稱為一因子集區變異數分 析,基本上也等同於二因子未重複試驗變異數 分析
Ch.3相關與變異數分析
C
1
1 3(k 1)
k i1
1 ni 1
N
1
k
B
1 C
( N
k) ln
Sˆ 2
k i 1
(ni
1) ln
Sˆi2
if : B 2,k1, reject H 0
Ch.3相關與變異數分析
多變量分析—管理上的應用
22
二因子變異數分析(1)
應用時機Leabharlann Baidu
▪ 當我們想研究二個自變數和一個應變數的關係 時,就必須要利用二因子變異數分析,才能得 知其個別影響和交互作用
30
變數資料轉換,Transform/Create Time Series
選lag,order選一期, 則可以產生t-1期的 未分配盈餘資料
Ch.3相關與變異數分析
多變量分析—管理上的應用
31
新產生的變數
Ch.3相關與變異數分析
多變量分析—管理上的應用
32
相關分析:Analyze/Correlate/Bivariate 將要分析的變數移到右側variables欄
多重比較檢定也稱為事後比較檢定(posteriori comparisons test)。
多重比較檢定多運用差距檢定法(Studentized Range Test,或稱全距檢定)原理。
差距檢定法比T檢定要求的兩組平均數差異更大, 才能達到顯著差異。
Ch.3相關與變異數分析
多變量分析—管理上的應用
變異數分析數學模式之固定效果與隨機效果
固定效果模式:在上式中,若βj是未知常 數,則此變異數分析模式為固定效果模式。 固定效果模式是指在因子中的處理或集區, 在重新進行實驗時,不會有所改變
隨機效果模式:如果βj是隨機變數,則此 變異數分析模式為隨機效果模式;隨機效 應模式,是指在重複實驗時,每一次處理 的組合都可能不相同
28
多重比較的檢定方法(補充,林震岩,智勝)
理論上,整體效果有顯著差異,則多重比較檢定應至少有 一組的平均數會達到顯著差異。
但事實上,可能會發生整體檢定達顯著差異,但多重比較 檢定卻發現沒有任何的兩組間平均數達顯著差異。
以LSD(Least Studentized Range)法最為常見的檢定法。 還有底下常見方法:
因此當變數中有一個變數為屬質變數時, 相關分析就不再適合。
Ch.3相關與變異數分析
多變量分析—管理上的應用
12
變異數分析原理(1)
探討用來分類或分群的屬質變數(在變異數分析 中稱為「因子」)和一個屬量變數之間的關係時, 常常會運用變異數分析方法
變異數分析的定義
▪ 變異數分析(Analysis of Variance,簡稱ANOVA)是將屬 量樣本資料的變異,依其可能來源拆解(例如,組內 變異和組間變異),並檢定因子中各類或群(通常稱 為「處理」)的平均數是否相等,以判斷因子和母體 屬量變數之間的關係
多變量分析—管理上的應用
23
統計模型
Yij i j ij i 1, ,a; j 1, ,b
▪ 上式中,假設在A因子中有a種處理,則i表示第 i種處理;而在B因子中有b種處理,則j表示第j 種處理
▪ 檢定假設: HA:α1=α2=…=αk=0以及HB:
β1=β2=…=βk=0
Ch.3相關與變異數分析
Ch.3相關與變異數分析
多變量分析—管理上的應用
18
統計模型
單因子變異數分析依各組樣本數相等與否, 在計算上有些差異,不過這裡介紹樣本數 不相等的方法。
Yij i ij i ij
i 1, , k; j 1, , ni
Ch.3相關與變異數分析
多變量分析—管理上的應用
19
固定效果、單因子變異數分析的假設前提
▪ Tukey的HSD法 ▪ Newman-Keuls(N-K)法 ▪ 雪費法(Scheff法):指發展出一種以F檢定為基礎,
適用於n不相等的多重比較檢定技術。 ▪ 杜納法(Dunnett)
Ch.3相關與變異數分析
多變量分析—管理上的應用
29
Case by SPSS
Ch.3相關與變異數分析
多變量分析—管理上的應用
Ch.3相關與變異數分析
多變量分析—管理上的應用
17
單因子變異數分析(1)
應用時機
▪ 單因子變異數分析是要判定某一個應變 數是否和另一個含有k種處理的自變數相 關
▪ 若相關,則k組之平均會不相等;反之則 不相關
▪ 亦適用於k組具有相同變異數的常態分配 平均數的比較,或是經由完全隨機實驗 設計(completely randomized design) 試驗所得觀測值的分析
εij相互獨立、為常態分配、平均數為0、 且有相同的變異數,εij ~N(0, σ2)
Yij相互獨立、為常態分配、平均數為μi、 且各分群之變異數相等,Yij ~N(μi, σ2)
檢定H0:μ1=μ2=…=μk=μ,或H0:
α1=α2=…=αk=0
Ch.3相關與變異數分析
多變量分析—管理上的應用
20
.814**
1
.819**
Sig. (2-tailed)
.000
.000
N
46
46
46
營業收入淨額
Pearson Correlation
.968**
.819**
1
Sig. (2-tailed)
.000
.000
N
47
46
47
**. Correlation is significant at the 0.01 level (2-tailed).
Ch.3相關與變異數分析
多變量分析—管理上的應用
33
Correlatio ns
本期稅後淨利
LAGS(未分
本期稅後淨利 配盈餘,1) 營業收入淨額
Pearson Correlation
1
.814**
.968**
Sig. (2-tailed)
.000
.000
N
47
46
47
LAGS(未分配盈餘,1) Pearson Correlation
Yi 1 X i1 2 X i2 j X ij i
Ch.3相關與變異數分析
多變量分析—管理上的應用
15
變異數分析的數學模式內涵
Yi為隨機變數,Xij為屬質的分類變數(通 常以0,1)時,該數學式為變異數分析模型,而 自變數Xij的個數即為因子數。該式亦可視 為迴歸分析的特例-虛擬變數迴歸
結果解讀
總變異SST=組間變異SSB+組內變異SSE
▪ 單因子變異數分析表
Ch.3相關與變異數分析
多變量分析—管理上的應用
21
結果解讀
變異數是否相等之檢定:ANOVA基本假設之 一各分群之母體變異數相等。
•Bartlett test:由k組分群母體隨機抽取ni個樣本,總
樣本數,計算各組樣本變異數及總樣本變異數
在Equal Variances Assumed(假設相同的變 異數)框中,共有14種選項。
▪ 若相等,表是多變量分析成績和背景無關,反 之表二者有關。
Ch.3相關與變異數分析
多變量分析—管理上的應用
14
變異數分析原理(2)
因子 (某類型處理或集區的集合)- 集區 和處理
▪ 觀察因子相當於「集區」,是不能加以控制或 隨意給定的
▪ 實驗因子相當於「處理」,是我們能夠加以控 制或指派的
變異數分析的數學模式
若Yi為屬質變數,則變為logistic regression or probit or logit model,本課程將會介紹 logistic regression model
Ch.3相關與變異數分析
多變量分析—管理上的應用
16
Ch.3相關與變異數分析
多變量分析—管理上的應用
4
變數之間的關係
在社會科學的研究中第一步通常是要找出人、 事、物之間的相關方向及程度
進一步則是找出變數之間的「因果關係」 將變數分為兩類:自變數和應變數 下面關係函數,x為自變數,y為應變數
y f ( xi )
自變數的個數與內涵也是決定研究方法的因素, 多變量探討的就是多個自變數與多個應變數的 關係
Ch.3相關與變異數分析
多變量分析—管理上的應用
3
變數的內涵
屬量變數
▪ 當一個變數可以量化、計算,而且其值的大 小可以做有意義的比較時,則稱為屬量變數
屬質變數
▪ 當一個變數的內容是屬於敘述性的(如:快 樂/憂鬱、男/女),則即使我們可以將其 量化,這些量化之後的數值不但在邏輯上不 能運算,其大小的比較也沒有意義,這種變 數即稱為屬質變數
多變量分析—管理上的應用
24
結果解讀
假設有A、B二個因子,其處理數分別為a、b,每一種處 理只抽取1個樣本時(此即為二因子未重複試驗的情況), 其資料結構如下:
Ch.3相關與變異數分析
多變量分析—管理上的應用
25
ANOVA表
Ch.3相關與變異數分析
多變量分析—管理上的應用
26
實例與應用3-2
Ch.3相關與變異數分析
多變量分析—管理上的應用
34
變異數Case- One-Way ANOVA對話框
Ch.3相關與變異數分析
多變量分析—管理上的應用
35
One-Way ANOVA: Options子對話框
Ch.3相關與變異數分析
多變量分析—管理上的應用
36
One-Way ANOVA: Post Hoc Multiple Comparisons子對話框
▪ 提示:變異數分析雖以變異數為分析對象,但主要檢 定的是各分群間的平均數是否相等。
Ch.3相關與變異數分析
多變量分析—管理上的應用
13
應用時機
▪ 如果我們分析研究所學生「多變量分析」成績 與其大學背景(理、工、法、商)是否有關?
▪ 我們會依照學生背景來分組 (理、工、法、 商),分別計算各組同學多變量分析成績的組 內變異、組間變異與總變異,以檢定不同背景 的學生,其成績的平均值是否相等。
Ch.3相關與變異數分析
多變量分析—管理上的應用
5
變數的內涵會影響到分析方法的選擇
Ch.3相關與變異數分析
多變量分析—管理上的應用
6
Ch.3相關與變異數分析
多變量分析—管理上的應用
7
相關分析(1)
應用時機
▪ 相關分析主要是用於判定多個變數之間是否有 線性關係,以及這種關係的方向和程度,特別 適用於變數皆為屬量變數的情況
多變量分析—管理上的應用
9
相關分析(2)
結果解讀
▪ 相關係數可以告訴我們兩件事:(1)相關的方向; (2)相關的程度
▪ 相關分析只能判定兩變數間是否有「線性相關 性」、「相關的程度和方向」,但不能判定變 數之間是否有「因果關係」和「非線性關係」
▪ 相關係數的數值介於-1~1之間
• 若r=1,則x,y變數為完全符合正比的直線相關 • 若r=0,則x,y變數完全無線性關係 • 若r=-1,則x,y變數為完全符合反比的直線相關
Ch.3相關與變異數分析
多變量分析—管理上的應用
10
實例與應用3-1-根據相關係數解釋結果
相關係數矩陣(correlation matrix)
Ch.3相關與變異數分析
多變量分析—管理上的應用
11
如果我們把實例3.1中的會計成績以「等級」 來評分,分為A,B,C,D四等,雖然可以換成 1,2,3,4,不過仍然是屬質的內涵
F test
ANOVA
Ch.3相關與變異數分析
多變量分析—管理上的應用
27
多重比較檢定的原理(補充,林震岩,智勝)
當變異數分析F值達顯著水準,表示至少有兩組平 均數之間有顯著差異存在,還必須檢定到底哪幾 組平均數之間有顯著不同,故須進行多重比較檢 定(multiple comparison test,或稱Post Hoc檢定) 來檢驗。
Ch.3相關與變異數分析
多變量分析—管理上的應用
8
統計模型:係以相關係數來表示
令x,y 分別為兩個隨機變數
母體相關係數
xy
Covx,
x y
y
樣本相關係數r
n i1
xi x
yi
y
n 1
sxy
n
2
n
2 sxsy
xi x
yi y
i 1
i 1
n 1
n 1
Ch.3相關與變異數分析
明道大學管理學院碩士班
多變量分析
授課教授 葉純志 助理教授
Ch.3相關與變異數分析
多變量分析—管理上的應用
1
相關與變異數分析
2
前言
我們常會探討:
▪ 消費者收入vs.刷卡金額 ▪ 經濟成長率vs.失業率 ▪ 大學生經濟 vs.統計、會計成績
均在探討二個或以上「變數」之間的關係
本章我們以兩個變數之間的關係為例,說 明相關分析與變異數分析的適用狀況以及 分析結果所能夠呈現的資料
▪ 利用隨機集區設計(randomized block design) 的方法,在每個集區中隨機抽取k個樣本,再將 這些樣本隨機指定到k個處理中,再進行每組樣 本數為1的二因子變異數分析,可大幅縮減樣本 數。這樣的作法一般稱為一因子集區變異數分 析,基本上也等同於二因子未重複試驗變異數 分析
Ch.3相關與變異數分析
C
1
1 3(k 1)
k i1
1 ni 1
N
1
k
B
1 C
( N
k) ln
Sˆ 2
k i 1
(ni
1) ln
Sˆi2
if : B 2,k1, reject H 0
Ch.3相關與變異數分析
多變量分析—管理上的應用
22
二因子變異數分析(1)
應用時機Leabharlann Baidu
▪ 當我們想研究二個自變數和一個應變數的關係 時,就必須要利用二因子變異數分析,才能得 知其個別影響和交互作用
30
變數資料轉換,Transform/Create Time Series
選lag,order選一期, 則可以產生t-1期的 未分配盈餘資料
Ch.3相關與變異數分析
多變量分析—管理上的應用
31
新產生的變數
Ch.3相關與變異數分析
多變量分析—管理上的應用
32
相關分析:Analyze/Correlate/Bivariate 將要分析的變數移到右側variables欄
多重比較檢定也稱為事後比較檢定(posteriori comparisons test)。
多重比較檢定多運用差距檢定法(Studentized Range Test,或稱全距檢定)原理。
差距檢定法比T檢定要求的兩組平均數差異更大, 才能達到顯著差異。
Ch.3相關與變異數分析
多變量分析—管理上的應用
變異數分析數學模式之固定效果與隨機效果
固定效果模式:在上式中,若βj是未知常 數,則此變異數分析模式為固定效果模式。 固定效果模式是指在因子中的處理或集區, 在重新進行實驗時,不會有所改變
隨機效果模式:如果βj是隨機變數,則此 變異數分析模式為隨機效果模式;隨機效 應模式,是指在重複實驗時,每一次處理 的組合都可能不相同
28
多重比較的檢定方法(補充,林震岩,智勝)
理論上,整體效果有顯著差異,則多重比較檢定應至少有 一組的平均數會達到顯著差異。
但事實上,可能會發生整體檢定達顯著差異,但多重比較 檢定卻發現沒有任何的兩組間平均數達顯著差異。
以LSD(Least Studentized Range)法最為常見的檢定法。 還有底下常見方法:
因此當變數中有一個變數為屬質變數時, 相關分析就不再適合。
Ch.3相關與變異數分析
多變量分析—管理上的應用
12
變異數分析原理(1)
探討用來分類或分群的屬質變數(在變異數分析 中稱為「因子」)和一個屬量變數之間的關係時, 常常會運用變異數分析方法
變異數分析的定義
▪ 變異數分析(Analysis of Variance,簡稱ANOVA)是將屬 量樣本資料的變異,依其可能來源拆解(例如,組內 變異和組間變異),並檢定因子中各類或群(通常稱 為「處理」)的平均數是否相等,以判斷因子和母體 屬量變數之間的關係
多變量分析—管理上的應用
23
統計模型
Yij i j ij i 1, ,a; j 1, ,b
▪ 上式中,假設在A因子中有a種處理,則i表示第 i種處理;而在B因子中有b種處理,則j表示第j 種處理
▪ 檢定假設: HA:α1=α2=…=αk=0以及HB:
β1=β2=…=βk=0
Ch.3相關與變異數分析
Ch.3相關與變異數分析
多變量分析—管理上的應用
18
統計模型
單因子變異數分析依各組樣本數相等與否, 在計算上有些差異,不過這裡介紹樣本數 不相等的方法。
Yij i ij i ij
i 1, , k; j 1, , ni
Ch.3相關與變異數分析
多變量分析—管理上的應用
19
固定效果、單因子變異數分析的假設前提
▪ Tukey的HSD法 ▪ Newman-Keuls(N-K)法 ▪ 雪費法(Scheff法):指發展出一種以F檢定為基礎,
適用於n不相等的多重比較檢定技術。 ▪ 杜納法(Dunnett)
Ch.3相關與變異數分析
多變量分析—管理上的應用
29
Case by SPSS
Ch.3相關與變異數分析
多變量分析—管理上的應用
Ch.3相關與變異數分析
多變量分析—管理上的應用
17
單因子變異數分析(1)
應用時機
▪ 單因子變異數分析是要判定某一個應變 數是否和另一個含有k種處理的自變數相 關
▪ 若相關,則k組之平均會不相等;反之則 不相關
▪ 亦適用於k組具有相同變異數的常態分配 平均數的比較,或是經由完全隨機實驗 設計(completely randomized design) 試驗所得觀測值的分析
εij相互獨立、為常態分配、平均數為0、 且有相同的變異數,εij ~N(0, σ2)
Yij相互獨立、為常態分配、平均數為μi、 且各分群之變異數相等,Yij ~N(μi, σ2)
檢定H0:μ1=μ2=…=μk=μ,或H0:
α1=α2=…=αk=0
Ch.3相關與變異數分析
多變量分析—管理上的應用
20
.814**
1
.819**
Sig. (2-tailed)
.000
.000
N
46
46
46
營業收入淨額
Pearson Correlation
.968**
.819**
1
Sig. (2-tailed)
.000
.000
N
47
46
47
**. Correlation is significant at the 0.01 level (2-tailed).
Ch.3相關與變異數分析
多變量分析—管理上的應用
33
Correlatio ns
本期稅後淨利
LAGS(未分
本期稅後淨利 配盈餘,1) 營業收入淨額
Pearson Correlation
1
.814**
.968**
Sig. (2-tailed)
.000
.000
N
47
46
47
LAGS(未分配盈餘,1) Pearson Correlation
Yi 1 X i1 2 X i2 j X ij i
Ch.3相關與變異數分析
多變量分析—管理上的應用
15
變異數分析的數學模式內涵
Yi為隨機變數,Xij為屬質的分類變數(通 常以0,1)時,該數學式為變異數分析模型,而 自變數Xij的個數即為因子數。該式亦可視 為迴歸分析的特例-虛擬變數迴歸
結果解讀
總變異SST=組間變異SSB+組內變異SSE
▪ 單因子變異數分析表
Ch.3相關與變異數分析
多變量分析—管理上的應用
21
結果解讀
變異數是否相等之檢定:ANOVA基本假設之 一各分群之母體變異數相等。
•Bartlett test:由k組分群母體隨機抽取ni個樣本,總
樣本數,計算各組樣本變異數及總樣本變異數
在Equal Variances Assumed(假設相同的變 異數)框中,共有14種選項。
▪ 若相等,表是多變量分析成績和背景無關,反 之表二者有關。
Ch.3相關與變異數分析
多變量分析—管理上的應用
14
變異數分析原理(2)
因子 (某類型處理或集區的集合)- 集區 和處理
▪ 觀察因子相當於「集區」,是不能加以控制或 隨意給定的
▪ 實驗因子相當於「處理」,是我們能夠加以控 制或指派的
變異數分析的數學模式