简单相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
14.1.2 相關係數的意義(續)
母體相關係數
X X E X Y Y Y
XY
XY XY
其中μX,σX為隨機變數X的平均數與標準差; μY,σY為隨機變數Y的平均數與標準差; σXY為隨機變數X與Y之共變異數。
14.1 簡單相關分析(續)
相關分析(correlation analysis) 探討數值變數間線性關係的程度與方向的方法,共 變異數(covariance)與相關係數是用來瞭解兩變數間 線性關係的工具。 如果變數間無法區分出所謂的依變數(dependent variable)與自變數(或獨立變數)(independent variable) 時,則使用相關分析來探討變數間的線性關係;如 果變數是可以區分的話,則使用線性迴歸分析來探 討變數間的線性關係。
本章架構
14.1 14.2 14.3 14.4 14.5 14.6 14.7 簡單相關分析 簡單線性迴歸分析 簡單線性迴歸方程式的估計—最小平方法 迴歸方程式的適合度 迴歸方程式的檢定 利用估計線性迴歸方程式進行預測 殘差分析
14.1 簡單相關分析
14.1.1 14.1.2 14.1.3 14.1.4 共變異數的意義 相關係數的意義 相關係數的估計 相關係數的檢定
14.1.2 相關係數的意義(續1)
若X與Y為成對資料則母體相關係數可表為 1 N X i X Yi Y N i 1 XY N 1 N 1 2 2 X Y i X N i Y N i 1 i 1
14.1.2 相關係數的意義(續2)
14.1.1 共變異數的意義
共變異數(covariance) 測量兩個數值變數間的線性關係。 線性關係 當一個變數變動時,另一變數則呈同方向或相反方 向變動。
14.1.1共變異數的意義(續)
母體共變異數
XY Cov( X , Y )
樣本共變異數
S XY
X
i 1
相關係數應用實例一 歐亞股市與美股連動性
計算至2003/3/24 資料來Fra Baidu bibliotek:Bloomberg 整理:怡富投顧
相關係數應用實例二
我國在漸邁入高齡化社會的同時, 整體社會每年平均花在醫 療保健上的費用, 將益為提高。由此可看出 : 年齡是影響 個人每年花在醫療保健費用多寡的原因之一。 個人每年花在醫療保健費用和個人總財富累積這兩個因素, 同時受年齡的影響,才使得醫療保健費用和個人總財富累積 兩個變數間間接地具高度線性相關,而其實醫療保健費用和 個人總財富累積兩個變數間並不具有因果關係。但是,如果 醫療保健費用和總財富累積兩個變數, 都去除掉年齡的影響 後, 將發現這兩個因素呈低度線性相關。也就是說, 去除 掉年齡的影響後, 醫療保健費用和總財富累積的偏相關係數 變得很接近 0。“只要常看病, 口袋裏的孫中山就會愈多” 的奇怪推論, 在去除幕後的藏鏡人—年齡之後, 自可迎刃而 解。 (資料來源︰易得太資訊(統計桃花源) )
第十四章 簡單相關分析與簡單線性迴歸分析
學習目標
1. 2. 3. 4. 5. 6. 7. 8. 瞭解簡單相關分析的意義。 使用相關分析的時機。 瞭解共變異數的計算與意義。 瞭解相關係數的計算與檢定程序。 瞭解簡單迴歸分析的意義。 學習估計與檢定迴歸係數。 利用估計的迴歸方程式作預測。 檢定迴歸方程式的適合性。
N
i
X Yi Y N
其中N代表母體總數。
X
n i 1
i
X Yi Y n 1
其中n代表樣本數。
14.1.1共變異數的意義(續1)
共變異數的性質
1. 共變異數的值介於-到之間。 2. X與Y的共變異數大於零,表示X與Y同方向變動。
3. X與Y的共變異數小於零,表示X與Y反方向變動。
i 1
n
i
X )(Yi Y ) n 1
775 / 10 1 866.11
14.1.2 相關係數的意義
相關係數(correlation coefficient)乃是指皮爾生相關 係數(Pearson correlation coefficient) ,其用途在於 測量兩個數值變數間的線性關係。 當兩變數有相關存在,並不代表兩者一定存在因果 關係,但是當相關程度高的時候,彼此的預測能力 也高。
相關係數的性質: 1. 相關係數的值介於 –1 與 1 之間。 2. 當ρXY=1,表示X與Y為完全正相關,亦即當X變 動時, Y亦以相同方向變動;反之,亦然。 3. 當ρXY= –1 ,表示X與Y為完全負相關,亦即當 X變動時, Y亦以相反方向來變動;反之,亦然。 4. 當ρXY= 0 ,代表X與Y完全沒有線性關係,不過 並不代表兩者之間沒有其他型態關係(如拋物線 關係)存在。
4. X與Y的共變異數等於零,表示兩變數間沒有「線 性」關係,但並不表示兩者之間沒有其他關係存在。
14.1.1共變異數的意義(續3)
當兩變數與的共變異數大於零時,可以看出與大部 分落於第一與第三象限,也就是兩者移動的方向是 一致的,亦即正的線性關係。 (如圖14.1之左上圖) 當兩變數與的共變異數小於零時,可以看出與大部 分落於第二與第四象限,也就是兩者移動的方向是 相反的,亦即負的線性關係。(如圖14.1之右上圖) 當兩變數與的共變異數等於零時,可以看出與均勻 落於所有四個象限,而看不出兩者間線性移動的關 係,但卻可能存在其他非線性關係。 (如圖14.1之下 方二圖)
14.1.1共變異數的意義(續2)
圖14.1:不同共變異數值情況下X與Y的散佈圖
例14.1 停留時間與消費額的關係
某遊樂區經理想了解遊客停留時間與消費額的關係,於是蒐 集了10位遊客的資料如表14.1 表14.1 10位遊客的停留時間與消費額
續例14.1
由表14.1可知
S XY
(X