统计的资料分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(a) 左 尾 檢 定 P值 P(Xx)
P(tx0)
S/ n P(tt0) 其 中
t0x S /n 0 當 P值 值 時 , 表 H 0 顯 著 。
40
(b) 右 尾 檢 定 P值 P(Xx)
P(tx0)
S/ n P(tt0) 其 中
t0x S /n0 當 P值 值 時 , 表 H0 顯 著 。
41
(c) 雙 尾 檢 定
P值P(|X0||x0|) P(t| || x0|)
S/ n P(t| |t0)
其 中
t0
| x0|
S/ n
當P值 值 時 , 表 H0 顯 著 。
42
檢定力
• 若某公司生產飲料目標值為250cc , 已知每罐飲料的標準差2cc,
• (1) 公司欲偷工減料 每罐容量減為249.8cc, 標準差不變, 請問若由生產線抽樣100罐, 會被發覺偷工減料的機率?
37
2 .
t n(x0)
S
F

(x S2
0)2
/n
38
甲、左尾檢定
當x0 且F2 F1,n1,2時,表 H0 顯著。
乙、右尾檢定
當x0 且F2 F1,n1,2時,表 H0 顯著。
(c) 雙尾檢定 當F2 F1,n1,時,表 H0 顯著。
39
(ii) P值
43
• (2) 公司欲偷工減料 每罐容量減為249.5cc,標準差不變, 請問若由生產線抽樣100罐, 會被發覺偷工減料的機率?
• (3) 公司欲偷工減料 每罐容量減為249cc,標準差不變, 請問若由生產線抽樣100罐, 會被發覺偷工減料的機率?
44
檢 定H 0: 250 H 1: 250
162
47
2
2
44
179
64
1
3
45
164
55
2
3
46
157
51
2
3
47
160
56
2
1
48
170
70
1
3
49
168
63
1
3
50
182
78
1
3
9
• 每行為一個變數(Variable), 共有4個變數
• 而每一列為一筆資料(Case), 共有50列,即有50筆資料
10
•樣本數 •平均數 •變異數 •相關係數
P(Z .171)6 2/ 100
P(Z0.85) 80.85
46
公司偷工減料 每罐容量減為 249.5
由 生 產 線 抽 樣 100罐 , 會 被 發 覺 偷 工 減 料 的 機 率 為
P(X24.697|1 624.5)9
P(X24.59 24.697 1264.5)9 2/ 100 2/ 100
2 Z 2 ( x 0 ) 2 2
n
Z ( x 0 ) 2
n
33
(1) 左尾檢定
對立假設 H1:0
當x0且2
2 1,2
時,或zz
,H 表0
顯著。
(b) 右尾檢定
當x0且2 12,2時,或zz ,H 表0 顯著。
© 雙尾檢定
統計資料分析
陳順宇 教授 成功大學統計系
1
1. 統計目的:
• (1) 讓數字說話 • (2) 提供決策
2
(1) 資 料
資 訊 決 策
數 字 統 計 量 、 圖 表 因 果 關 係 、 預 測 、 計 劃
雜 亂 無 章 簡 化 、 有 意 義
3
統計是一門科學
• 收集資料 • 整理資料 • 分析資料 • 解釋意義 • 等規則與程序所組合而成。
5/ 100 5 因
t2.4t9,90 . 51.66
所 以 H0 是 顯 著 的 , 即 此 懷 疑 是 正 確 的 。
56
現在讓我們來討論t值的 單位不變量
我們知道1公斤=2.54磅,所以檢定
H0 :432.54 H1 :432.54
而t 值為
t x0
S/ n
44.22.54432.54101.22.54101.22.4
Const.B0 ¶t ½è §t ¶q Estimate -30.1353 0.490805 Odds ratio (u8n.i1t 7cEh)-14 1.633631 Odds ratio (range) 87.03632
31
一組樣本檢定
• 虛無假設
H0:0
32
(1) 已知
( i) 可 用 統 計 量
24
P=甲食品(成功)的機率
p exp0(1x) 1exp0(1x)
25
ln p 1p
0
1x
26
1.1
0.9
0.7
ゑ ㄒp
0.50.30.1来自-0.1a非 xb
27
z ln p 1 p
28
z01x
29
­¹ «~ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
53
• 若人懷疑現在國中生的體重比10年前重 • 已知10年前的平均體重是43公斤, • 而抽樣100位得樣本平均體重 公斤,標
準差 公斤, • 請問在 下是否有證據說此懷疑是正確的?
54
此懷疑假設寫成檢定
H 0 : 4 3 H 0 : 4 3
55
t值 為
tx0
S/ n 4.424310 1.22.4
52.54/ 100
52.54
5
不論體重單位是公斤或是磅,t 值是相同的,
所以t 值為單位不變量。
57
2. 兩組獨立樣本t檢定
t x1 x2 S12 S22 n1 n2
欲檢定全國成年男人(約600萬 人)的平均身高是否為170公分?
H 0 : 17
H 1 : 1 7
51
(1)抽樣64位樣本平均數公分,得 樣本標準差 公分,試問 是否顯著?
算出t檢定統計量為 t 6417.50170 6 8.50.67 6
因t0.67t63,.0251.999, 2所以 H0 不顯著。即沒有證據說全國 成年男人的平均身高不是170公分。
14
5.統計精神:
• (1) 以小搏大(抽樣) • (2) 亂中取勝(迴歸式) • (3) 精簡原則(統計量)
15
6.統計資料取得:
• (1) 隨機性 (抽樣方法,包括受訪者、問 卷設計題目) (2) 效度 • (測出想要的能力、問出與主題相符問題) • (3) 信度 (穩健性、非亂答)
16
• 一份測驗或問卷都可看成是隨機取樣測 量的結果,由這些測驗或問卷的回答, 來推估受測者的人格、成就、心理等能 力或反應,是否真能測量到編製問卷或 測驗所要測量的能力?
52
(2) 若抽樣640位,與(1)有相同樣本平 均數與標準差,試問是否顯著?
t 64107.5 0170 6
18 0.5100.67 2.12 6
因 t2.12 t63,0 .92 51.64, 7所 2以 H 0 顯 著 , 即 有 證 據 說 全 國 成 年 男 人 的 平 均 身 高 不 是 170公 分 。
P(Zz0)
其 中
1(z0)
z0 x /n0
當 P值 值 時 , 表 H0 顯 著 。
36
©雙 尾 檢 定
P值 P(|X0||x0|) P(|Z|| x0|) / n
P(|Z|z0)
2(z0)
其 中
z0|x /n0| 當P值 值 時 , 表 H0顯 著 。
P(Z.671 ) 6 2/ 100
P(Z3.35) 80.9998 48
樣本數與檢定統計量的關係
• 1. 一組樣本t檢定 • 2. 兩組獨立樣本t檢定 • 3. 兩組相關樣本t檢定 • 4. k組比例檢定
49
1. 一組樣本t檢定
•即t值與樣本數n開方成正比
t n(x0)
S
50
統計量
11
• 3.最有用的統計量:平均數、標準差、相 關係數
• 4.最有用的圖:直方圖、長條圖、散佈圖 (看長像)
12
依資料性質分類
• a.連續型資料: 如量測身高、體重、產品之容量、 重量、長度等資料,它是可以計量的, 而且理論上可以到小數點以下幾位數據。 這種資料稱為連續型資料
13
• b.離散型資料: 性別、宗教信仰、教育程度等 分類變數是"離散型資料"
¶t ½è §t ¶q
1
60.1
1
60.5
1
58.6
1
57.6
1
62.7
1
60.8
1
60
1
60.1
1
59.6
1
62.6
2
64.3
2
63.8
2
64.1
2
56
2
60.6
2
65.1
2
62.8
2
61.2
2
63.7
2
62.6
30
Model: Logistic regression (logit) N of 0's:10 1's: Dep. var: ­¹ «~ Loss: Max likelihood Final loss: 11.487543338 Chi?1)=4.7508 p=.029
P(Z.171 ) 6 2/ 100
P(Z0.85) 80.85
47
公司偷工減料 每罐容量減為249
由 生 產 線 抽 樣 100罐 , 會 被 發 覺 偷 工 減 料 的 機 率 為
P(X24.697|1 624.0)9
P(X24.09 24.697 1264.0)9 2/ 100 2/ 100
• 受測者的成績(或分數)是否 真能代表其能力?
17
7.資料分析:
• (1) 效度(效標效度) • (2) 信度(α值) • (3) 要因分析
18
(3) 要因分析
• (a) ANOVA (各組平均數是否相等,是否有交互作用)
• (b) 迴歸分析 • (c) 區別分析 • (d) 卡方檢定(列聯表)
棄 卻 域 為

x 2 5 1 .6 042 5 100
x 2.6 47 916
45
公司偷工減料 每罐容量減為249.8
(1) 由 生 產 線 抽 樣100罐 , 會 被 發 覺 偷 工 減 料 的 機 率 為
P(X24.6971|624.89)
P(X24.8924.6971264.89) 2/ 100 2/ 100
yyrSSxy xx
22
(c) 區別分析
• 區別分析是探討變數間的因果關係, • “因”是計量的連續型資料 • “果"是分類的離散型資料
23
(c1)羅吉斯迴歸
y1 eexx p 0p 0 ((1 x1 1x 1 pp 1 x1p xp 1 )1)
19
170
20
152
21
168
22
164
體重
性別
教育程度
66
1
1
49
2
1
72
1
1
68
2
1
63
1
1
64
1
1
61
2
1
52
2
1
55
2
1
65
1
1
61
1
2
73
1
2
57
2
2
49
2
2
60
1
2
67
1
2
48
2
2
70
1
2
69
2
2
47
2
2
64
1
3
60
2
3
8
23
157
47
2
3
24
160
56
2
3
25
170
66
1
3
26
168
19
(a). ANOVA(F檢定)
• 三種食品比較 • 研究甲、乙、丙三種食品的
鈣質含量是否有顯著差異? • 隨機各找10個產品測量鈣質含量 • 資料如下
20
(b) 迴歸分析
• 迴歸分析是探討變數間的因果關係, • "因"、"果"兩者都是計量的連續型資料
21
只要算出此兩變數的平均數、標 準差與相關係數就可求得迴歸線
56
64
11
76
71
64
64
66
12
79
83
68
64
72
13
69
67
64
66
68
14
64
59
66
56
67
15
70
70
75
69
76
7
編號
身高
1
173
2
155
3
175
4
171
5
166
6
167
7
163
8
155
9
159
10
168
11
166
12
169
13
159
14
154
15
160
16
175
17
153
18
175
4
• 矩陣
2.資料型式:
5
6
國文 英文 統計 會計 經濟
編號 X1
X2
X3
X4
X5
1
83
76
79
71
76
2
65
59
71
61
69
3
85
82
80
69
74
4
81
78
67
72
69
5
76
73
65
60
67
6
77
74
68
55
70
7
73
71
78
71
75
8
65
62
68
61
67
9
69
65
58
57
67
10
78
75
57
60
1
3
27
171
66
1
3
28
158
55
2
3
29
155
48
2
3
30
164
58
1
3
31
163
46
2
2
32
160
50
2
3
33
178
72
1
3
34
168
63
1
3
35
172
73
1
3
36
160
47
2
2
37
158
45
2
2
38
173
60
1
3
39
175
相关文档
最新文档