第三章资料的测度与描述-统计学

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
k
k
1
(,+)
至少0
2
2.5 3
( 2, + 2 )
至少75%
( 2.5, + 2.5) 至少84% ( 3 , + 3 ) 至少88.9%
3-40
• 二、經驗法則(empirical rule) • 設資料近似單峰對稱分配,則 • 1. 在平均數左右1個標準差之範圍內的觀 測值約佔68%。 • 2. 在平均數左右2個標準差之範圍內的觀 測值約佔95%。 • 3. 在平均數左右3個標準差之範圍內的觀 測值約佔99.7 %。 • 將謝比雪夫定理,經驗法則與實際結果整 理如下表:
• 相對離勢量數中最常用的變異係數 (coefficient of variation,C.V.)是指標準 差與平均數的比值,
3-30
即 C.V. =
S

100%……母體資料
= X 100%……樣本資料
相對離勢量數的主要功用: 1.比較幾組資料單位不同的差異情形。 2.比較幾組資料單位相同,但平均數相差懸殊之差 異情形。
N
總變異數
=
2
N 1 1 N 1 ( 1 )
2Fra Baidu bibliotek
2
N
+
N 22 2 N 2 ( 1 )
2
2
N
3-26
(4)推廣至k組母體、樣本資料,求合併後之平均數、變異數。
總母體平均數 =
N11 N k k N
k
,N = N1 + …… + Nk
2
總母體變異數 2 =
i 1
N
2

(X
i 1
N
i
A)
2
N
N
3-24
• (3) 若甲、乙二組母體資料的變異數、平均 數及大小如下表,則合併後之平均數、變 異數為何?
• 表3-16
組 別 甲 乙 大 小 N1 N2 平均數 變異數
1
2
1 2

2 2
3-25
則 總平均數 = N 1 1 N 2 2 ,N = N + N 1 2
n
=

n
Xi
2
X i i 1
n
2
i 1
n
0
n 1
3-23
變異數性質:
(1) 設X的母體變異數為
2 X
,平均數為X,
若Y = aX + b,a,b R,則 Y = aX + b,
Y = a2
2
2 X
,Y = |a|X
(2) ( X i )
次數fi
f1 f2
組中點mi
m1 m2
fimi
f1m1 f2m2
Lk~Uk
合 計
fk
mk
k
fkmk
i 1

i 1
k
fi
fimi
3-6
• (1) 母體平均數: =
i 1
fimi N
k
k
,N =
i 1
f。 i
k
• (2) 樣本平均數:
X
=
i 1
fimi n
,n =
3-11
• • • • •
四、眾數(mode):通常以M0表示。 (三) 眾數的求法 A. 未分組資料 B. 已分組資料 普通求眾數的方法大致有:
3-12
• 1. 視察法
• 2. King’s插補法(W.I. King’s method)
• 3. Czuber’s比例法(Czuber’s proportional method) • 4. Perason’s經驗法(K. Pearson’s method)
3-3
3-1 集中趨勢量數
用來描述該組資料的中心位置所在或集中的程度,謂之集 中趨勢量勢,又稱中心位置量數(measure of central location)。 一、平均數(mean)
(一)算術平均數 • A. 未分組資料: • 1. • 2. 母體資料:母體平均數 樣本資料:樣本平均數 X 、Y 等。
1
k =
N
i 1
(X i ) fi
4
N

X
N 4 i
4
= =
i 1
fi 4 X
i 1
N
3 i
fi 6 X i fi 3N
2 2 i 1
N
4
N
4
4
4
3-36
• 1. k > 3,表示資料分布呈高狹峰(lepto kurtosis)。 • 2. k = 3,表示資料分布呈常態峰 (normal kurtosis)。 • 3. k < 3,表示資料分布呈低潤峰(platy kurtosis)。
3-4
(二)加權算術平均數:
• 母體加權算術平均數
w
N = w1 X 1 w N X =
i 1
wi X wi
N
N
i
w1 w 2 w N
i 1
樣本加權算術平均數
X w=
i 1
wi X wi
n
n
i
i 1
3-5
• B. 已分組資料:
組界
L1~U1 L2~U2
3-37
圖37 峰度不同的次數分配
3-38
3-4 平均數與標準差的應用
• 一、謝比雪夫定理(Chebyshev’s Theorem)
• 任何一組資料中,會落在平均數左右各k個 標準差之範圍內的觀測值至少佔有
1 1 2 100%,k > k
1。
3-39
表3-21 在區間內至少佔有 1 ( k, + k )內 (1 2 )100%
i 1
[ N i i N i ( i ) ]
2
X
N
nk X n
k
總樣本平均數 =
n1 X
1
,n = n1 + n2 + …… + nk
X) ]
2
總樣本變異數S 2 =

k
[( n i 1) S i n i ( X
2
i
i 1
n 1
3-27
(5)
2 4 Q.D. ≒ ; A.D. ≒ ; R 4 3 5 Q.D. A.D. R
3-33
圖36 資料的分配形狀
3-34
偏態係數的計算方法有很多,一般較常用者有二種: 1.Bowley公式:Bowley偏態係數,其公式如下:
SKB =
(Q 3 M e ) ( M (Q 3 M e ) ( M
e e
Q1 ) Q1 )
=
(Q 3 M e ) ( M Q 3 Q1
n 1
=
2 n X i X i i 1 i 1
n n
2
n ( n 1)
標準差就是變異數的平方根,通常 以(或S)表示。
3-22
母體標準差 =
i 1
(X i ) N
N
2

=
2
N
X i N
2
2
i 1
N
0
樣本標準差 S =
i 1
(X i X ) n 1
3-8
• 2. Me =
• B. 已分組資料
n
• Me = Li + 2
F i 1 fi
h
三、其他分位數:
• 四分位數(Quartiles,Qi,i = 1, 2, 3 ) • 十分位數(Deciles,Di,i = 1, 2, ‥〃, 9) • 百分位數(Percentiles,Pi,i = 1, 2, ‥〃, 99) 。
3-31
3-3 形狀(Shape)
• 反映資料的分佈形狀: 偏態係數及峰度係數。
• 一、偏態係數(coefficient of skewness,SK) • 所謂偏態(skewness)是指次數分配形態不對 稱的偏斜的方向和程度。用以測度偏態的量數, 稱之為偏態係數,通常以SK表示。
3-32
• 若SK = 0,表示資料呈對稱分配。 • 若SK > 0,表示資料呈右偏或正偏(right or positively skewed)分配。 • 若SK < 0,表示資料呈左偏或負偏(left or negatively skewed)分配。
3-28
B.
已分組資料
2=

k
(mi ) fi
2

=
i 1
k
2 mi
fi
i 1
N
2
mi fi i 1
k 2
N
S2=
i 1
(m i X ) f i
2
k
n 1
=
i 1
mi fi
2
k
n
n 1
3-29
• (二) 相對離勢量數(measure of relative disperson)
e
Q1 )
2.Pearson公式:Pearson偏態係數,其公式如下: SKP = =
M
X M S
0
0
3( )
=

……母體資料
3 ( X M e ) ……樣本資料 = S
3-35
※二、峰度係數(coefficient of kurtosis) 測量峰度高低的量數稱為峰度係數,通常以k表示。
统计学
3-1
第三章
■ 3-1 ■ 3-2 ■ 3-3 ■ 3-4 ■ 3-5 ■ 3-6 ■ 3-7
資料的測度與描述
集中趨勢量數 離勢量數 形狀 平均數與標準差的應用 枝葉圖及箱形圖 電腦範例 流程圖
3-2
透過各種蒐集方法的資料經過整理後,還 需進一步描述一群數量資料的特性,其方 法大致有:
1. 2. 3. 集中趨勢量數(measured of central tendency)。 離勢量數(measured of dispersion)。 形狀(shape)。
• 當次數分配為單峰對稱時,則 X = Me = M0
• 當次數分配為單峰微偏時,則 3( X Me)或M0 - 3( X Me)
X
M0
3-13
圖33 單峰對稱分配
3-14
圖34 單峰微偏分配
3-15
• ※五、全距中點(midrange)與中樞紐 (midhinge) • (一) 全距中點(midrange) • (二) 中樞紐(midhinge) • 六、截尾平均數與溫塞平均數 • 1. 截尾平均數 • 2. 溫塞平均數
3-9
• • • •
A. 未分組資料 B. 已分組資料 Me、Qj、Dj及Pj之關係 1. 表3-13
名 稱 中位數 四分位數 十分位數 百分位數 分割點 1個 3個 9個 99個 分位數值 Me Q1,Q2,Q3 D1, …, D9 P1, …, P99
3-10
• 2. (1) Me = Q2 = D5 = P50 (2) Q1 = P25,Q3 = P75 (3) D1 = P10 ; D2 = P20 ‥〃 D9 = P90
其中N表全部資料的個數,a表落在( - , + )之間的個數,b表落在 ( - 2, + 2 )之間的個數,c表落在( - 3, + 3 )之間的個數。
4 10
5 10
10 10
15 10
16 10
10 10
10 10
12 0
3-18
• 二、種類
• 離勢量數:(一) 絕對離勢量數(measure of absolute dispersion)
絕對離勢量數:全距、 相對離勢量數:變異係 四分位差、變異數、標 數 準差。
3-19
• • • •
1. 全距(range,R) 2. 四分位差(quartile deviation,Q.D.) 3. 平均偏差(average deviation,A.D.) 4. 變異數與標準差(variance and standard deviation)
3-41
表3-22
( k )內 ( , + ) ( 2, + 2) 謝比雪夫定理 經驗法則
a N b N
k
實際結果 100 % 100 %
1 2
至少為0 至少為75%
約68 % 約95 %
3
( 3, + 3)
至少為88.9 %
約99.7 %
c N
100 %
i 1
f。 i
k
3-7
二、中位數(median):通常以Me(或)表示。
• A. 未分組資料
其步驟如下:
• 1. 由小到大順序排列,X(1) X(2) … X(n)。
n X n , 不為整數 2 1 2 X X n n 1 n 2 2 , 為整數 2 2
3-20
• A. 未分組資料
母體變異數 2 =
i 1
(X i ) N
N
2
=
i 1
Xi N
N
2
2
3-21
樣本變異數 S 2 = i 1
(X i X ) n 1
n
2
X
n
=
n i 1
i 1
2 i
nX
2
n 1
2
=
i 1
Xi
2
n
( X i ) n
3-16
3-2 離勢量數
• 離勢(dispersion),又稱為離差(derivation)或 差異量數。
• 一、意義
• 離勢是用來衡量資料的集中或分散程度,亦就是 測量各個觀測值之間的差異變化情形。 • 如表3-15。
3-17
組別
資 料
平均數 中位數
全距

10
0
10
20
30
10
10
40
乙 丙
相关文档
最新文档