分层随机抽样的步骤

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ch 12
點估計與抽樣分配
本章大綱

抽樣的概念
抽樣的專有名詞 抽樣的原則 影響樣本推論的因素 選擇樣本的目標
抽樣的類型

隨機 / 機率抽樣設計 非隨機 / 非機率抽樣設計

混合抽樣設計
抽樣的概念

優點:節省時間、財力、及人力資源。
缺點:只能估計或預測,有誤差的存在。
抽樣的專有名詞
0.0
μ
當樣本數遞增下的抽樣分配
n=5
0.25 0.20 P(x)
0.15 0.10
0.05 0.00 P(x)
X
Large n
0.4 0.3 0.2 0.1 0.0 X
-
n = 20
0.20

P(x)
0.10
0.00
X
中央極限定理

中央極限定理說明樣本平均 X 的抽樣分配會 接近常態分配,無論樣本來自的母體是何種 分配。 此定理讓我們有能力產生樣本平均可能存在 區域的機率陳述,同時計算 X 與它所估計的 母體平均離多遠的機率。
抽樣的原則:原則三

所欲研究的母群體變項其差異越大,則樣本統計量與 母群體平均數間的差異越大。 例:A=18,B=26,C=32,D=40。(樣本大小=3)
樣本 樣本平均數(1) 母群體平均數(2) (樣本統計量) (母數)
ABC ABD ACD 25.33 28.0 30.0 29.0 29.0 29.0
AB
AC AD BC BD CD
(1)與(2) 間的差
-2.5
-1.5 0.0 0.0 +1.0 +2.5
19.0
20.5 21.5 21.5 22.5 24.0
21.5
21.5 21.5 21.5 21.5 21.5
抽樣的原則:原則二

樣本的大小越大,則所估計的母群體母數便越正確。 例:A=18,B=20,C=23,D=25。(樣本大小=3)

(1)與(2) 間的差
-3.67 -1.0 +1.0
BCD

32.67
29.0
+3.67
A=18,B=20,C=23,D=25,(1)與(2)間的差在-0.83到+1.17。 A=18,B=26,C=32,D=40,(1)與(2)間的差在-3.67到+3.67。
影響樣本推論的因素

樣本大小﹔

中央極限定理的效果:各種不同母體 與各種不同樣本數之 X 的分配
常態 均勻 右偏 不規則
母體
n=2
n = 30

X

X

X

X
中央極限定理的三個面向

如果樣本數夠大, X 的抽樣分配是常態 的。
X X

的期望值等於μ。 的標準差等於
/ n

抽樣的類型
抽樣的型態 隨機/機率抽樣 非隨機/機率抽樣 混合抽樣
步驟六 從亂數表中抽選所需數量的抽樣單位。
隨機 / 機率抽樣設計的種類

簡單隨機抽樣(Simple random sampling)
分層隨機抽樣(Stratified random sampling)
抽樣母群體變異的範圍。
選擇樣本的目標

選擇樣本的目標:

一定的樣本大小,增加估計的精確性﹔ 樣本選擇時能避免偏誤。

樣本選擇時可能發生偏誤的情形:

以非隨機的方法抽樣﹔ 抽樣架構未正確且完整的涵蓋所有抽樣母體﹔ 抽樣母群體的某一部分無法掌握。
歷史故事
樣本 樣本從整個母體 隨機選出 好的抽樣 過程

中央極限定理

從一個平均μ與標準差σ的母體抽樣。如果樣 ຫໍສະໝຸດ Baidu數持續增加,樣本平均的抽樣分配會接近 一個有著平均等於μ跟標準差 等於的常態 / n 分配。

對夠大的樣本數n
x ~ N(, 2 / n )
常態分配母體不同樣本數之樣本 平均的抽樣分配
0.4 抽樣分配: n =16 0.3 f(X ) 0.2 0.1 抽樣分配: n = 2 常態母體 抽樣分配: n = 4
簡單隨機 抽樣
分層比例 抽樣 分層非比 例抽樣
分層隨機 抽樣
叢集抽樣
定額抽樣 立意抽樣
系統抽樣
單一階段
偶遇抽樣 雙階段 多階段 滾雪球抽樣
隨機 / 機率抽樣設計

隨機/機率樣本須符合下列兩要件:

相等:被抽取的機率相同﹔ 獨立:不受其他因素影響。

隨機/機率樣本主要的優點:

可代表抽樣的母群體﹔ 可作為機率理論統計的資料。
樣本 樣本平均數(1) 母群體平均數(2) (樣本統計量) (母數)
ABC ABD 20.67 21.00 21.5 21.5
(1)與(2) 間的差
-0.83 -0.5
ACD
BCD

22.00
22.67
21.5
21.5
+0.5
+1.17
樣本大小=2,樣本統計量與母數間的差在-2.5到+2.5。

樣本大小=3,樣本統計量與母數間的差在-0.83到+1.17。

母群體(Population)或研究母群體(Study population)
樣本 (Sample) 樣本大小 (Sample size) 抽樣設計或策略 (Sampling design or strategy) 抽樣單位 (Sampling unit) 抽樣架構 (Sampling frame) 樣本的統計量 (Sample statistics)
母體
有電話且(或)有汽車且 (或)為該雜誌讀者的人
偏差 樣本
民主黨
共和黨
母體
抽樣分配

固定母體並且固定樣本數的條件下,統計量 的抽樣分配 (sampling distribution) 是該統計量 所有可能值的機率分配。 樣本數固定在 n ,而且每一個樣本元素都來 自某個固定的母體, X 的抽樣分配是隨機變數 X 所有可能值的機率分配。

母數 (Population parameters)
抽樣的原則:原則一

在樣本的統計量與母群體的真實母數間通常都有差異 存在,而其主要的原因是由於樣本中所選擇的個體不 同所造成。

例:A=18,B=20,C=23,D=25。(樣本大小=2)
樣本 樣本平均數(1) 母群體平均數(2) (樣本統計量) (母數)
抽選隨機樣本的方法

抽選隨機樣本的方法

籤筒﹔ 電腦程式抽樣﹔ 亂數表抽樣。

抽選隨機樣本的不同系統

不置回抽樣﹔ 置回抽樣。
亂數表抽樣程序
步驟一 確認母群體中所有抽樣單位的數量。 步驟二 將每一個抽樣單位予以編號,從1號開始。 步驟三 隨機選一個行與列的交會點為起始點。 步驟四 從亂數表中隨機選相同位數的數字。 步驟五 決定樣本大小。
相关文档
最新文档