抽样调查抽样设计课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

調查的步驟
步驟一:決定母體 步驟二:設計問卷
問卷的問項(明確陳述要估量的變數)
步驟三:建立抽樣底冊 步驟四:抽樣設計並決定樣本數 步驟五:建立樣本名冊 步驟六:進行調查 步驟七:整理資料 步驟八:分析資料
樣本的選擇
有名冊的母體
市長選舉
沒有名冊的母體
來華旅客 故宮滿意度調查 戶政滿意度調查
調查的方式
拒絕 H0,即樣本結構與母體結構一致。
母體與樣本一致性檢定(續)
其他類別資料也可用此法,檢定樣本結構 與母體結構是否相同。 年齡結構及教育程度則須先轉換成類別變 數,才可用此法檢定。 樣本結構與母體結構一致,是問卷調查時, 樣本資料分析結果,可推論到母體的必要 前提。
生活中的辛苦阻挠不了我对生活的热 爱。20.11.1720.11.17Tuesday, November 17, 2020 人生得意须尽欢,莫使金樽空对月。02:07:1002:07: 1002:0711/17/2020 2:07:10 AM 做一枚螺丝钉,那里需要那里上。20. 11.1702 :07:10 02:07N ov-201 7-Nov-2 0 日复一日的努力只为成就美好的明天 。02:07:1002: 07:1002:07Tuesday, November 17, 2020 安全放在第一位,防微杜渐。20.11.1720.11.1702:07:1002: 07:10November 17, 2020 加强自身建设,增强个人的休养。2020年11月17日 上午2时 7分20.11.1720.11.17 精益求精,追求卓越,因为相信而伟 大。2020年11月17日 星期二 上午2时 7分10秒02:07:1020.11.17 让自己更加强大,更加专业,这才能 让自己 更好。2020年11月上 午2时7分20.11.1702:07Nove mber 17, 2020 这些年的努力就为了得到相应的回报 。2020年11月17日星 期二2时 7分10秒02:07:1017 November 2020 科学,你是国力的灵魂;同时又是社 会发展 的标志 。上午2时7分10秒上 午2时7分02:07:1020.11.17 每天都是美好的一天,新的一天开启 。20.11.1720.11.1702: 0702:07:1002: 07:10Nov-20 相信命运,让自己成长,慢慢的长大 。2020年11月17日星 期二2时 7分10秒Tues day, November 17, 2020 爱情,亲情,友情,让人无法割舍。20.11.172020年 11月17日星期 二2时7分10秒 20.11.17
定義調查對象與範圍
從母體中選出的部分個體,我們據以獲 取資料,稱為樣本(Sample)。 選擇樣本的方法稱為樣本設計。
母體的種類
推論母體:理論上的母體。 目標母體:依調查研究的目的訂定有明 確的涵蓋範圍。 底冊母體:調查時建立的名冊。 調查母體:底冊母體中可以也願意被調 查的部分。
市長選舉調查
推論母體:理論上的母體。
誤差
分為抽樣誤差及非抽樣誤差。 抽樣誤差:選取部分樣本造成對母體推估的誤 差,可透過提高樣本數來降低抽樣誤差。 非抽樣誤差:抽樣誤差以外的所有誤差,與樣 本數的大小沒有直接的關係。包括:拒訪或遺 漏值、測量不準、資料處理錯誤等所造成的誤 差。一般多需在調查過程中,透過嚴謹的管理 來降低非抽樣誤差。
谢谢大家!
台北市的選民。
目標母體:訂定有明確的涵蓋範圍。
12月投票時,有投票權的選民(20歲以上)。
底冊母體:調查時建立的名冊。
台北市各區公所建立的選民名冊。
調查母體:可以也願意被調查的部分。
願意接受(電話)訪問的選民。
戶政調查
推論母體:理論上的母體。 目標母體:訂定有明確的涵蓋範圍。 底冊母體:調查時建立的名冊。 調查母體:可以也願意被調查的部分。
抽樣誤差與樣本數
信賴區間的長度的一半稱為抽樣誤差,記 為m,也稱為誤差容忍度。即
樣本變異數
mz
n
樣本變異數
信賴度為95%時,m 1.96

n
樣本變異數
信賴度為99%時,m 2.575
n

數量參數估計所需的樣本數
m z 樣本變異數 ( m )2 樣本變異數
n
z
n
當樣本數為 n ( z* )2 樣本變異數 時,
戶政調查(一)-電訪或郵寄問卷
推論母體:理論上的母體。
戶政事務所轄區所有居民。
目標母體:訂定有明確的涵蓋範圍。
11月初,戶籍在本區、準備遷入或經辦與本所有 關業務的人。
底冊母體:調查時建立的名冊。
11月初,戶政事務所建有名冊的人。
調查母體:可以也願意被調查的部分。
電訪:本區有電話的居民。 郵寄:住在戶籍地的居民。
多階段集群抽樣實例
全國性家戶調查
步驟一:將美國分成2007地理區域,稱為主 要樣本單位(Primary Sampling Units, PSUs)。 選出754 PSUs,包括428人口最多 PSUs其餘 隨機選出的。 步驟二:選出的每個PSU分為若干小區,各 小區依種族等分層,選出分層樣本(小區)。 步驟三:選出的小區中依各戶相近程度每四 戶成一集群(Cluster)。隨機選出集群調查。
樣本與母體
任何母體的一部分都可稱為樣本。抽樣 的目的就是要以少量的樣本來代表母體。 樣本代表性的評估
樣本數與樣本結構。
樣本代表性-樣本數
樣本數越多代 表性越高的機 會高,但管理 也越困難,產 生非抽樣誤差 的機會也越高。
樣本代表性-樣本結構
基本結構:性別、年齡、居住地等。 與調查相關的結構:
選舉時的黨派傾向結構 環保議題之民意調查時需考量樣本的教育程 度、社經地位(收入、職業等)等結構。
系統抽樣
可視為是一階段集群抽樣的特例。以相 同間隔的樣本組成群,隨機選取一群。 容易操作,但間隔選取不好時會造成嚴 重的系統偏差。 多搭配其他抽樣方法使用,如分層系統 抽樣。
系統隨機樣本範例
系統隨機樣本(systematic random sample): 預計抽出n = 250 的樣本,母體的總數為 N=5000。令 N/n = k = 20,1~20中隨機 選出一數 a,則{a, a+k, a+2k, …, a+(n1)k}為一組樣本數為 n 的系統隨機樣本。
Hale Waihona Puke Baidu
分層樣本(Stratified sample)
分層樣本的選取
步驟一:將母體
步驟二:每層各取一個SRS,全部合起來 就是分層樣本。
歌曲著作權使用費的分配
美國作曲家組織(ASCAP)每年向廣播電 台收取播曲權利金$ 435百萬(每年播放53 百萬小時歌曲),將分配給作曲家會員。
將所有電台依社區種類(都會區、鄉村等) 、 地區(新英格蘭、太平洋等)及付出權利金額 度(反應電台聽眾數)等特性分成432層。
m
參數估計值之信賴區間的誤差容忍度接近 給定值 m。
比例參數估計所需的樣本數
當樣本數為 n ( z* )2 p*(1 p*) 時, p
m
之估計值信賴區間的誤差容忍度接近給定 值 m。其中p*為樣本比率的猜測值。
猜測值 p* = 0.5時,實際誤差容忍度不大 於給定值 m。
95%信賴水準,抽樣誤差3%,樣本數為1067。
每層隨機選幾台隨機錄音數小時,共錄音 60,000小時。由專家辨認所有歌曲的作曲作 詞者,記錄後依比例分配權利金。
集群抽樣
先將母體分群,視之為抽樣單位,抽樣 時只抽出部分群來。群內所有樣本都調 查時稱為一階段集群抽樣;群內在抽部 分樣本來調查時稱為二階段集群抽樣。 使用時機:母體底冊的限制不得已。 多搭配分層抽樣,以分層後各層再進行 二階段集群抽樣。
分層隨機抽樣
將母體中每一個體,依有特別興趣,或是有接 近性質為標準,分為若干個子母體,稱為層 (stratum)。在每一層分別隨機抽取部份子樣本, 再整合成一個樣本。 使用的原因與時機:
抽樣管理方便; 不同層內調查設計可以不一樣; 需要對子母體做較精確的估計; 比其他抽樣方法可得到較精確的母體估計。
母體與樣本結構一致性檢定
抽樣樣本結構與母體結構是否相同。
性別結構,男女比例50.5%,49.5%, k=2,
1067個樣本中,男生 530個,女生537個,

(530106750.5%)2 (537106749.5%)2 106750.5% 106749.5%
0.292654
P值為 P(X20.292654)0.5885 , 無法
戶政調查(二)-戶政所洽公
推論母體:理論上的母體。
戶政事務所轄區所有需要戶政所服務的居民。
目標母體:訂定有明確的涵蓋範圍。
11月初,所有來戶政所洽公的人。
底冊母體:調查時建立的名冊。
沒有名冊。
調查母體:可以也願意被調查的部分。
11月初,所有來戶政所洽公也願意填問卷的人。
抽樣與普查
所有的樣本都調查稱為普查。 只調查部分樣本稱為抽樣調查。 調查資料所計算出來的統計量,都存在 著誤差。
這些抽樣方法多不足以代表母體。
戶政調查的抽樣設計
母體的特質
抽樣方法
戶政調查的抽樣設計
母體的特質
個人自辦、公司代辦;日間、夜間;
抽樣方法
分層系統隨機抽樣。
信賴區間
母體參數多以樣本平均值估計之,估計值 的信賴區間可寫成,
估計值 z 樣本變異數 n
信賴度為95%時,z = 1.96。 信賴度為99%時,z = 2.575。
每一個個體被選到的機會一樣。 但每一組樣本數為 n 的樣本未必有相同的 機會被選到。
自願樣本與立意選樣
自願樣本:主動對議題表達意見。
如Call-in,網頁問卷調查等。自願樣本多數 表達較強烈意見,因此多有偏差。
立意選樣:依調查的方便主觀選取樣本。
如街頭訪問,賣場問卷調查等。因主觀選 取的地點與方法而有不同程度的偏差意見。
派員面訪
訪員問及填答、受訪者自行填答。
郵寄問卷調查 電話訪問調查
傳統電話訪問、電腦輔助電話訪問(CATI)
網路問卷調查
網頁問卷調查、電子郵件(E-mail)問卷調查
抽樣方法
簡單隨機抽樣 分層隨機抽樣 集群抽樣 系統抽樣
簡單隨機抽樣
抽樣原理:調查母體中每一個樣本被抽 到的機會一樣。 應用時機:1.母體小;2.名冊完整;3.訪 問成本不受樣本地點的影響;4.除了名 冊沒有其他的資訊。 限制與困難:
實驗性研究(Experimental study)。
對每一個體給予特定的處理(treatment), 再觀察並量測有興趣的變數的反應值。 隨機比較性實驗。
抽樣調查的用途
民意調查
選舉民意、公共議題民意、施政滿意度調查
市場調查
產品行銷、潛在顧客
研究調查
農業災害調查、網路行為調查
母體的界定
調查中欲推論的所有範圍或是想收集的 資料所有可能的對象或單位,所構成的 集合稱為母體(Population) 。
簡單隨機樣本的選取
步驟1:編號,母體中每一個體給一號。 步驟2:查表,使用隨機亂數表選號。
30個母體中選五個。步驟1 :列冊編號 步驟2:查表:隨機亂數表某行資料為
• 69051 64817 87174 09517 84534 06489 87201 97245 • 前10組 2位數為 69 05 16 48 17 87 17 40 95 17 • 00, 31~99略去,選 05, 16, 17, 17, 17,17重複繼續 • 再10組 2位數為 84 53 40 64 89 87 20 19 72 45 • 補選 20, 19,最後選出05, 16, 17, 20, 19。
抽樣調查
動機
從(少量的)樣本推估母體的特徵。 選取可以深入觀察母體的樣本,以儘可 能不干擾母體的情況下取得資訊。
觀察性研究。 實驗性研究。
觀察對實驗
觀察性研究 (Observational study)。
對每一個體僅做觀察並量測有興趣的變數, 並不試圖影響反應值。 抽樣調查(sample survey)。
抽樣或普查?
小母體時採用普查。 大母體或具破壞性檢驗時採用抽樣。
燈泡壽命
大母體的普查要注意調查步驟的管理。
國內大型定期普查
工商及服務業普查。
民國80、85、90年,每5年做一次普查。
農林漁牧業普查。
西元1990、2000年,每10年做一次普查,每 5年做一次抽樣調查。
戶口及住宅普查。
西元1990、2000年,每10年做一次普查,每 5年做一次抽樣調查。
相关文档
最新文档