抽样调查抽样设计课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
調查的步驟
步驟一:決定母體 步驟二:設計問卷
問卷的問項(明確陳述要估量的變數)
步驟三:建立抽樣底冊 步驟四:抽樣設計並決定樣本數 步驟五:建立樣本名冊 步驟六:進行調查 步驟七:整理資料 步驟八:分析資料
樣本的選擇
有名冊的母體
市長選舉
沒有名冊的母體
來華旅客 故宮滿意度調查 戶政滿意度調查
調查的方式
拒絕 H0,即樣本結構與母體結構一致。
母體與樣本一致性檢定(續)
其他類別資料也可用此法,檢定樣本結構 與母體結構是否相同。 年齡結構及教育程度則須先轉換成類別變 數,才可用此法檢定。 樣本結構與母體結構一致,是問卷調查時, 樣本資料分析結果,可推論到母體的必要 前提。
生活中的辛苦阻挠不了我对生活的热 爱。20.11.1720.11.17Tuesday, November 17, 2020 人生得意须尽欢,莫使金樽空对月。02:07:1002:07: 1002:0711/17/2020 2:07:10 AM 做一枚螺丝钉,那里需要那里上。20. 11.1702 :07:10 02:07N ov-201 7-Nov-2 0 日复一日的努力只为成就美好的明天 。02:07:1002: 07:1002:07Tuesday, November 17, 2020 安全放在第一位,防微杜渐。20.11.1720.11.1702:07:1002: 07:10November 17, 2020 加强自身建设,增强个人的休养。2020年11月17日 上午2时 7分20.11.1720.11.17 精益求精,追求卓越,因为相信而伟 大。2020年11月17日 星期二 上午2时 7分10秒02:07:1020.11.17 让自己更加强大,更加专业,这才能 让自己 更好。2020年11月上 午2时7分20.11.1702:07Nove mber 17, 2020 这些年的努力就为了得到相应的回报 。2020年11月17日星 期二2时 7分10秒02:07:1017 November 2020 科学,你是国力的灵魂;同时又是社 会发展 的标志 。上午2时7分10秒上 午2时7分02:07:1020.11.17 每天都是美好的一天,新的一天开启 。20.11.1720.11.1702: 0702:07:1002: 07:10Nov-20 相信命运,让自己成长,慢慢的长大 。2020年11月17日星 期二2时 7分10秒Tues day, November 17, 2020 爱情,亲情,友情,让人无法割舍。20.11.172020年 11月17日星期 二2时7分10秒 20.11.17
定義調查對象與範圍
從母體中選出的部分個體,我們據以獲 取資料,稱為樣本(Sample)。 選擇樣本的方法稱為樣本設計。
母體的種類
推論母體:理論上的母體。 目標母體:依調查研究的目的訂定有明 確的涵蓋範圍。 底冊母體:調查時建立的名冊。 調查母體:底冊母體中可以也願意被調 查的部分。
市長選舉調查
推論母體:理論上的母體。
誤差
分為抽樣誤差及非抽樣誤差。 抽樣誤差:選取部分樣本造成對母體推估的誤 差,可透過提高樣本數來降低抽樣誤差。 非抽樣誤差:抽樣誤差以外的所有誤差,與樣 本數的大小沒有直接的關係。包括:拒訪或遺 漏值、測量不準、資料處理錯誤等所造成的誤 差。一般多需在調查過程中,透過嚴謹的管理 來降低非抽樣誤差。
谢谢大家!
台北市的選民。
目標母體:訂定有明確的涵蓋範圍。
12月投票時,有投票權的選民(20歲以上)。
底冊母體:調查時建立的名冊。
台北市各區公所建立的選民名冊。
調查母體:可以也願意被調查的部分。
願意接受(電話)訪問的選民。
戶政調查
推論母體:理論上的母體。 目標母體:訂定有明確的涵蓋範圍。 底冊母體:調查時建立的名冊。 調查母體:可以也願意被調查的部分。
抽樣誤差與樣本數
信賴區間的長度的一半稱為抽樣誤差,記 為m,也稱為誤差容忍度。即
樣本變異數
mz
n
樣本變異數
信賴度為95%時,m 1.96
。
n
樣本變異數
信賴度為99%時,m 2.575
n
。
數量參數估計所需的樣本數
m z 樣本變異數 ( m )2 樣本變異數
n
z
n
當樣本數為 n ( z* )2 樣本變異數 時,
戶政調查(一)-電訪或郵寄問卷
推論母體:理論上的母體。
戶政事務所轄區所有居民。
目標母體:訂定有明確的涵蓋範圍。
11月初,戶籍在本區、準備遷入或經辦與本所有 關業務的人。
底冊母體:調查時建立的名冊。
11月初,戶政事務所建有名冊的人。
調查母體:可以也願意被調查的部分。
電訪:本區有電話的居民。 郵寄:住在戶籍地的居民。
多階段集群抽樣實例
全國性家戶調查
步驟一:將美國分成2007地理區域,稱為主 要樣本單位(Primary Sampling Units, PSUs)。 選出754 PSUs,包括428人口最多 PSUs其餘 隨機選出的。 步驟二:選出的每個PSU分為若干小區,各 小區依種族等分層,選出分層樣本(小區)。 步驟三:選出的小區中依各戶相近程度每四 戶成一集群(Cluster)。隨機選出集群調查。
樣本與母體
任何母體的一部分都可稱為樣本。抽樣 的目的就是要以少量的樣本來代表母體。 樣本代表性的評估
樣本數與樣本結構。
樣本代表性-樣本數
樣本數越多代 表性越高的機 會高,但管理 也越困難,產 生非抽樣誤差 的機會也越高。
樣本代表性-樣本結構
基本結構:性別、年齡、居住地等。 與調查相關的結構:
選舉時的黨派傾向結構 環保議題之民意調查時需考量樣本的教育程 度、社經地位(收入、職業等)等結構。
系統抽樣
可視為是一階段集群抽樣的特例。以相 同間隔的樣本組成群,隨機選取一群。 容易操作,但間隔選取不好時會造成嚴 重的系統偏差。 多搭配其他抽樣方法使用,如分層系統 抽樣。
系統隨機樣本範例
系統隨機樣本(systematic random sample): 預計抽出n = 250 的樣本,母體的總數為 N=5000。令 N/n = k = 20,1~20中隨機 選出一數 a,則{a, a+k, a+2k, …, a+(n1)k}為一組樣本數為 n 的系統隨機樣本。
Hale Waihona Puke Baidu
分層樣本(Stratified sample)
分層樣本的選取
步驟一:將母體
步驟二:每層各取一個SRS,全部合起來 就是分層樣本。
歌曲著作權使用費的分配
美國作曲家組織(ASCAP)每年向廣播電 台收取播曲權利金$ 435百萬(每年播放53 百萬小時歌曲),將分配給作曲家會員。
將所有電台依社區種類(都會區、鄉村等) 、 地區(新英格蘭、太平洋等)及付出權利金額 度(反應電台聽眾數)等特性分成432層。
m
參數估計值之信賴區間的誤差容忍度接近 給定值 m。
比例參數估計所需的樣本數
當樣本數為 n ( z* )2 p*(1 p*) 時, p
m
之估計值信賴區間的誤差容忍度接近給定 值 m。其中p*為樣本比率的猜測值。
猜測值 p* = 0.5時,實際誤差容忍度不大 於給定值 m。
95%信賴水準,抽樣誤差3%,樣本數為1067。
每層隨機選幾台隨機錄音數小時,共錄音 60,000小時。由專家辨認所有歌曲的作曲作 詞者,記錄後依比例分配權利金。
集群抽樣
先將母體分群,視之為抽樣單位,抽樣 時只抽出部分群來。群內所有樣本都調 查時稱為一階段集群抽樣;群內在抽部 分樣本來調查時稱為二階段集群抽樣。 使用時機:母體底冊的限制不得已。 多搭配分層抽樣,以分層後各層再進行 二階段集群抽樣。
分層隨機抽樣
將母體中每一個體,依有特別興趣,或是有接 近性質為標準,分為若干個子母體,稱為層 (stratum)。在每一層分別隨機抽取部份子樣本, 再整合成一個樣本。 使用的原因與時機:
抽樣管理方便; 不同層內調查設計可以不一樣; 需要對子母體做較精確的估計; 比其他抽樣方法可得到較精確的母體估計。
母體與樣本結構一致性檢定
抽樣樣本結構與母體結構是否相同。
性別結構,男女比例50.5%,49.5%, k=2,
1067個樣本中,男生 530個,女生537個,
則
(530106750.5%)2 (537106749.5%)2 106750.5% 106749.5%
0.292654
P值為 P(X20.292654)0.5885 , 無法
戶政調查(二)-戶政所洽公
推論母體:理論上的母體。
戶政事務所轄區所有需要戶政所服務的居民。
目標母體:訂定有明確的涵蓋範圍。
11月初,所有來戶政所洽公的人。
底冊母體:調查時建立的名冊。
沒有名冊。
調查母體:可以也願意被調查的部分。
11月初,所有來戶政所洽公也願意填問卷的人。
抽樣與普查
所有的樣本都調查稱為普查。 只調查部分樣本稱為抽樣調查。 調查資料所計算出來的統計量,都存在 著誤差。
這些抽樣方法多不足以代表母體。
戶政調查的抽樣設計
母體的特質
抽樣方法
戶政調查的抽樣設計
母體的特質
個人自辦、公司代辦;日間、夜間;
抽樣方法
分層系統隨機抽樣。
信賴區間
母體參數多以樣本平均值估計之,估計值 的信賴區間可寫成,
估計值 z 樣本變異數 n
信賴度為95%時,z = 1.96。 信賴度為99%時,z = 2.575。
每一個個體被選到的機會一樣。 但每一組樣本數為 n 的樣本未必有相同的 機會被選到。
自願樣本與立意選樣
自願樣本:主動對議題表達意見。
如Call-in,網頁問卷調查等。自願樣本多數 表達較強烈意見,因此多有偏差。
立意選樣:依調查的方便主觀選取樣本。
如街頭訪問,賣場問卷調查等。因主觀選 取的地點與方法而有不同程度的偏差意見。
派員面訪
訪員問及填答、受訪者自行填答。
郵寄問卷調查 電話訪問調查
傳統電話訪問、電腦輔助電話訪問(CATI)
網路問卷調查
網頁問卷調查、電子郵件(E-mail)問卷調查
抽樣方法
簡單隨機抽樣 分層隨機抽樣 集群抽樣 系統抽樣
簡單隨機抽樣
抽樣原理:調查母體中每一個樣本被抽 到的機會一樣。 應用時機:1.母體小;2.名冊完整;3.訪 問成本不受樣本地點的影響;4.除了名 冊沒有其他的資訊。 限制與困難:
實驗性研究(Experimental study)。
對每一個體給予特定的處理(treatment), 再觀察並量測有興趣的變數的反應值。 隨機比較性實驗。
抽樣調查的用途
民意調查
選舉民意、公共議題民意、施政滿意度調查
市場調查
產品行銷、潛在顧客
研究調查
農業災害調查、網路行為調查
母體的界定
調查中欲推論的所有範圍或是想收集的 資料所有可能的對象或單位,所構成的 集合稱為母體(Population) 。
簡單隨機樣本的選取
步驟1:編號,母體中每一個體給一號。 步驟2:查表,使用隨機亂數表選號。
30個母體中選五個。步驟1 :列冊編號 步驟2:查表:隨機亂數表某行資料為
• 69051 64817 87174 09517 84534 06489 87201 97245 • 前10組 2位數為 69 05 16 48 17 87 17 40 95 17 • 00, 31~99略去,選 05, 16, 17, 17, 17,17重複繼續 • 再10組 2位數為 84 53 40 64 89 87 20 19 72 45 • 補選 20, 19,最後選出05, 16, 17, 20, 19。
抽樣調查
動機
從(少量的)樣本推估母體的特徵。 選取可以深入觀察母體的樣本,以儘可 能不干擾母體的情況下取得資訊。
觀察性研究。 實驗性研究。
觀察對實驗
觀察性研究 (Observational study)。
對每一個體僅做觀察並量測有興趣的變數, 並不試圖影響反應值。 抽樣調查(sample survey)。
抽樣或普查?
小母體時採用普查。 大母體或具破壞性檢驗時採用抽樣。
燈泡壽命
大母體的普查要注意調查步驟的管理。
國內大型定期普查
工商及服務業普查。
民國80、85、90年,每5年做一次普查。
農林漁牧業普查。
西元1990、2000年,每10年做一次普查,每 5年做一次抽樣調查。
戶口及住宅普查。
西元1990、2000年,每10年做一次普查,每 5年做一次抽樣調查。