抽样调查基本原理与样本设计doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样调查的类型
概率抽样:依据概率论的基本原理,按照随机原则进行,避免抽样过程中的人为误差。
非概率抽样:依据研究者的主观意愿、判断、是否方便等抽取对象,误差较大,样本代表性无法保证。
简单随机抽样
系统抽样
概率抽样分层抽样
整群抽样
多阶段抽样
抽样方法
偶遇抽样
非概率抽样判断抽样
定额抽样
滚雪球抽样
非概率抽样方法
1、偶遇抽样/方便抽样/自然抽样
“碰到谁就选谁”。
这种抽样方式表面上看与简单随机抽样一样。实则不然。因为它不能保证总体中的每一个元素都有同样的被抽取机
会。那些最先碰到、最容易碰到、最方便碰到的对象具有比其他对象大得多的机会被抽中。
因此,不能用偶遇抽样得到的样本来推论总体。
在人大东门过街天桥上拦截过往人群而开展的各式调查,以及在当代商场拦截顾客而进行的有关化妆品、服装等各式商品的调查,都属于这样的抽样。来自这种抽样的结果,当然,也不能用来推论“全国”、“北京市”,哪怕是“人大附近”的任何群体的情况。
有些话题因为比较敏感、涉及隐私等原因,很多人不愿意接受调查。但总会有一些人比较“积极”,“志愿”配合,接受调查。这种调查,也属于方便调查,其结果也不能用于推断总体。
这种抽样方式常常用来作为试验问卷的手段。
2、判断抽样/目标抽样/立意抽样/主观抽样
研究者依据自己研究的目标和主观的分析来选择和确定研究对象的抽样方法。
这种抽样首先要确定抽样标准。
比如,为了体现某个群体的先进性,我们在调查时刻意去收集这个群体中那些特别先进的成员进行调查。
由于标准的确定带有较大的主观性,故,用这种方法得到结果与研究者的经验、对研究对象的熟悉程度等有较大关系。所得结果不能用于推论总体。
我们过去十分熟悉的“典型调查”,实际上属于这种主观调查。
这种抽样方式可以用来作为试验问卷的手段;
还常用来对总体中的次级集合进行比较研究:比如,要对“左派”和“右派”进行对比分析,可以选择一个被认为是“左派”的群体,和一个被认为是“右派”的群体,对该两群体的成员进行抽样调查。这种调查的结果并不能对“左派”或“右派”进行完整的描述,但通过它们还是可以大致了解二者间的一般差别。
作为研究“异常案例”的手段:比如,为了对学生中“孤独”者进行研究,可以在学生集会上选取那些“躲在角落”的学生或者那些根本不参加学生活动的学生进行调查。
3、定额抽样/配额抽样
根据总体中具有不同特征的成员的比例来确定样本在相应特征方面的分布。
配额抽样假定:(1)只要类型划分较细,那么,同一类型中的每一个个体都是同质的,因而无须采用随机抽样。(2)只要类型划分合理,且分配给各类的名额符合总体中各类人员的分布,那么,样本就可以准确地反映总体。
上述假设在理论上是成立的。但是,在实施过程中却难以做到。(1)难以获得有关总体的众多属性分布材料;或者,即使能够获得相应的材料,在选择样本时也无法一一顾及总
体的所有属性,而只能照顾到总体的某些主要属性。(2)有关总体分布变化的最新信息常常难以获得,因而配额分配的合理性就难以保证,这可能成为影响调查结果的致命因素,
例如,1948年美国总统选举预测。选举之前,盖洛普等民意测验机构预测杜威会战胜杜鲁门成为总统,但他们失败了。原因之一是:他们使用了配额抽样的调查方法,所使用的选民配额比例是1940年人口普查所提供的选民结构数据。但是,二战促使大量美国人从农村涌入城市,从1940年到1948年,美国人口的城乡结构发生了巨大变化。从分城乡人口的政治倾向来看,农村人口更支持共和党,城市人口更支持民主党。这样,当调查者在使用过时的人口城乡结构资料进行配额调查时,就可能错误地预测选举结果。
4、滚雪球抽样
先收集目标群体少数成员的资料,然后再向这些成员询问相关信息,找出他们认识的其他总体成员。
这种方法产生的样本代表性受到怀疑,因而它常常用于探索性研究。在特定总体的成员难以找到时,这种方法是最合适的抽样方法。比如,对吸毒者、同性恋者、非法移民、地下组织成员的调查等的调查。
概率抽样:
一、常见的几种概率抽样方式:
简单随机抽样
概率抽样的最基本形式。
按等概率的原则从含有N个元素的总体中随机抽取n个元素组成样本(N>n)。
常见的实施方式:
1、抓阄方式
步骤:
获取全体总体元素(N个)――》给每个元素编上号――》将这些号置于一装置中,并搅拌均匀――》从装置中随便抽出n个元素,这些元素构成样本。
2、使用随机数表
抓阄方式在日常生活中比较常见。但是,当N很大时,要完成所有元素逐一书写号码、置于装置中、搅拌均匀等工作是十分困难的,甚至是不可能的。
这时,一个更可行的方式是使用随机数表。
获取全部总体元素(抽样框)――》将所有元素一一按顺序编号――》用随机数表抽选n个元素:首先确定随机数表的起点;确定如何选择随机数的原则;按照确定的原则,在
随机数表上逐一获取随机数,与抽样框的编号比对,符合者被选中,直到选取n个元素为止。
简单随机抽样是概率抽样的理想类型,没有偏见,简单易行,并且在用样本统计值对总体参数进行推断时,有很健全的规则。
简单随机抽样的不足:总体元素的数量太大时,采用这种方式不仅费时,工作量大,而且费用很高;更重要的是,当总体异质性大时,使用这种方式的误差比较大。
课下实践:
我们都很希望知道自己的英文(中文)词汇量。如何测定自己的词汇量呢?
试设计用简单随机抽样方法测定自己英文词汇量的抽样方案。
分层抽样
1、什么是分层抽样?
所谓分层抽样,就是这样一种抽样方法:先将总体按照一种或者几种特征分为若干个子总体(类、群),每一个子总体称为一层;然后从每一层中随机抽取一个子群体;将这些抽中的子群体合在一起构成总体的样本。
分层的原因:社会现象的复杂性和异质性。
2、分层抽样的优点: