谈谈几种典型的抽样方法(案例)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
谈谈几种典型的抽样方法(案例)
摘要:本文以抽样方法为中心,主要阐述几种常见的抽样方法,如简单随机抽样,分层抽样,整群抽样,系统抽样以及配额抽样,探讨了各种抽样方法在实际生活的应用以及各自的优缺点等。
关键词:抽样调查,应用,缺点。
导语:抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。
抽样调查是建立在随机原则基础上,从总体中抽取部分单位进行调查,并概率估计原理,应用所的资料对总体的数量特征进行推断的一种调查方法。例如,从某地区全部职工当中随机抽取部分职工,以家庭为单位按月调查取得有关收入、支出等方面的资料,并依据这些资料推断出全区职工的收支情况,这就是一种抽样调查。从调查方法上来看,它是属于一种非全面调查。但又与一般调查不同,它不只停留于搜集资料和整理资料,而且还要对资料进行分析,并据以推断总体的数量特征,从而提高统计的认识能力。因此,抽样调查的理论和方法在统计中占有很重要的地位。
下面介绍一下常用的抽样方法:
一. 简单随机抽样
一般,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的个体被抽到的机会相等,就把这种抽样方法叫做简单随机抽样。
简单随机抽样的具体作法有:直接抽选法,抽签法,随机数法。
直接抽选法例如某项调查采用抽样调查的方法对某市职工收入状况进行研究,该市有职工56,000名,抽取5,000名职工进行调查,他们的年平均收入为10,000元,据此推断全市职工年收入为8,000--12,000元之间。
抽签法又称“抓阄法”。它是先将调查总体的每个单位编号,然后采用随机的方法任意抽取号码,直到抽足样本。在这里选取一个案例说明,如要在10个人中选取3个人作为代表,先把总体中的10个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取3次,就得到一个容量为3的样本。这就是抽签法,与直接抽样法类似。
另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算
当然,随机抽样也有不足之处,它只适用于总体单位数量有限的情况,否则编号工作繁重;对于复杂的总体,样本的代表性难以保证;不能利用总体的已知信息等。在市场调研范围有限,或调查对象情况不明,难以分类,或总体单位之间特性差异程度小时采用此法效果较好。
抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便。如果标号的签搅拌得不均匀,会导致抽样不公平。而随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。
二. 分层抽样
分层抽样又称分类抽样或类型抽样,是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。一般地,在抽样时,将总体分成互不交叉的层,然后按一定的比例,从各层次独立地抽取一定数量的个体,将各层次取出的个体合在一起作为样本。
分层抽样尽量利用事先掌握的信息,并充分考虑了保持样本结构和总体结构的一致性,这对提高样本的代表性是很重要的。当总体是由差异明显的几部分组成时,往往选择分层抽样的方法。其特点是将科学分组法与抽样法结合在一起,每个个体被抽到的概率都相等N/M。分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。
下面是一个实例应用
某公司要估计某地家用电器的潜在用户。这种商品的消费同居民收入水平相关,因而以家庭年收入为分层基础。假定某地居民为1,000,000户,已确定样本数为1,000户,家庭年收入分10,000元以下,10,000——30,000元;30,000——60,000元,60,000元以上四层,其中收入在10,000元以下家庭户为180,000户,收入在10,000——30,000元家庭户为350,000户,
收入在30,000——60,000元家庭户为3000,000户,收入在60,000元以下家庭户为170,000户,应进行如下抽样:
分层比例抽样示意图
总体
子样本
样本
分层抽样与简单随机抽样相比,往往选择分层抽样,因为它有显著的潜在统计效果。也就是说,如果从相同的总体中抽取两个样本,一个是分层样本,另一个是简单随机抽样样本,那么相对来说,分层样本的误差更小些。另一方面,如果目标是获得一个确定的抽样误差水平,那么更小的分层样本将达到这一目标。
总体中赖以进行分层的变量为分层变量,理想的分层变量是调查中要加以测量的变量或与其高度相关的变量。分层的原则是增加层内的同质性和层间的异质性。常见的分层变量有性别、年龄、教育、职业等。分层随机抽样在实际抽样调查中广泛使用,在同样样本容量的情况下,它比纯随机抽样的精度高,此外管理方便,费用少,效度高。
三. 系统抽样
系统抽样也称为等距抽样、机械抽样、SYS抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种。在系统抽样中,先将总体从1~N相继编号,并计算抽样距离K=N/n。式中N为总体单位总数,n为样本容量。然后在1~K中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K……,直至抽够n个单位为止。
根据总体单位排列方法,系统抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。按照具体实施等距抽样的作法,系统抽样可分为:直线系统抽样、对称系统抽样和循环系统抽样三种。
在定量抽样调查中,系统抽样常常代替简单随机抽样。由于该抽样方法简单实用,所以应用普遍。系统抽样得到的样本几乎与简单随机抽样得到的样本是相同的。
下面看一个例子,某产品的口味测试,需要运用等距抽样的方法从某校营销专业90名学生中抽选9名进行测试。