常见的随机抽样方法介绍
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样方法介绍
朱一军
福建省产品质量检验研究院
、随机方法选择及随机数产生
按照GB/T 10111-2008《随机数的产生及其在产品质量抽
样检验中的应用程序》的要求,并根据受检单位的产品堆放形式、基数(批量)大
小,确定抽样方法(通常包括简单随机抽样、分层随机抽样、系统抽样、整群抽
样、全数抽样五种方法
)。
随机数一般可使用随机数表、骰子或扑克牌中任选一种方式产生。
(一)简单随机抽样
(抽签法、随机样数表法)常常用于总体个数较少时,它的主要特征是从总
体中逐个抽取;
优点:操作简便易行
缺点:总体过大不易实行
1.定义:
一般地,设一个总体含有N个个体,从中逐个不放回地抽取
n个个体作为样本(nW N ,如果每次抽取式总体内的各个个体被抽到的机会都相
等,就把这种抽样方法叫做简单随机抽样。
2.简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的N个个体编号,把号码写在
号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取
n次,就得到一个容量为n的样本。
抽签法简单易行,适用于总体中的个数不多时。当总体中
的个体数较多时,将总体“搅拌均匀”就比较困难,用抽签法产生的样本代表性差的可能性很大)
2)随机数法
随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样。
二)分层抽样
Stratified Random Sampling)
主要特征分层按比例抽
样,主要使用于总体中的个体有明显差异。共同点:每个个体被抽到的概率都相等N/M。
定义
般地,在抽样时,将总体分成互不交叉的层,然后按照
定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样
stratified sampling )。
三)系统抽样
当总体中的个体数较多时,采用简单随机抽样显得较为费事。这时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。
步骤:
般地,假设要从容量为N 的总体中抽取容量为n 的样本,
我们可以按下列步骤进行系统抽样:
(1)先将总体的N个个体编号。
(2)确定分段间隔k,对编号
进行分段。当N/n (n是样本
容量)是整数时,取k=N/n;
(3)在第一段用简单
随机抽样确定第一个个体编号l (l w
k);
4)按照一定的规则抽取样本。通常是将l 加上间隔k 得
到第2个个体编号(l+k ),再加k得到第3个个体编号(l+2k ), 依次进行下去,直到获取整个样本。
小结:三种抽样方法的比较
1、类别:①简单随机抽样②系统抽样③分层抽样
2、共同点:(1) 抽样过程中每个个体被抽到的可能性相等
(2) 每次抽出个体后不再将它放回,即不放回抽样
3、各自特点:①从总体中逐个抽取②将总体均分成几部分按事先确定的规则在各部分抽取③将总体分成层,分层进行抽取
4、相互联系:①无②在起始部分抽样时采用简单随机抽样③ 各层抽样采用简单随机抽样或系统抽样
5、适用范围①总体中个体数较少②总体中个体数较多③总体由差异明显的几部分组成
四)整群抽样
什么是整群抽样(Cluster sampling)
整群抽样又称聚类抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取
样本的一种抽样方式。
应用整群抽样时,要求各群有较好的代表性,即群内各单位
的差异要大,群间差异要小。
整群抽样的优缺点:
整群抽样的优点是实施方便、节省经费;
整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。
整群抽样的实施步骤:
先将总体分为i 个群,然后从i 个群钟随即抽取若干个群,对这些群内所有个体或单元均进行调查。抽样过程可分为以下几个步骤:
、确定分群的标注
二、总体(N)分成若干个互不重叠的部分,每个部分为一群。
三、据各样本量,确定应该抽取的群数。
四、采用简单随机抽样或系统抽样方法,从i 群中抽取确定的群数。
例如,调查中学生患近视眼的情况,抽某一个班做统计;进
行产品检验;每隔8h 抽1h 生产的全部产品进行检验等。
整群抽样与分层抽样的区别
整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。
分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;
分层抽样的样本是从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。
二、常见的简单随机抽样方法介绍
1、随机数表法
1.1 随机数表简介
随机数表是一组由0 到9 数字组成的表,每个数字都有相同的概率出现在每个位置上。
附录A提供了五张50 X 50的随机数表(见表A. 1〜表A. 5)。
如表A.1 不敷使用也可选择其他合适的随机数表。
1. 2获得随机数R的方法
a)确定随机数表号与初始点:首先在第一张表上随机指定一点,以它为起点依次向右读取5 个数字,第一个数字若小于5,
则取该数加1 作为选定的随机数表号,若第一个数字大于或等于
5,则取该数减4 之差作为选定的随机数表号。第2〜3 位和4〜
5 位组成两个两位数,若两位数小于50,则加上1 ,若两位数大于或等于50,则减去49,最后所得的数表示初始点所在的行数和列数。
b) 获得R0的方法:从初始点依次向下读取所需m位数得到所需的随机数R0。在读取过程中,若读到该页的最后一行则转到第一行依次读取后m列,若最后剩下的几列不足m列则从下一号表的第一列开始依次补上。
1.3 读取样本单元编号R
a)如获得的随机数RW N贝y随机数R就取R);若9N, 则设R=K i N+R,其中K i=[N/R],当(K i+1)N>10m时,舍弃并重新生成随机数R D;当(K i+1)N< 10m时,则取R=R(若0vRvN)或取R=N(若R=0)。重复上述过程,直到获得n个不同的随机数为止。