常见的随机抽样方法介绍
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
常见的随机抽样方法介绍
抽样方法介绍
朱一军
福建省产品质量检验研究院
一、随机方法选择及随机数产生
按照GB/T 10111-2008 《随机数的产生及其在产品质量抽样检验中的应用程序》的要求,并根据受检单位的产品堆放形式、基数(批量)大小,确定抽样方法(通常包括简单随机抽样、分层随机抽样、系统抽样、整群抽样、全数抽样五种方法)。
随机数一般可使用随机数表、骰子或扑克牌中任选一种方式产生。
(一)简单随机抽样
(抽签法、随机样数表法)常常用于总体个数较少时,它的主要特征是从总体中逐个抽取;
优点:操作简便易行
缺点:总体过大不易实行
1. 定义:
一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≦N),如果每次抽取式总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
2. 简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的N个个体编号,把号码写在
号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
(抽签法简单易行,适用于总体中的个数不多时。
当总体中的个体数较多时,将总体“搅拌均匀”就比较困难,用抽签法产生的样本代表性差的可能性很大)
(2)随机数法
随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样。
(二)分层抽样
(Stratified Random Sampling) 主要特征分层按比例抽样,主要使用于总体中的个体有明显差异。
共同点:每个个体被抽到的概率都相等N/M。
定义
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样(stratified sampling)。
(三)系统抽样
当总体中的个体数较多时,采用简单随机抽样显得较为费事。
这时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。
步骤:
一般地,假设要从容量为N的总体中抽取容量为n的样本,我们可以按下列步骤进行系统抽样:
(1)先将总体的N个个体编号。
(2)确定分段间隔k,对编号进行分段。
当N/n(n是样本容量)是整数时,取k=N/n;
(3)在第一段用简单随机抽样确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本。
通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本。
小结:三种抽样方法的比较
1、类别:①简单随机抽样②系统抽样③分层抽样
2、共同点:(1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样
3、各自特点:①从总体中逐个抽取②将总体均分成几部分按事先确定的规则在各部分抽取③将总体分成层,分层进行抽取
4、相互联系:①无②在起始部分抽样时采用简单随机抽样③各层抽样采用简单随机抽样或系统抽样
5、适用范围①总体中个体数较少②总体中个体数较多③总体由差异明显的几部分组成
(四)整群抽样
什么是整群抽样 (Cluster sampling)
整群抽样又称聚类抽样。
是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。
整群抽样的优缺点:
整群抽样的优点是实施方便、节省经费;
整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。
整群抽样的实施步骤 :
先将总体分为i个群,然后从i个群钟随即抽取若干个群,对这些群内所有个体或单元均进行调查。
抽样过程可分为以下几个步骤:
一、确定分群的标注
二、总体(N)分成若干个互不重叠的部分,每个部分为一群。
三、据各样本量,确定应该抽取的群数。
四、采用简单随机抽样或系统抽样方法,从i群中抽取确定的群数。
例如,调查中学生患近视眼的情况,抽某一个班做统计;进
行产品检验;每隔8h抽1h生产的全部产品进行检验等。
整群抽样与分层抽样的区别:
整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。
分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;
分层抽样的样本是从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。
二、常见的简单随机抽样方法介绍
1、随机数表法
1.1 随机数表简介
随机数表是一组由0到9数字组成的表,每个数字都有相同的概率出现在每个位置上。
附录A提供了五张50×50的随机数表(见表A.1~表A.5)。
如表A.1不敷使用也可选择其他合适的随机数表。
1.2获得随机数R0的方法
a) 确定随机数表号与初始点:首先在第一张表上随机指定一点,以它为起点依次向右读取5个数字,第一个数字若小于5,则取该数加1作为选定的随机数表号,若第一个数字大于或等于5,则取该数减4之差作为选定的随机数表号。
第2~3位和4~5位组成两个两位数,若两位数小于50,则加上1,若两位数大
于或等于50,则减去49,最后所得的数表示初始点所在的行数和列数。
b) 获得R0的方法:从初始点依次向下读取所需m位数得到所需的随机数R0。
在读取过程中,若读到该页的最后一行则转到第一行依次读取后m列,若最后剩下的几列不足m列则从下一号表的第一列开始依次补上。
1.3读取样本单元编号R
a) 如获得的随机数R0≤N,则随机数R就取R0;若R0>N,则设R0=K1N+R1,其中K1=[N/R0],当(K1+1)N>10m时,舍弃并重新生成随机数R0;当(K1+1)N≤10m时,则取R=R1(若0<R1<N)或取R=N(若R1=0)。
重复上述过程,直到获得n个不同的随机数为止。
b) 为了提高效率,可以采用下述方法:如获得的随机数R0≤N,则随机数R就取R0;若R0>N,则取一个大于N的适当整数M。
一般取M=2×10m-1,2.5×10m-1,3×10m-1或5×10m-1。
设R0=K2M+R2,其中K2=[ R0/M],则当(K2+1)M>10m时,舍弃并重新生成随机数R0;
当(K2+1)M≤10m时,则R=R2(若0<R2<N)或R=N(若R2=0)或舍弃重新生成(若R2>N)。
重复上述过程,直到获得n个不同的随机数为止。
注1:当N小于200,而所得读数大于200,取读数减去200的倍数,若其差数小于或等于N,则作为所要的随机数,若差数大于N,则舍弃;当200<N≤500,而所得读数大于500,则取读数减去500,其差数作为所要的随机数。
注2:若采用注1的方法.读取所需随机数的效率会更高。
2、随机抽样骰子法
1 随机数骰子构成及其使用方法
1.1 随机数骰子的构成
随机数骰子是均匀材料制成的正二十面体,各面上刻有0~9的数字各2个。
图1为其底视图与俯视图。
每套骰子由盒体、盒盖及数种不同颜色的骰子组成,如图1所示。
图1
1.2随机数骰子的使用方法
根据需要选取m个骰子并规定每种颜色所代表的数位。
例如,选用红、黄、蓝3种颜色的骰子,并规定红色骰子出现的数字表示百数位,黄色骰子出现的数字表示十数位,蓝色骰子出现的数字表现个数位。
特别规定当m个骰子的数字均为零时,表示l0m”。
将m个骰子放入盒中盖好,盒盖向下,水平地摇动盒子,使骰子充分旋转,然后打开盒子,读出骰子表示的随机数R0。
2 产生随机数R0的方法
2.1确定骰子个数
根据总体大小或批量N选定m个彀子,如表1所示。
表1 总体大小或批量N与骰子个数m的对应关系
当m>6或个别骰子丢失、损坏时,可通过重复摇骰子的方法获得随机数R0。
例如,可用一个骰子摇m次来代替m个骰子摇一次。
规定第一次摇骰子所得数字为随机数的最高数位,摇第二次
骰子所得数字为随机数的第二高数位,依此类推。
2.3读取随机样本单元号R的方法
2.3.1 方法一
如获得的随机数R0≤N,则随机数R就取R0;若R0>N,则舍弃不用,另行重新生成随机数R0。
重复上述过程,直到取得n个不同的随机数为止。
2.3.2方法二
如获得的随机数R0≤N,则随机数R就取R0;若R0>N,则设R0=K1N+R1,其中K1=[N/R0],当(K1+1)N>10m时,舍弃并重新生成随机数R0;当(K l+1)N≤10m时,则取R=R1(若0<R1<N)或取R=N(若R1=0)。
重复上述过程,直到获得n个不同的随机数为止。
2.3.3方法三
如获得的随机数R0≤N,则随机数R就取R0;若R0>N,则取一个大于N的适当整数M。
一般取M=2×10m-1,2.5×10m-1,3×10m-1或5×10m-1。
设R0=K2M+R2,其中K2=[R0/M],则当(K2+1)M>10m“时,舍弃并重新生成随机数R0;当(K2+1)M≤10m时,则R=R2(若0<R2<N)或R=N(若R2=o)或舍弃重新生成(若R2>N)。
重复上述过程,直到获得n个不同的随机数为止。
注:若遇到与已获得随机数重复情形,则舍弃重摇。
2.4随机数骰子法示例
3、随机抽样扑克牌法
1 扑克牌式样
把一副扑克牌的四种花色的A,2,3,4,5,6,7,8,9,
10共40张,把A作为1,10作为0(见表1.1)。
表1.1 扑克牌编码表
2 产生随机数R0的方法
用扑克牌产生随机数R0的步骤如下:
a) 在开始使用时,应彻底地洗牌、切牌4次以上。
b) 经彻底洗牌、切牌以后,翻开最上面的一张,并记下一个数码,这相当于得到一个随机数字。
c)按照所需随机数的位数重复以上过程,即可获得所需的随机数。
如果需要两位数的随机数,就把两次切洗后得到的数码组成一组;如果需要三位数的随机数,就把三次切洗后得到的数码组成一组。
依此类推,就可以得到我们所需要的任意位长的随机数。
注:在生成随机数的过程中,每次必须把抽出的牌放回去,并经过彻底切洗以后才能抽取下一张牌。
3 扑克牌法示例
设批量N=90,样本量n=5,试对其进行随机抽样。
将批中的单位产品按自然数从“1”开始顺序编号到90。
用扑克牌获得随机数R0并读取样本单元编号R。
a) 若抽出的第一个随机数R0=23,则取R=R0=23;
b) 若抽出的第二个随机数R0=08,则取R=Ro=8;
c) 若抽出的第三个随机数R0=23,则应舍弃重抽;
d) 若抽出的第三个随机数R0=40,则取R=R0=40;
e) 若抽出的第四个随机数R0=12,则取R=Ro=12;
f) 若抽出的第五个随机数R0=85,则取R= R0=85。
从批中取出编号为8、12、23、40、85的5个单位产品。