什么是PPS抽样调查法

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对PPS抽样的初步认识和了解

一、什么是PPS抽样调查法

PPS抽样调查法是指放回的按规模大小成比例的概率抽样,简称为PPS抽样。它是一种使用辅助信息,从而使每个单位均有按其规模大小成比例的被抽中概率的一种抽样方式。其抽选样本的方法有汉森-赫维茨方法、拉希里方法等。

PPS 抽样是按概率比例抽样,属于概率抽样中的一种,是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。PPS 抽样就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。

二、PPS抽样的应用与说明

PPS(Probility proportional to size ) 抽样在社会、经济和人口调查中经常使用,它是将总体按一种标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样,在层或群内,再采取概率、等比例或不等比例等方法再次选择具体样本。PPS 抽样是一种分层抽样与简单随机抽样或者不等比例抽样相配合的两阶段抽样,有时也进一步进行多阶段抽样。在第一阶段,根据样本所在层或群的大小,给予各个层或群不同的中选概率,然后在第二阶段的各个层或群内以等样本量的方法抽取样本。它的公式是:

其中,Mosa是各个群的样本规模,b群是每个群所需要抽取的样本量,F是总体中每多少个数量抽取一个样本的代表值,f 为抽样比例。

这种方法最根本的优点是能够较大程度地提高抽样精度,较好地推论总体。

三、PPS抽样的特点与优点

PPS抽样的特点是总体中含量大的部分被抽中的概率也大,可以提高样本的代表性。

PPS抽样的主要优点是:使用了辅助信息,减少抽样误差;主要缺点是:对辅助信息要求较高,方差的估计较复杂等。

四、PPS抽样的设计

PPS抽样其具体的做法是:

1、首先确定初级抽样单位(PSU),PSU可以是固定的常规单位,确定PSU

需要有这些初级抽样单位的具体名录,以及每个初级抽样单位中被调查人员的具体数目,这个数目可以的估计的人数。

2、确定抽取哪些初级抽样单位,如果初级抽样单位比较少,可以全部抽取,如果初级抽样单位太多,则可以随机抽取部分的抽样单位。

3、在选取的初级抽样单位中选择具体的调查对象,如果将第二步中选取的初级抽样单位的组成人员全部作为调查对象,称为二阶段整群抽样,如果只是在初级抽样单位中按人数的多少,来决定在每个抽样单位中抽取多少人,则称为PPS抽样,此时,需要进行一定的计算。

五、PPS抽样的举例

假设要从全市100家企业,总共20万名职工中,抽取1000名职工进行调查。我们采取多段抽样的方法,首先从100家企业中随机抽取若干家企业,如抽取20家;然后再从这20家企业中分别抽取50名职工(50X20=1000)构成样本。需要注意的是,这100家企业的规模是不同的:最大的企业多达16000名职工,而最小的企业则只有200名职工。如果这样的两个企业都选人第一阶段的样本(即都进人20家企业的样本),那么它们在第一阶段的人选概率是相同的,即都为20÷100=20%;但第二阶段从每家企业中抽取职工时,这两家企业中每个职工被抽中的概率却大不一样:前者的概率为50÷16000=0.3125%,而后者的概率则为50÷200=25%。这样,规模大的企业中每个职工被抽中的概率则为20%×0.3125%=0.0625%;而规模小的企业中每个职工被抽中的概率为20%×25%=5%;规模大的企业中的职工相对于规模小的企业中的职工来说,他们被抽中的概率要小得多(后者是前者的80倍)。

为了解决这一问题,我们可以采用PPS的方法,首先将各个元素(即企业)排列起来,然后写出它们的规模、计算它们的规模在总体规模中所占的比例;将它们的比例累计起来,并根据比例的累计数依次写出每一元素所对应的选择号码范围(该范围的大小等于元素规模所占的比例(见下表中第一、二、三、四列),然后采用随机数表的方法或系统抽样的方法选择号码,号码所对应的元素人选第一阶段样本(见下表第五、六列)。最后再从所选样本中进行第二阶段抽样(即从每个被抽中的元素中抽取50名职工)。由于规模大的企业其所对应的选择号码范围也大,而选样号码范围大时,被抽中的概率也大(有些特别大的企业还可能抽到不止一个号码,如企业3就抽到两个号码。那么在第二阶段抽样中,就要从企业3中抽取50×2=100名职工)。由于规模大的企业在第一阶段抽样时被抽中的

概率大于规模小的企业,这样就补偿了第二阶段抽样时规模大的企业中每个职工被抽中的概率小的情况,使得无论规模大还是规模小的企业中,每个职工总的被抽中的概率都是相等的。所以,这种方法最终抽出的样本对总体的代表性也大。

相关文档
最新文档