《抽样技术》第六章-不等概率抽样
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
j i N
ij
1 3. ij n n 1 2 i 1 j i
N
最感兴趣的是πi与单元大小Mi成比例的情形。若仍 记Zi=Mi/M0,则有: πi=nZi 这种不放回的与(单元)大小成比例的概率抽样称为 πPS抽样。 严格的πPS抽样实施起来非常复杂。事实上,只有 当n=2时,才有一些简单且实用的方法。对于n>2, 严格的πPS抽样都相当复杂。对于大的n,有时根本 不可能。除了实施方面的原因外,当n大时,πij的计 算也极其困难,而这对于方差估计是不可少的。
此时每个单元在每次抽样中的入样概率与单元大小 成比例,称这种特殊的多项抽样为(放回的)与大小 成比例的概率抽样,简称PPS抽样。
i 1
二、多项抽样的实施方法
1.代码法
2.拉希里法
1.代码法
例6.1 设某个总体有N=10个单元,欲用多项抽样从中抽取n =5个单元,给定的入样概率{ Zi }。令Mi= 100Zi,则其皆为 整数,对Mi累加,赋以每个单元的代码列在下表中。
1.布鲁尔(Brewer)方法
该方法要求对每个i,都满足Zi 。两个样本单元采
用逐个抽取法抽取:第一个单元按与
Zi 1 Zi 1 2Zi
1 2
成比
例的概率抽取;第二个单元则在剩下的N−1个单元
中按与Zj成比例的概率抽取。
2.德宾(Durbin)方法
两个样本单元仍用逐个抽取法抽取。第一个样本单
在不等概率抽样中,每个单元都被赋予一个大小不 等的入样概率,而这个概率通常与某个辅助变量有 关,如表示单元规模(大小)的某种度量。 不等概率抽样的常见应用情形: 总体单元规模相差很大。 整群抽样和多阶抽样中,若初级单元相差很大。 系统抽样。 不等概率抽样的主要优点:可以大大提高估计的精 度,减少抽样误差。一个必要条件:对总体中的每 一个单元,都要已知一个辅助量用以确定其入样概 率或两个单元同时入样的概率。
二、霍维茨—汤普森估计量及其性质
对不放回的不等概率抽样,霍维茨(Horvitz)与汤普 森(Thompson)提出了以下总体总和Y的估计量:
ˆ yi Y HT
i 1 n
i
ˆ 完 对于πPS抽样,由于πi=nZi, 与相应PPS抽样的Y HH 全一致。 ˆ 是Y的无偏估计,且它的方 若πi>0, i=1,2,⋯,N,则Y HT 差为:
三、汉森—赫维茨估计量及其性质
汉森—赫维茨(Hansen-Hurwitz)提出的对总体总和Y的估计如 下: n yi 1 ˆ YHH n i 1 zi ˆ 具有如下性质:若所有的Zi>0, 汉森一赫维茨估计量 Y HH i=1,2,⋯,N,则 ˆ 1.E Y ,即它是无偏的; HH Y 2 N Yi 1 ˆ 2. V YHH Zi Y n i 1 Zi 3.若n>1,则 2 n yi ˆ 1 2 ˆ s YHH YHH n n 1 i 1 zi ˆ 的无偏估计。 是V Y HH
《抽样技术》第六章
王学民 编
第六章 不等概率抽样
§6.1
概述 §6.2 放回不等概率抽样 §6.3 不放回不等概率抽样
§6.1 概述
S2 V (y ) (1 f ) n N 2 1 2 S Yi Y N 1 i 1
当Y1,Y2, ⋯,YN之间的大小相差很大时,S2也将很大。 此时可考虑分层,但更为精细的方法是使用不等概 率抽样。
§6.2 放回不等概率抽样
一、多项抽样与PPS抽样
二、多项抽样的实施方法 三、汉森一赫维茨估计量及其性质
一、多项抽样与PPS抽样
多项抽样 总体:Y1, Y2, ⋯, YN
入样概率:Z1, Z2, ⋯, ZN
Z
i 1
N
i
1
N
放回抽样n次,共抽到n个单元。
M0 Mi , 取Zi=Mi/M0,其中Mi是第i个单元的大小,
N Zj i Zi Zi 1 1 Z j i 1 Z j j i j N Zj Zi Zi 1 1 Z 1 Z j 1 j i N
Z j Zi
此时,πi不与Zi成正例。
例6.2
下表是某系统全部N=36个单位上一年职工人数Xi及 当年职工人数Yi的数据。以Xi为单位大小Mi的度量 ,对单位进行PPS抽样,n=6,估计全系统当年职 工总人数Y,并与简单随机抽样作精度比较。
§6.3 不放回不等概率抽样
一、包含概率与πPS抽样 二、霍维茨—汤普森估计量及其性质 三、n=2的严格πPS抽样
一、包含概率与πPS抽样
在不放回抽样中,每个单元Yi被包含到样本的概率 πi=P(i)及任意两个单元(Yi, Yj)都包含到样本的概率 πij=P(i,j)通称为包含概率。抽取了n个单元的样本。 包含概率πi与πij满足以下性质:
1.
2.
i 1
N
N
i
n
n 1 i
ˆ 的无偏估计。 也是 V Y HT
i j ij yi y j ˆ YHT ij i 1 j i i j
n
2
三、n=2的严格πPS抽样
1.布鲁尔(Brewer)方法
2.德宾(Durbin)方法
第一个样本单元以概率Zi抽取,设抽到的是单元i; 第二个样本单元按与Zj成比例的概率(即Zj/(1−Zi)) 抽取,则
在[1,100]内产生5个随机数:04,73,25,49,82。
2.拉希里法
* M max M i ,每次抽取一个[1, N]范围内的随 令 1i N
机数i及[1, M*]范围内的随机数m,若Mi≥m,则第i个 单元入样;否则重抽一组(i, m)。 在例6.1中,N=10,M*=24。设[1,10]中的一个随机 数为4,[1,24]中的随机数为9,由于M4=6<9,故重 抽。设第二次抽到的一组随机数为(7,15),则仍然不 满足要求,还需要抽。若再次抽到的随机数组为 (2,8),则由于M2=10>8,故第2个单元被抽中。如 此重复直到抽到n个单元(允许重复)为止。 拉希里法适用于N很大的情况。
ˆ V Y HT
i 1
Biblioteka Baidu
N
1 i
i
ij i j Yi 2 YY i j i 1 j i i j
2 N N
又有
Yi Y j ˆ V YHT i j ij i 1 j i j i
元以概率Zi抽取,设抽到的是单元i;第二个样本单
1 1 Z 元则按与 j 1 2Z 1 2Z i j 成比例的概率抽取。
德宾方法与布鲁尔方法是等价的。
N
N
2
若πi>0, πij>0(i, j=1,2,⋯,N, i≠j),则
ˆ s Y HT
2 i 1
s
2 YGS
n
1 i
ˆ 的无偏估计。 是 V Y HT
i2
n
ij i j y 2 yi y j i 1 j i i j ij
2 i n n