抽样技术六章

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

yi zi
YˆHH
2
例6.2
❖ 下表是某系统全部N=36个单位上一年职工人数Xi及 当年职工人数Yi的数据。以Xi为单位大小Mi的度量 ,对单位进行PPS抽样,n=6,估计全系统当年职 工总人数Y,并与简单随机抽样作精度比较。
§6.3 不放回不等概率抽样
❖ 一、包含概率与πPS抽样 ❖ 二、霍维茨—汤普森估计量及其性质 ❖ 三、n=2的严格πPS抽样
i 1
n ij i j ji i j ij
yi y j
是V YˆHT 的无偏估计。
2
s2 YGS
YˆHT
n i 1
n j i
i j ij ij
yi
i
yj
j
也是V YˆHT 的无偏估计。
三、n=2的严格πPS抽样
❖ 1.布鲁尔(Brewer)方法 ❖ 2.德宾(Durbin)方法
V YˆHT
N i 1
1i i
Yi 2
2
N i 1
N j i
ij i i j
j
YiYj
❖ 又有
V YˆHT
N
i 1
N j i
i j ij
Yi
i
Yj
j
2
❖ 若πi>0, πij>0(i, j=1,2,⋯,N, i≠j),则
s2 YˆHT
n 1i 2
i1 i
百度文库
n
yi2 2
➢ 3.
N i 1
N j i
ij
1 2
n
n 1
❖ 最感兴趣的是πi与单元大小Mi成比例的情形。若仍 记Zi=Mi/M0,则有:
πi=nZi 这种不放回的与(单元)大小成比例的概率抽样称为 πPS抽样。
❖ 严格的πPS抽样实施起来非常复杂。事实上,只有 当n=2时,才有一些简单且实用的方法。对于n>2, 严格的πPS抽样都相当复杂。对于大的n,有时根本 不可能。除了实施方面的原因外,当n大时,πij的计 算也极其困难,而这对于方差估计是不可少的。
❖ 该 用方逐法 个要 抽求 取对 法每 抽个 取:i,第都一满个足单Zi元 12按。与两Z个i 1样 Z本i 单成元比采
成比例,称这种特殊的多项抽样为(放回的)与大小 成比例的概率抽样,简称PPS抽样。
二、多项抽样的实施方法
❖ 1.代码法 ❖ 2.拉希里法
1.代码法
❖ 例6.1 设某个总体有N=10个单元,欲用多项抽样从中抽取n =5个单元,给定的入样概率{ Zi }。令Mi= 100Zi,则其皆为 整数,对Mi累加,赋以每个单元的代码列在下表中。
率抽样。
❖ 在不等概率抽样中,每个单元都被赋予一个大小不 等的入样概率,而这个概率通常与某个辅助变量有 关,如表示单元规模(大小)的某种度量。
❖ 不等概率抽样的常见应用情形:
➢ 总体单元规模相差很大。
➢ 整群抽样和多阶抽样中,若初级单元相差很大。
➢ 系统抽样。
❖ 不等概率抽样的主要优点:可以大大提高估计的精 度,减少抽样误差。一个必要条件:对总体中的每 一个单元,都要已知一个辅助量用以确定其入样概 率或两个单元同时入样的概率。
二、霍维茨—汤普森估计量及其性质
❖ 对不放回的不等概率抽样,霍维茨(Horvitz)与汤普
森(Thompson)提出了以下总体总和Y的估计量:
YˆHT
n i 1
yi
i
❖ 对于πPS抽样,由于πi=nZi, 与相应PPS抽样的YˆHH完 全一致。
❖ 若πi>0, i=1,2,⋯,N,则YˆHT是Y的无偏估计,且它的方 差为:
一、包含概率与πPS抽样
❖ 在不放回抽样中,每个单元Yi被包含到样本的概率 πi=P(i)及任意两个单元(Yi, Yj)都包含到样本的概率 πij=P(i,j)通称为包含概率。抽取了n个单元的样本。
❖ 包含概率πi与πij满足以下性质:
N
➢ 1. i n i 1
N
➢ 2. ij n 1i ji
第六章 不等概率抽样
❖ §6.1 概述 ❖ §6.2 放回不等概率抽样 ❖ §6.3 不放回不等概率抽样
§6.1 概述
V (y) S 2 (1 f )
n
S 2 1 N
N 1 i1
Yi Y
2
❖ 当Y1,Y2, ⋯,YN之间的大小相差很大时,S2也将很大。 此时可考虑分层,但更为精细的方法是使用不等概
➢ 在[1,100]内产生5个随机数:04,73,25,49,82。
2.拉希里法


M
*
max
1i N
M
i
,每次抽取一个[1,
N]范围内的随
机数i及[1, M*]范围内的随机数m,若Mi≥m,则第i个 单元入样;否则重抽一组(i, m)。
❖ 在例6.1中,N=10,M*=24。设[1,10]中的一个随机 数为4,[1,24]中的随机数为9,由于M4=6<9,故重 抽。设第二次抽到的一组随机数为(7,15),则仍然不
❖ 第一个样本单元以概率Zi抽取,设抽到的是单元i; 第二个样本单元按与Zj成比例的概率(即Zj/(1−Zi)) 抽取,则
i Zi
N ji
Z jZi 1 Zj
N Zi 1
ji
Zj 1 Zj
Zi 1
N j 1
Zj 1 Zj
1
Zi Zi
此时,πi不与Zi成正例。
1.布鲁尔(Brewer)方法
满足要求,还需要抽。若再次抽到的随机数组为
(2,8),则由于M2=10>8,故第2个单元被抽中。如 此重复直到抽到n个单元(允许重复)为止。
❖ 拉希里法适用于N很大的情况。
三、汉森—赫维茨估计量及其性质
❖ 汉森—赫维茨(Hansen-Hurwitz)提出的对总体总和Y的估计如 下:
YˆHH
1 n
§6.2 放回不等概率抽样
❖ 一、多项抽样与PPS抽样 ❖ 二、多项抽样的实施方法 ❖ 三、汉森一赫维茨估计量及其性质
一、多项抽样与PPS抽样
❖ 多项抽样
总体:Y1, Y2, ⋯, YN 入样概率:Z1, Z2, ⋯, ZN
N
Zi 1
i1
放回抽样n次,共抽到n个单元。
N
❖ 取Zi=Mi/M0,其中Mi是第i个单元的大小,M 0 Mi , i1 此时每个单元在每次抽样中的入样概率与单元大小
n i 1
yi zi
❖ 汉森一赫维茨估计量YˆHH 具有如下性质:若所有的Zi>0, i=1,2,⋯,N,则

➢ ➢
1.E YˆHH Y
2. V
YˆHH
1 n
3.若n>1,则
,即它是无偏的;
N i 1
Zi
Yi Zi
Y
2
是V
YˆHH
s2 YˆHH 的无偏估计。
1
nn 1
n i 1
相关文档
最新文档