抽样调查第3章 不等概抽样

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最大规模法 (由统计学家Lahiri最先提出)
1、求规模测度的最大值 M max{ X 1 , X 2 ,, X N } 2、从{ 1,2, … , N }抽取随机数a,同时独立地从 {1,2,…,M}中抽取随机数b,若
b Xa
则第a个单元入样,否则此次抽取无单元入样. 3、重复2,直至抽得n个单元.
估值法
Horvitz-Thompson估计 (HT估计)
yi ˆ 总体总数Y的估计值为 YHT
i 1 n
yi ˆ 定理3.2.1 对πPS抽样, HT估计YHT 是总体总
i 1
i
n
i
数Y的无偏估计 .其均方偏差为
ˆ VY HT
i 1
N

N
(1 i )Yi 2
例2 以下列概率从总体{1,2,3,4,5}中抽取容量为2的 样本.
p1 p2 0.1, p3 0.2, p4 p5 0.3
例3 一村庄有8个果园,分别有果树50,30,65, 80,140,44,20,100棵,要调查该村庄水果总 产量,以正比于果树棵数的概率取3个果园作样本.
Yi 1 ˆ V (YPPS) pi Y n i 1 pi
N
2
Yi Y j 1 ˆ ) p p V (Y PPS i j n i 1 j i p p j i
N N
2
PPS抽样的估值法
ˆ )的一个无偏 定理3.1.2 在有放回PPS抽样下,V (Y PPS ˆ ) 估计为 v(Y pps yi ˆ 1 YPPS n(n 1) i 1 pi
pi
Xi
X
PPS抽样的实现方法
累积和法的另一种形式
从[0,1]中取均匀分布随机数r,
若r [0, p1 ], 第 1个单元入样;
若 r ( p j , p j ], 第i个单元入样, i 2,3,, N
j 1 j 1 i 1 i
重复以上步骤,直至抽得n个单元.PS抽样的概念 π proportion to size.
每次抽取后抽中的单元不放回,要求各单元的入样 概率正比于规模测度
修正概率
要使每个单元的入样概率pi X i , 在不同的抽取次 (i 1,2,, N ; k 1,2, n) 数必须给一个修正概率pik
不等概πPS抽样的实现
Sen-Midzuno抽样方法
大体思路 解决样本量超过2的麻烦,使πi近似地正比于Xi 实现步骤
1、以概率pi 抽取第一个样本单元
2、从剩下的N-1个单元中,抽取容量为n-1的简单随 机样本(不放回)
n 1 i pi (1 pi ) pi ( f很小时) N 1 n 1 N n n2 ij ( pi p j ) N 1 N 2 N 2
ij
不等概πPS抽样的实现
Durbin抽样方法
大体思路 第一次抽取概率正比于pi,调整第二次的抽取概 率,使总的入样概率正比于Xi
实现步骤
1、以概率pi pi 抽取第一个样本单元
2、取出第一个样本单元后不放回,当第一个样本 单元为U j时,以概率pi抽取第二个样本单元
不等概πPS抽样的实现
Xi 令pi , i 表示U i的入样概率 X pi (1 pi ) 1、以概率pi D 抽取第一个样本单元 (1 2 pi ) N N pi pi (1 pi ) 1 i 1,2,, N , D 1 2 1 2 p ( 1 2 p ) i 1 i 1 i i
n 2
2 n yi 1 2 ˆ n Y PPS n(n 1) i 1 p i
一般无放回不等概抽样比有放回效率高,但理论方 法麻烦复杂.实践中,N较大,f 不太大时,均利用上述 定理进行估值和误差计算. 无放回PPS抽样的实现:在前面方法中去掉重复单 元即可.
不等概πPS抽样的实现
实现步骤
2、取出第一个样本单元后不放回,当第一个样本 单元为U j时,以概率pi抽取第二个样本单元 pi pi (i j ) 1 p j
i 2 pi
Ui ,U j同时入样的概率为:
2 pi p j D (1 pi p j ) (1 2 pi )(1 2 p j )
1 1 pi pi 1 2 p 1 2 p i j 1 1 pk k j 1 2 pk 1 2 p j
N
,i j
i 2 pi
Ui ,U j同时入样的概率为:
pi p j 1 1 ij D 1 2 pi 1 2 p j
ˆ v1 Y HT
i 1

n
(1 i )

2 i
n
y 2
2 i i 1 j i
i j
n
n
( ij i j )
i j ij
2
yi y j
ˆ v2 Y HT
i 1 j i

n

ij yi y j ij j i
例题与练习
练习1 某部门要了解所属8500家生产企业当月完 成的利润,该部门手头已有一份去年各企业完成产 量的报告,将其汇总得到所属企业去年完成的产量 为3676万吨。考虑时间因素,准备采用抽样调查来 推算当月完成的利润。根据经验,企业的产量和利 润相关性较强,且企业的特点是规模和管理水平差 异比较大,通常大企业的管理水平较高,因此采用 与去年产量成比例的pps抽样,从所属企业中抽出 一个样本量为30的样本。估计当月的利润及其标准 差。 练习2 某企业欲估计上季度每位职工的平均病假天 数。该企业共有8个分厂,现用pps抽样抽取三个分 厂为样本,并以95%的置信度计算其置信区间。
Xi pi Xi NM
PPS抽样的实现方法
目录抽样
X 1、计算抽样间隔 K (假定K为整数); n
2、从{ 1,2, … , K }抽取随机数R1,由K确定R2=R1+K, R3=R1+2K,…,Rn=R1+(n-1)K ; 3、根据Ri所在位置确定入样单元:
Ri [1,2, , X 1 ]时,U1入样
实现步骤
1、设总体有N nM k (0 k n)个单元,将总体随机 分成n个群,k个群有M 1个单元,n k个群有M个单元
2、在每一群中,以正比于规模测度的概率抽取一个 单元,每群一个单元组成样本量为n的样本
在第t群中,抽中单元U i的概率为: Xi ,U i 属于t群 pti Z t U i不属于t群 0,
例题与练习
例3 一村庄有8个果园,分别有果树50,30,65, 80,140,44,20,100棵,要调查该村庄水果总 产量.如果实地调查得第 5,第8、第3号三个果园的 4 产量(单位:10 千克)分别为15,12,7,计算 该村八个果园的总产量的估计量和估计量的均方偏 差。再用简单估值法进行估计,并比较两个结果的 优劣。
例题与练习
练习1 设某个总体有N=10个样本,相应的单元大小 Mi及其代码数如表所示,用PPS法抽取一个n=3的 样本。
PPS抽样的估值法
定理3.1.1 在有放回PPS抽样下,
n yi 1 ˆ YPPS n i 1 pi
是总体总数Y Yi的无偏估计.该估计的均方偏差
i 1
N
为:
m 1 m m 1 Ri X j 1, X j 2, , X j 时,U m 入样 j 1 j 1 j 1 i 1,2, , n, m 2,3,, N
例题与练习
例1 某县有32个乡,每个乡参加分配人口数如表, 要调查人均收入,用累积和法抽取8个乡作为样本.
PPS抽样的概念
PPS抽样的概念
Probability proportion to size. 各单元被抽取的概率正比于规模测度
pi X i , 一般 pi
Xi
X
i 1
N
i
每次抽取后放回抽中的单元再作下次抽取.
PPS抽样的实现方法
累积和法
1、求规模测度的累积和 X
X
i 1
N
i
2、对自然数集合{ 1,2, … , X }作有放回简单随机抽 样,根据抽得随机数a决定入样单元.若
a {1,2,, X1}, 则第一个单元入样
若a { X j 1, X j 2,, X j },
j 1 j 1 j 1 i 1 i 1 i
则第i个单元入样,i =2,3,…, N 3、重复2,直至抽得n个单元.
§3.1 PPS抽样 §3.2 不等概πPS抽样
§3.3 Rao-Hartley-Cochran 随机分群抽样
PPS抽样的概念 PPS抽样的实现方法 PPS抽样的估值法 最优规模测度
PPS抽样的概念
PPS抽样的使用背景
调查一城市企业的产值,各企业单位是抽样单元, 企业规模差异很大,有不同的资产. 调查某一地区小麦产量,以村为抽样单元,但各村 拥有的麦地面积不一样. 调查某商贸集团的销售额,以其下辖各超市为抽样 单元,各超市的销售人员数量不等。
最优规模测度
Yi 1 ˆ 要使V (YPPS) pi Y 达到最小,有: n i 1 pi
N 2
X i Yi
可见,应利用与Yi 近似于正比例的变量X i 作规 模测度.
一般,选择合适的规模测度可提高估计精度.
不等概πPS抽样的概念 不等概πPS抽样的实现 估值法
Z t为第t群全体单 元规模测度之和
估 值 法
定理3.3.1 在上述随机分群抽样下,记第t群抽出的样本 单元为yit , 其对应的抽取概率为ptit , 则估计量 n y ˆ it Y RHC t 1 ptit
为总体总数Y的无偏估计.该估计的均方偏差为
Yi n 1 k (n k ) 1 ˆ V (YRHC ) 1 pi Y N 1 N ( N 1 ) n p i 1 i
i 即:pi pik
k 1
n

抽样次数较多时,确定修正概率很麻烦,通常将 总体分成许多层,在每层使用样本量为2的πPS 抽样
不等概πPS抽样的实现
Brewer抽样方法 (1963年由Brewer提出)
大体思路 设计好第一次抽取概率,令第二次抽取概率正比 于pi,使总的入样概率正比于Xi 实现步骤
v1 , v2可能取负值 1973 年Rao与Singh通过大量模拟,发现 v2 较稳定
且较少负值 .
例题与习题
• 例:假设有5个居委会,每个居委 会的住户数X已知,但常住居民人 数Y未知,从这5个居委会抽出2个 来估计常住居民的总人数。
实现方法
估值法
实 现 方 法
大体思路
将总体随机分成n个群,从每个群中以正比于规模 测度的概率抽取一个单元,组成容量为n的样本
N
2
其中pi X i
X
i 1
N
i
估 值 法
定理3.3.2 在上述随机分群抽样下,估计的均方偏差 ˆ )有一个无偏估计 V (Y
yit ˆ Y RHC pi t 其中pit 是样本单元yit 对应的总体中正比于规模测度的概 ˆ ) N k (n k ) Nn Z t v(Y RHC N 2 (n 1) k (n k ) t 1 X
i

i 1 j 1 j i
N
N
( ij i j )
i j
2
YiY j
Yi Y j ˆ V YHT i j ij i 1 j i j i

N
估值法
定理3.2.2 对πPS抽样,当 i (i 1,2,, N ), ij (i j )均 不为0时,HT估计的均方偏差的两个 无偏估计量为
相关文档
最新文档