抽样技术7不等概率抽样资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例:假设有10个乡,每个乡的村庄数不同,按pps抽3个乡
乡 村庄数Mi 累计 代码
1
5
5
1~5
2
28
33 6~33
3
26
59 34~59
4
14
73 60~73
5
10
83 74~83
6
38
121 84~121
7
7
128 122~128
8
50
178 129~178
9
2
180 179~180
10
8
188 181~188
(有可能重复,只调查一次,但计算时按重复数计算)。
放回不等概率抽样实施方法
1.代码法
单元i 1 2
N
单元大小M i M1 M2
MN
代码
1,2, M1 M1 1,M1 2, ,M1 M2
N1
N1
N1
M j 1, M j 2, , M j MN M0
j1
j1
j1
在PPS抽样中,赋予每个单元与Mi相等的代码 数,将代码数累加得到M0,每次抽样都等概产 生一个[1,M0]之间的随机数,设为m,代码m 所对应的单元被抽中。
不等概率抽样的分类
放回不等概抽样:按照总体单元的规模大小来确定在每次抽 中的概率。抽取后放回总体,再进行下一次抽样,每次抽
样都是独立的。这种抽样称为放回不等概抽样(sampling with probabilities proportional to sizes,简称PPS抽样)
• 不放回的不等概抽样:每次在总体中对每个单元按入样概 率进行抽样,抽出的样本不再放回总体,因此,在抽取了 第一个单元后,余下的单元再以什么概率被抽取就较复杂。 这种抽样不是独立的,无论是抽样方法还是方差估计,都 要比放回抽样繁复得多。不放回抽样通常称为πPS抽样。
第七章 不等概抽样
•放回不等概率抽样 •不放回不等概率抽样 •利用软件进行抽样和计算 •案例分析
第一节 不等概率抽样概述
一、不等概率抽样的必要性 1、在简单随机抽样中,总体(或层)中的每个单 元入样的概率都相等。等概率抽样的特点是总 体中的每个单元在该总体中的地位(或重要性) 相同,在抽样时对每个单元采取的是“不偏不 倚”的态度 。等概率抽样不仅实施简单,而且 相应的数据处理公式也简单。但是在许多实际 问题中,我们还需要使用不等概率抽样
6
放回不等概抽样
PPS抽样:有放回的不等概抽样
设总体包含N 个单元,M i是第i个单元的大小或规模的度量,
N
i 1,L ,N,总体的总规模度量为:M0 Mi i 1
则第i个单元的抽选概率为:Zi
Mi M0
0,
N i 1
Zi
1
即抽样概率正比于规模度量,一次抽完后再放回,进行下
一次抽取。独立地进行这样的抽样n次,共抽到n个单元
7
10
100
631 532~631
8
3.6
36
667 632~667
9
6
60
727 668~727
பைடு நூலகம்
10
1.1
11
738 728~738
=73.8
738
假设在[1,738] 中等概产生第一个随机数为354,再在[1,738]中产生第二 个随机数为553,最后在[1,738]中产生第三个随机数为493,则它们所对 应的第5,7,6号单元被抽中。
M
则重抽。
a
第i个单元被抽中的概率:
zi
=p{a=i,b
Mi
}=p{a=i}
p{b
Mi
}=
1 N
.
Mi M
显然,z i
Mi
拉希里法抽样举例:
例5.1中,M=150,N=10.在[1,10],[1,150] 中分别产 生( i,m)如下: 第一次 (3,121) , M3=15<121, 舍弃,重抽 ; 第二次(8,50),M8=36<50, 舍弃,重抽 ; 第三次 (7,77) , M7=100>77, 第7号单元入样; 第四次(5,127),M5=78<127, 舍弃,重抽 ; 第五次 (4,77), M4=137>77, 第4号单元入样; 第六次(9,60),M9=60≥60, 第9号单元入样; 因此第4,7,9号单元被抽中。
例5.1 设某个总体有10个单元,相应的单元大小及其代码 数如下表,在其中产生一个n=3的样本。
i
Mi
Mi*10
累计
代码
1
0.6
6
6
1~6
2
14.5
145
151
7~151
3
1.5
15
166 152~166
4
13.7
137
303 167~303
5
7.8
78
381 304~381
6
15
150
531 382~531
不等概率抽样的特点
3、抽样框的创建比简单随机抽样和系统抽样成本 高,更复杂,因为需要存储总体中每一个单元 的度量大小;
4、并非在任何情况下都能使用,因为并不是每一 个总体都有稳定且与主要调查变量相关的有关 大小或规模的度量;
5、抽样及估计(特别对不放回抽样)相当复杂; 6、 当单元大小度量不准确或不稳定时不适用。
(sampling with unequal probabilities)。
不等概率抽样概述
2、抽样单元在总体中所占的地位不一致:例 如:要反映某小麦品种的优良情况,以村作 为抽样单位,但各村的种植面积不同,一些 种植面积大的村庄在抽样中是否被抽中对推 断总体的结果有很大影响 ,所以让“大单元” 被抽到的概率大,“小单元”被抽到的概率 小,这样能够大大提高样本的代表性,减少 抽样误差。
放回不等概率抽样对总体特征的估计
三、Hansen-Hurwitz(汉森-郝维茨)估计量及其性质:
样本单元被抽中的概率z1,L ,zn ,则对总体总量Y的估计是
YˆHH
1 n
n i 1
yi zi
(1)E(YˆHH ) Y
(2)V (YˆHH )
1 n
N i 1
Z
i
(
Yi Zi
Y )2
(3)v(YˆHH
结合一下整群抽样、 多阶段抽样
放回不等概率抽样实施方法
2.拉希里法(二次抽取法)(统计学家Lahiri最先提出):
设 M1, M2,…MN为单元的规模
令M max 1i N
Mi
每次从1,N 中简单随机地抽取一随机数a,
同时再独立从1,M 中简单随机地抽取一随机数b。
若b
M
a
,
则第a个单元入样,若b
不等概率抽样的特点
1、凡需使用不等概率抽样的场合,必须提供总体单 元的某种辅助信息。 例如:每个单元的“大小”度量Mi。注意:比估计 和回归估计是估计方法用到了辅助信息,本章是抽 样方法用到辅助信息.
2、不等概率抽样的主要优点是由于使用了辅 助信息,提高了抽样策略的统计效率, 能 显著地减少抽样误差。