抽样技术 7 不等概率抽样.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
令M max M i
1i N
每次从 1,N 中简单随机地抽取一随机数a, 同时再独立从 1,M 中简单随机地抽取一随机数b。 若b M a , 则第a个单元入样,若b M a则重抽。 第i个单元被抽中的概率: 1 Mi zi =p{a=i,b M i }=p{a=i} p{b M i }= . N M 显然,zi M i
第四次(5,127),M5=78<127, 舍弃,重抽 ; 第五次 (4,77), M4=137>77, 第4号单元入样; 第六次(9,60),M9=60≥60, 第9号单元入样; 因此第4,7,9号单元被抽中。
放回不等概率抽样对总体特征的估计 三、Hansen-Hurwitz(汉森-郝维茨)估计量及其性质:
6
放回不等概抽样
PPS抽样:有放回的不等概抽样
设总体包含N 个单元,M i是第i个单元的大小或规模的度量, i 1, ,N,总体的总规模度量为:M 0 M i
i 1 N Mi 则第i个单元的抽选概率为:Z i 0, Z i 1 M0 i 1 N
即抽样概率正比于规模度量,一次抽完后再放回,进行下 一次抽取。独立地进行这样的抽样n次,共抽到n个单元 (有可能重复,只调查一次,但计算时按重复数计算)。
727 738
632~667
668~727 728~738
假设在[1,738] 中等概产生第一个随机数为354,再在[1,738]中产生第二 个随机数为553,最后在[1,738]中产生第三个随机数为493,则它们所对 应的第5,7,6号单元被抽中。
例:假设有10个乡,每个乡的村庄数不同,按pps抽3个乡 乡 1 2 3 村庄数Mi 累计 5 5 28 26 33 59 代码 1~5 6~33 34~59 结合一下整群抽样、 多阶段抽样
不等概率抽样概述
2、抽样单元在总体中所占的地位不一致:例 如:要反映某小麦品种的优良情况,以村作 为抽样单位,但各村的种植面积不同,一些 种植面积大的村庄在抽样中是否被抽中对推 断总体的结果有很大影响 ,所以让“大单元” 被抽到的概率大,“小单元”被抽到的概率 小,这样能够大大提高样本的代表性,减少 抽样误差。
不等概率抽样的特点
3、抽样框的创建比简单随机抽样和系统抽样成本 高,更复杂,因为需要存储总体中每一个单元 的度量大小; 4、并非在任何情况下都能使用,因为并不是每一 个总体都有稳定且与主要调查变量相关的有关 大小或规模的度量; 5、抽样及估计(特别对不放回抽样)相当复杂; 6、 当单元大小度量不准确或不稳定时不适用。
4
5 6 7 8
14
10 38 7 50
73
83 121 128 178
60~73
74~83 84~121 122~128 129~178
9
10
2
8
180
188
179~180
181~188
放回不等概率抽样实施方法 2.拉希里法(二次抽取法)(统计学家Lahiri最先提出): 设 M1, M2,…MN为单元的规模
不等概率抽样的特点
1、凡需使用不等概率抽样的场合,必须提供总体单
元的某种辅助信息。 例如:每个单元的“大小”度量Mi。注意:比估计 和回归估计是估计方法用到了辅助信息,本章是抽 样方法用到辅助信息.
2、不等概率抽样的主要优点是由于使用了辅
助信息,提高了抽样策略的统计效率, 能 显著地减少抽样误差。
拉希里法抽样举例: 例5.1中,M=150,N=10.在[1,10],[1,150] 中分别产 生( i,m)如下: 第一次 (3,121) , M3=15<121, 舍弃,重抽 ; 第二次(8,50),M8=36<50, 舍弃,重抽 ;
第三次 (7,77) , M7=100>77, 第7号单元入样;
累计 6 151
代码 1~6 7~151
3
4 5 6 7
1.5
13.7 7.8 15 10
15
137 78 150 100
166
303 381 531 631
152~166
167~303 304~381 382~531 532~631
8
9 10
3.6
6 1.1 =73.8
36
60 Fra Baidu bibliotek1 738
667
在PPS抽样中,赋予每个单元与Mi相等的代码 数,将代码数累加得到M0,每次抽样都等概产 生一个[1,M0]之间的随机数,设为m,代码m 所对应的单元被抽中。
例5.1 设某个总体有10个单元,相应的单元大小及其代码 数如下表,在其中产生一个n=3的样本。
i
1 2
Mi
0.6 14.5
Mi*10
6 145
不等概率抽样的分类
放回不等概抽样:按照总体单元的规模大小来确定在每次抽 中的概率。抽取后放回总体,再进行下一次抽样,每次抽 样都是独立的。这种抽样称为放回不等概抽样(sampling with probabilities proportional to sizes,简称PPS抽样) • 不放回的不等概抽样:每次在总体中对每个单元按入样概 率进行抽样,抽出的样本不再放回总体,因此,在抽取了 第一个单元后,余下的单元再以什么概率被抽取就较复杂。 这种抽样不是独立的,无论是抽样方法还是方差估计,都 要比放回抽样繁复得多。不放回抽样通常称为πPS抽样。
放回不等概率抽样实施方法 1.代码法
单元i 单元大小M i 1 2 N M1 M2 MN
代码 1, 2, M 1 M 1 1,M 1 2, ,M 1 M 2
M
j1
N 1
j
1, , M j 2, M j MN M0
j1 j1
N 1
N 1
第七章 不等概抽样
•放回不等概率抽样
•不放回不等概率抽样
•利用软件进行抽样和计算 •案例分析
第一节 不等概率抽样概述
一、不等概率抽样的必要性 1、在简单随机抽样中,总体(或层)中的每个单 元入样的概率都相等。等概率抽样的特点是总 体中的每个单元在该总体中的地位(或重要性) 相同,在抽样时对每个单元采取的是“不偏不 倚”的态度 。等概率抽样不仅实施简单,而且 相应的数据处理公式也简单。但是在许多实际 问题中,我们还需要使用不等概率抽样 (sampling with unequal probabilities)。