抽样理论与方法:不等概率抽样
(硕)《抽样技术》第三讲 等概率与不等概率抽样比较研究
三、严格的πPS抽样
n是固定的;一阶包含概率与单 是固定的; 位规模大小严格成比例, 位规模大小严格成比例,即
πi = nZi
1.当 n = 2 的情况下 1.当 布鲁尔估计法: 布鲁尔估计法: 要求: 要求:总体中最大的单位必须小 于全部单位大小总和的 1 2
记第一个被抽取的单位为i 记第一个被抽取的单位为i,第一个单位 成比例的概率抽取。 按与 Z i (1 − Z i ) 成比例的概率抽取。
设从总体中不放回地抽去 n 个 单位, 单位, 令 π i 为第 i 个单位入样的概率 (一阶包含概率). 一阶包含概率). π ij 为第 i 和第 j 个单位同时入 样的概率(二阶包含概率). 样的概率(二阶包含概率).
1. 霍维茨 汤普森估计量 霍维茨-汤普森 汤普森估计量
总体总值的估计量 X ˆ 估计量的方差为
2
( )
ˆ xi XHH M = ∑ m − M n ( n −1) i=1 i 0
第三节 不重复的 不等概率抽样
一、基本概念 1. πPS 抽样:不放回的与单元规模 抽样:
大小成比例的概率抽样称为严格的
πPS 抽样。 抽样。
2. 在不重复的不等概率抽样中,总 在不重复的不等概率抽样中, 体中的每个单位每次被抽中的概率 为 Zi 。
两个单位同时入样概率称为 二阶包含概率。 二阶包含概率。
包含概率的性质: 包含概率的性质:
(1)
∑π
i =1 N
N
i
=n = ( n − 1) π i
(2)
∑π
i≠ j N
ij
1 ∑∑i π ij = 2 n ( n − 1) (3) i =1 j >
N
抽样技术7不等概率抽样
抽样技术:7不等概率抽样1. 引言在进行数据分析和统计研究时,抽样是一种常用的技术。
抽样技术允许我们从总体中选择一个样本,以便推断总体的性质。
在抽样技术中,不等概率抽样是一种常见的方法,它允许我们以非均匀的概率抽取样本。
本文将介绍关于7种不等概率抽样方法的详细信息。
2. 简单随机抽样简单随机抽样是最根本的抽样方法之一,它要求每个个体被选中的概率相等且任意组合都是可能的。
然而,在某些情况下,简单随机抽样可能并不适用,例如当总体分布不均匀时,或者我们希望在样本中增加一定的多样性。
这时,我们可以考虑使用不等概率抽样方法。
3. 整群抽样整群抽样是一种不等概率抽样方法,它将总体划分为假设干个互不重叠的群组〔或称为簇〕,然后从每个群组中抽取样本。
整群抽样可以有效地减少抽样过程中的复杂性,并提高样本的效率。
整群抽样常用于调查社会群体或大型组织等场景。
4. 分层抽样分层抽样是一种根据总体特点进行划分的抽样方法,它将总体划分为假设干个层级或相似的子群〔层〕,然后从每个层中抽取样本。
通过分层抽样,我们可以保证样本在各层中的分布情况与总体相似,从而更为准确地推断总体的特征。
5. 系统抽样系统抽样是一种按照固定间隔选择样本的抽样方法。
它类似于简单随机抽样,但是通过定义一个间隔,我们可以按照一定的规律抽取样本。
例如,我们可以在总体中选取每隔一定数量的个体作为样本。
系统抽样在样本大小较大时表现出较高的效率。
6. 按比例分层抽样按比例分层抽样是一种常用的不等概率抽样方法,它根据总体各层的比例确定各层的样本容量。
比例分层抽样可以使得样本在各层中的分布与总体的比例相对应。
这种抽样方法适用于总体中的各个层存在不同比例的情况。
7. 两阶段抽样两阶段抽样是一种复杂的不等概率抽样方法,它将抽样过程分为两个阶段。
在第一阶段,我们从总体中选择一局部群组〔或称为簇〕,在第二阶段,我们从每个群组中抽取一定数量的样本。
两阶段抽样适用于总体较大或分布复杂的情况下,可以提高抽样的效率。
不等概率抽样的概念和特点
(1)将总体单元按规模分层,对较大单元的层抽样比高一些,特大层的 抽样比甚至可以100%,而较小单元的层抽样比低一些。
(2)采用不等概抽样来减少抽样方差,即赋予每个单元与其规模成比例 的入样概率,然后在估计中采用不同的权数来进行弥补。
分层抽样:抽样选择概率小的单位会有较 高的权数。
n
N
Wi yi n
yi
又如,对于霍维茨——汤普森估计量
YˆHT
yi
i
在入选概率与规模成比例条件下,
的性质为
i
i
nZi
则
YˆHT
n
yi nZ i
1 n
n
yi Zi
YˆHH
πPS抽样的实施
n=2条件下严格的πPS抽样
布鲁尔方法 德宾方法
n >2条件下严格的πPS抽样
inijninn???1?????ininiihtywyy??????iiw?1?n固定条件下的包含概率第i单位入样概率第ij单位都入样概率21kin1in1inikkikiik2iiiyyy1?kkininikiikkihtyyyv???????????????????????????????????????sskkkii2is2iiyy2y1?iikikkiihtyv?????????kkiiik2sksk?kkiiiiikikkihtyyyv??????????????2?jjiinijijjinhtyyy????????????hty?是y的无偏估计i1ji?hty?是?htyv的无偏估计hhy?ppshty?ps其他公式在某种程度上可用这两个公式表现
2拉希里方法
不需要累计,两次随机数决定抽中的单位。 第一次:1-N之间的随机数i 第二次: 1-maxM之间的随机数m 如果Mi> m,第i个单位被抽中
抽样调查:不等概率抽样
总体单元 Yi 规模测度 Mi 0. 在抽取样本单元时,各单元被抽取的概率正比于Mi .
有放回PPS 抽样是常见的一种不等概率抽样方案。每次抽取,第i
单 元Yi 被 抽 中 的 概 率p i
正
比
于
M
响,只有 Mi m时它才入样,因此第 i 个单元入样的概率与
Mi的大小成正比,此时 Zi Mi M0
二、估 值 法
PPS抽样法的估值法的理论依据
定理3.1.1 在有放回PPS抽样下,
是总体总数Y
N
Yi
Yˆ PPS
的无偏估计.
பைடு நூலகம்
1 n
n
i 1
yi pi
i 1
( pi为第i个样本单元yi时的抽取概率,而不是总体中第i单元对应的抽取概率.)
i j ij
j
) yi
yj
,
v2 ( YˆHT
)
Nn
( i
j
ij
i1 ji
ij
) (
yi
i
yj
j
)2 .
注:两估计量均有可能取负值,通过模拟比较,v2较稳定且
较少取负值。
§3.3 Rao-Hartley-Cochran随机分群抽样
拉奥-哈特利-科克伦(1962)
设总体个体单元总数N nM k( 0 k n ) 1. 将总体随机分成n个群 其中k个群有M 1个个体单元,n k个群有M个个体单元; 2. 在每一个群中,以正比于规模测度的概率抽取一个单元 作为样本单元。
估计的均方偏差为:
V(Yˆ PPS
)
《抽样技术》第三讲 等概率与不等概率抽样比较研究[学习课堂]
ij
n 1 N 1
N N
n 2
Zi*
Z
* j
n N
2 n
课件类别
27
2)布鲁尔法
样本单位是逐个抽取的.令
Zi
1 n
设第一个单位按与 例的概率抽取。
Zi 1 Zi
1 nZi
成比
剩下的n-1个单位按与 成比例的概率抽取
Zi 1 Zi 1 n r 1
Zi
,
因为 i nZi ,
r 2,3,L , n
B.按单位规模的大小决定入样的概 率,使规模大的单位入样概率大, 规模小的单位入样概率小。
课件类别
3
2)群大小不等的整群抽样 3)初级单位大小不同的阶段
抽样
4)等距抽样中的应用
课件类别
4
3. 优点与不足
1)优点:
比较有效地解决调查的总体单位 与抽样的总体单位不一致、调查 单位在总体中所占的比重不一致 的问题。
?布鲁尔方法的包含概率为??112iiizzz??1jizz?2iiz????????1411212112ijijijniijiizzzzzzzz????????????????23课件类别令?可以写成??1112niiiizzdz?????ij?????1212111212ijijijijijijzzzzdzdzzzdzz?????????????????24课件类别总值估计?方差估计耶茨格伦迪森121212121?2bxxxxxzz??????????????21212121212?ygsbxxvx???????????????25课件类别2
第一个单位按 Zi 的概率抽取;
Zj
第二个单位按 1 Zi 的概率在余
下的N-1个单位中抽取;
07-第七章 不等概率抽样
(7.4)
(7.5)
5
3. 若 n > 1 ,则
ˆ )= v(Y HH
n æ yi ˆ 1 ç - YHH å n(n - 1) i =1 ç è zi
ö ÷ ÷ ø
2
(7.6)
ˆ ) 的无偏估计。 是 V (Y HH ˆ 的 在证明上述性质以前,我们先就 PPS 抽样这种特殊情形,说明 Y HH
*
[1,24] 中的一个随机数为 9,由于 M 4 = 6 < 9 ,因此需要重抽。设第二次抽
到的一组随机数为 (7,15) ,则仍然不满足要求,还需要抽。若再次抽到的随 机数组为 (2,8) ,则由于 M 2 = 10 > 8 ,故第 2 个单元被抽中。如此重复直 到抽到 n 个单元(允许重复)为止。 拉希里法适用于 N 很大的情况,因为它不需要列出如表 7.1 这样的表。 7.2.3 汉森——赫维茨估计量及其性质 对于 多 项 抽样,由于抽样是不等概率的,每个样本单元的 观测 值 ,因此对于总体参数的估计与等概率抽样 y1 , y 2 , , y n 就不再是“平等的” 不同。前已提到,这个估计也与样本单元 Z i 的取值 z1 , z 2 , , z n 有关。汉森 ——赫维茨(Hansen-Hurwitz)提到的对总体总和 Y 的估计如下:
Mi
8 10 17 6 24 9 5 7 4 10
累计 M i 8 18 35 41 65 74 79 86 90 100
代码 1~8 9~18 19~35 36~41 42~65 66~75 76~79 80~86 87~90 91~100
M 0 = 100
在 [1,100] 范围内产生 5 个随机数,设分别为 04,73,25,49 及 82,则 第 1,第 6,第 3,第 5 及第 8 个单元即为抽中的单元。如果我们欲再增加 一个样本单元,产生的随机数为 58,则又对应第 5 个单元,这个单元即为 抽中两次。由于单元愈大,被赋予的代码数就愈多,因此每个单元入样的概
不等概率抽样的方法的应用研究
不等概抽样方法的应用研究99统计992137 石磊【内容摘要】在抽样调查中,不等概抽样是一个重要的内容,如一个地区商场销售额总额的估计,由于大商场与小商场的销售额差异巨大,因此,大商场与小商场不能同等对待。
这时使用不等概率抽样方法可以很好的提高估计值得精度。
在整群抽样或多阶抽样中,常采用不等概抽样,在实际问题中,很少采用一种抽样方法,而常常采用是几种抽样方法有机结合,最常见的方案为多阶不等概抽样。
【关键词】不等概抽样,PPS,πPS,二阶段抽样。
【ABSTRACT】In sample investigation, sample with unequal probabilities is one important content, such as one regional market sales amount estimation of total value, Because emporium and little sales amount of market difference enormous, so, the emporium and little market can put on an equal footing . Use the sampling with unequal probabilities method can kind improvement estimate precision of deserving very at this moment. Besides, in overall to go on and when sampling, go on when sampling to a certain all residence of city to some, To have more very much the same residences in such aspects as economy different block of city this. If use one steps sample, not only trouble, but also the precision estimated is poor.【KEY WORDS】sampling with unequal probabilities PPSπPS two-stage sampling一、不等概抽样的理论基础(一)不等概抽样的概念等概抽样是指总体中的每个单元具有同样的入样概率的随机抽样。
三阶段不等概率抽样设计
三阶段不等概率抽样设计
三阶段不等概率抽样设计是一种常用的抽样方法,用于从整体群体中选择代表性样本。
它将样本选择过程分为三个阶段,每个阶段的概率不等,具体步骤如下:
1. 第一阶段:按照一定的抽样概率,从总体中选择第一阶段的样本单元。
这可能涉及到某些抽样单元的非选择或重复选择,以达到样本的多样性。
2. 第二阶段:在第一阶段选择的样本单元中,按照一定的概率再次进行抽样,选择第二阶段的样本单元。
这个阶段的抽样概率可能与第一阶段有所不同,以达到更好的样本覆盖和精度。
3. 第三阶段:在第二阶段选择的样本单元中,按照一定的概率再次进行抽样,选择最终的样本个体。
同样,这个阶段的抽样概率可能与前两个阶段有所不同。
通过三阶段不等概率抽样设计,可以灵活地选择样本单元,并通过控制抽样概率来保证样本的代表性和可靠性。
这种设计方法在实际应用中可以更好地适应不同的调查需求和场景,提高样本选择的效果。
抽样技术7不等概率抽样
M0
M2 0
例 某企业欲估计上季度每位职工的平均病假天数。该 企业共8个分厂,现用不等概整群抽样拟抽取3个分厂, 并以置信度95%计算其置信区间。
分厂编号
职工人数 Mi
累积区间
1
1200
1-1200
2
450
1201-1650
3
2100
1651-3750
4
860
3751-4610
5
2840
4611-7450
17 21
15.00 1045 22*
12.30 220 23
3.86 4600 24 15.80 2370 25
9.00 21.00
940 26 640 27
mi
yi
1.50
10
8.00
80
28.42 13672
9.01 3845
0.75
480
5.00 28.43
311 9284
9.97
842
5.20
放回不等概率抽样对总体特征的估计
三、Hansen-Hurwitz(汉森-郝维茨)估计量及其性质:
样本单元被抽中的概率z1, ,zn ,则对总体总量Y的估计是
YˆHH
1 n
n i 1
yi zi
(1)E(YˆHH ) Y
(2)V (YˆHH )
1 n
N i 1
Zi
(
Yi Zi
Y )2
(3)v(YˆHH )
其中第2、19号被抽中两次
解:根据题中所给资料,n=30,M0=9542, 利用汉森-郝维茨估计量,则有:
YHH
1 n
n 1
yi M 0 zi n
抽样调查方法与技术:不等概率抽样
二、PPS抽样的实施
1、代码法: 为什么说与规模大小成比例? 第i个单位包含的代码个数与其规模Mi相等,
每次抽取产生的随机数假设在1—M0之间均 匀分布,很显然代码个数越多的单位(规模越 大的单位)被抽中的可能性越大。
(抽中的概率早已确定:Mi/M0。)
i
Mi
1 3.84 2 0.68 3 4.63 4 0.49 5 7.18 6 1.28 7 7.01 8 7.42 9 8.80
第一节 问题的提出
一、不等概率抽样的必要性 (P137-138,不等概率抽样运用的两种情形
:) ①需要估计总体总量,但总体单元规模相差很
大的情形; ②由于种种原因不能直接对基本的较小单元抽
样的情形。
第一节 问题的提出
二、不等概率抽样的分类 (一)放回不等概率抽样
所谓放回不等概率抽样是指,在抽样之前 就给总体中每个单位赋予一个确定的抽取概 率,在放回抽样的每一次抽取中,每个单位 被抽中的概率都不变(概率不变,不是概率 相等),直到抽够n个样本单位为止。
(二)不放回不等概率抽样
由于每次抽取采用不放回的形式,样本中 不会出现重复的单位,抽样效率比放回形式 的高,但同时也由于各次抽取相互不独立, 所以无论抽样的实施还是目标量及其方差的 估计都比放回形式复杂。不放回不等概率抽 样方法中,最重要最常用的是样本量固定, 总体中每个单位的入样概率与单位的规模大 小严格成比例的抽样。(πps)
第二节 放回不等概率抽样
一、多项抽样与PPS抽样 P139
设总体包含N个单位,在放回抽样的每一次 抽取中,抽到第i个单位的概率为Zi ( 0≤Zi≤1;i=1,2,…,N) 且 ,按此规定 有放回地独立抽取n次,共抽到n个单位(有 可能重复),称这样的抽样为多项抽样 (Multinomial Sampling)。
不等概率抽样问题的研究
不等概率抽样问题研究目录摘要 (1)1 不等概率抽样方法的介绍 (2)1.1 不等概率抽样估计的定义 (2)1.2 不等概率抽样 (2)1.2.1 放回不等概率抽样 (2)1.2.2 不放回不等概率抽样 (5)2 结论 (9)谢辞 (11)参考文献 (12)不等概率抽样问题研究李娟指导教师:苗刚摘要:在实际抽样中,我们常常遇到很多不同的情况,对于不同的情况我们也会采用不同的抽样方法进行研究。
常用的抽样方法主要有等概率抽样与不等概率抽样。
本文将针对不等概率抽样问题进行研究。
关键词:抽样;不等概率;样本;指标在现实生活中,由于现实的局限性,我们常常需要对总体进行抽样估计,抽样估计的方法也是多种多样。
在实际运用中,我们常常会发现运用等概率抽样方法来对总体指标进行估计时会出现单位均值估计不足的缺陷,那么我们应该如何改变这种现状,以提高抽样估计的效率呢?随着抽样调查在我国应用领域的不断扩展,很多学者对于抽样调查中等概率抽样估计的不足提出了建议。
他们提议如果我们运用不等概率抽样方法对总体指标进行估计,那么这些问题将迎刃而解。
1 不等概率抽样方法的介绍1.1 不等概率抽样估计的定义不等概率抽样估计,也就是大单位赋予大的入样概率,小单位赋予小的入样概率,入样概率一般与单位规模大小成正比。
1.2不等概率抽样方法的分类不等概率抽样方法按不同的分类方法可以分成许多不同的类型。
但最主要的分类方法是按抽样过程中被抽到的单位是否被放回总体中进行分类,分为放回不π。
等概率抽样)psPPS和不放回不等概率抽样()(抽样抽样1.2.1 放回不等概率抽样所谓放回不等概率抽样,是指在抽样之前就给总体中每一个单位赋予一个确定的抽样概率,在放回抽样的每一次抽取中,每个单位被抽中的概率都不变,直到抽够n个样本单位为止,对于放回不等概率抽样,由于每次抽取时总体的分布都不变,所以各次抽取是相互独立的,因此,无论抽样的实施,还是目标量的估计,都特别简单,这是这种抽样方法的最大优点。
概率抽样和非概率抽样
什么是概率抽样?什么是非概率抽样?概率抽样和非概率抽样的区别是什么?概率抽样:又称随机抽样。
概率抽样以概率论和数理统计为依据,通过随机化的机械操作程序随机取得样本,所以能避免抽样过程中的人为因素的影响,保证样本的客观性。
虽然随机样本一般不会与总体完全一致,但它所依据的是大数定律,而且能计算和控制抽样误差,因此可以正确地说明样本的统计值在多大程度上适合于总体,根据样本调查的结果可以从数量上推断总体,也可在一定程度上说明总体的性质和特征。
现实生活中绝大多数抽样调查都采用概率抽样方法来抽取样本。
概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。
概率抽样主要分非概率抽样又称为不等概率抽样或非随机抽样,是指抽样时不遵循随机原则,而是按照研究人员的主观经验或其他条件来抽取样本的一种抽样方法,也就是说在抽样时,总体单元的入样概率事先未知,入样与否与研究人员的经验和主观意志有很大关系。
因此,由于不是严格按随机抽样原则来抽取样本,所以非概率抽样在应用时更需研究人员具备深厚的背景知识与相关经验。
它不是严格按随机抽样原则来抽取样本,所以失去了大数定律的存在基础,也就无法确定抽样误差,无法正确地说明样本的统计值在多大程度上适合于总体。
虽然根据样本调查的结果也可在一定程度上说明总体的性质、特征,但不能从数量上推断总体。
常用的非概率抽样有方便抽样、定额抽样、立意抽样、雪球抽样等。
1.方便抽样:又称偶遇抽样。
在这种抽样中,研究者选择那些最容易接近的人作为研究对象。
此法常用于干预试验或预调查时,也可用于调查收尾时补缺。
2.立意抽样:又称目的抽样和判断抽样。
根据研究目的的需要和研究者的主观判断,选择研究对象。
3.雪球抽样是指选择并调查几个具有研究目的所需要的特征的人,再依靠他们选择合乎研究需要的人,后者又可选择更多合乎研究需要的人,以此类推下去,样本就像滚雪球一样越来越大。
喀什师范学院笔记抽样调查的原理与方法第八章不等概率抽样
对于一般的多项抽样,总可以找到某个 M 0 ,使所有
的
M
0
Z
成为整数。每个单位赋予与相应
i
M0Zi
相等的
代码数,然后进行抽样。
13
(二)希里(lahiri)法
令
M
*
max{M
1i N
i
}
,即 M *为所有 Mi 中的最大值,每
次从N [1,N ]范围内抽取一个随机整数 i ,从 [1,M * ]
码数,将代码数累加得到 M 0,每次抽取都产生一个
单[1 ~位M拥0]有之的间代的码随数机,数则,第设个为jm单,位若入代样码。m重属复于n第次j这个
样的过程,就可得到由 n 个单位(存在重复的可能)
组成的 PPS 样本。如果在实际中存在 M i 不是整数的
情况,则可以乘以一个倍数,使所有的 v 都成为整数。
汉森(Hansen)—赫维茨(Hurwitz)给出如下估计
量:
பைடு நூலகம் YˆHH
1 n n i 1
yi zi
(6.4)
15
对于 PPS 这种特殊形式的不等概率抽样,YˆHH的
直观意义是明显的。由于
zi
mi
/
M
,代入(6.4)式,
0
有
YˆHH
M0 n
n yi i 1 mi
16
汉森—赫维茨估计量 YˆHH具有如下性质:它是总
成比例的概率抽样(sampling with probability proportional to
size),简称 PPS抽样。
11
二、实施方法 多项抽样是最简单的不等概率抽样,其实 施方法通常有两种: (一)代码法 (二)希里(lahiri)法
抽样技术不等概率抽样
抽样技术:不等概率抽样引言在统计学和数据分析中,抽样技术是一项重要的工具,用以从总体中选择一部分元素进行研究。
而抽样技术的核心就是如何从总体中选取样本,以保证样本能够准确地反映总体的特征。
其中一种常用的抽样技术是不等概率抽样。
不等概率抽样是指在抽取样本时,各个个体被选中的概率不相等。
与等概率抽样相比,不等概率抽样更能满足实际问题的需求,更能提高样本的效率和精确性。
本文将介绍不等概率抽样的原理、常用方法以及应用案例,希望能够帮助读者更好地理解和应用抽样技术。
不等概率抽样的原理不等概率抽样的原理基于概率论和统计学的基本原理。
在进行不等概率抽样时,需要根据总体的特征和研究目的,选择合适的抽样方法和样本选择概率,以使样本能够准确地反映总体。
不等概率抽样的核心在于赋予每个个体被选中的概率,也称为抽样概率。
抽样概率可以根据总体特征和研究目的进行选择,常见的选择方法包括:概率比例抽样、系统抽样、整群抽样等。
概率比例抽样是一种根据个体在总体中所占比例来确定抽样概率的方法。
具体而言,可以先计算出样本所需的个体数目,再根据各个个体在总体中的比例,分配相应的抽样概率。
这样可以保证样本能够按比例反映总体的特征。
系统抽样是一种按照一定规律选择样本的方法。
具体而言,可以在总体中确定一个起始点,然后以固定的间隔选择样本个体。
系统抽样具有简单方便、无需随机表和随机数的优点,常用于总体具有周期性分布的情况。
整群抽样是一种将总体划分为若干群体,然后随机选择部分群体进行抽样的方法。
这种方法适用于总体分布不均匀,但各群体内部相对均匀的情况。
通过整群抽样,可以减小样本误差,提高样本的代表性。
不等概率抽样的常用方法不等概率抽样有多种不同的方法和技术,根据实际问题的需求和样本特征的不同,可以选择合适的抽样方法。
以下将介绍几种常用的不等概率抽样方法。
简单随机抽样是不等概率抽样中最基本的方法之一。
简单随机抽样是指每个个体都有相等的被选中概率,且个体间的选择是相互独立的。
抽样理论和抽样方法的研究
抽样理论和抽样方法的研究1. 引言在现代社会的各个领域中,数据的收集与分析已经成为了必不可少的工作内容。
为了能够更加准确地收集数据并进行统计分析,抽样理论和抽样方法这一研究方向得到了越来越广泛的关注。
因此,本文将从抽样理论和抽样方法这两个方面进行深入研究。
2. 抽样理论2.1 抽样的概念抽样是指在总体中,按规定的方式从中选取一个部分来进行研究,并且在对部分数据进行分析后,再以此来对总体作出评价和判断。
抽样理论是对抽样行为进行研究的学科,主要涉及到以下几个方面:单纯随机抽样、比率估计、方差分析等。
2.2 抽样误差在进行抽样时,难免会出现一定的抽样误差。
抽样误差又分为抽样偏差和抽样波动。
抽样偏差是指由于样本与总体之间的差异,导致样本研究结果与总体真实情况有所偏差;而抽样波动则是指同样的样本可能得到不同的研究结果,导致研究结论的不确定性。
2.3 抽样分布在进行样本研究时,需要对样本数据进行统计分析。
此时我们需要了解抽样分布这一概念。
抽样分布是指对于不同的样本大小,对相同总体的多次抽样所得到的样本统计量的取值分布情况。
抽样分布的相关知识对于我们理解抽样方法的工作原理和进行统计推断都具有重要作用。
3. 抽样方法3.1 单纯随机抽样单纯随机抽样是指在总体中所有个体出现的概率相等的情况下,每个个体都有被选取为样本的机会。
这种抽样方法的特点是能够保证样本与总体之间的差异较小,从而可靠地反映总体的情况。
3.2 分层抽样分层抽样是指将总体按照某种特定的方式分为若干层,然后从每一层中单纯随机地抽取一定数量的样本。
这种抽样方法的特点是能够充分利用总体的分层结构信息,在减小样本差异的同时,还能够精确地描述总体各层之间的差异。
3.3 系统抽样系统抽样是指按照事先规定的一定抽样比例,从总体中随机选取一个起始点,然后按照一定的跨度依次选取样本。
这种方法的特点是简单易行,但如果抽样的起始点不够随机,就有可能造成数据的偏差。
3.4 无替换抽样无替换抽样是指在一个样本中,任何一个个体只能被选取一次。
抽样调查:不等概率抽样
二、估 值 法
PPS抽样法的估值法的理论依据
定理3.1.1 在有放回PPS抽样下,
Yˆ PPS
1 n
是总体Y总 N数 Yi 的无偏.估计
n
i1
yi pi
i 1
(pi为i个 第样y本 i时单 的元 抽取总 概体 率 i单 中 , 元 第 而 对不 应 .)是 的
估计的均方偏差为:
VY ˆ(PP)Sn 1 i n1pi(p yii Y)2.
例3.1 设某总体共有N=8个单元,相应 M i及代码如表所示
i
Mi
30 Mi
累计
代码
1
2/5
12
2
1/2
15
3
2/3
20
4
4/3
40
5
8/5
48
6
3/5
18
7
2/3
20
8
1
30
12
1~12
27
13~27
47
28~47
87
48~87
135 88~135
153 136~153
173 154~173
2、Hansen-Hurwitz (汉森—赫维茨)估计量
若 y1,y2, ,yn是按 Z i为入样概率的多项抽样而得的样 本数据,它们相应的 Z i 值自然记为 z1,z2, ,zn ,则对总
体总和, Hansen-Hurwitz 给出了如下的估计量:
yHH
1 n
n i 1
yi zi
且 E(yHH)Y ,即 y HH 是总体总和 Y 的无偏估计。
为整数。见下表。
表3—1 pps 抽样时各单元的代码数
单元 i 单元大小M i