(硕)《抽样技术》第三讲 等概率与不等概率抽样比较研究

合集下载

抽样调查第3章 不等概抽样ppt课件

抽样调查第3章 不等概抽样ppt课件
则第a个单元入样,否则此次抽取无单元入样.
3、重复2,直至抽得n个单元.
pi NXM i Xi
精选课件
7
PPS抽样的实现方法
目录抽样
1、计算抽样间隔 K X (假定K为整数); n
2、从{ 1,2, … , K }抽取随机数R1,由K确定R2=R1+K,
R3=R1+2K,…,Rn=R1+(n-1)K ;
无放回PPS抽样的实现:在前面方法中去掉重复单 元即可.
精选课件
12
例题与练习
例3 一村庄有8个果园,分别有果树50,30,65, 80,140,44,20,100棵,要调查该村庄水果总 产量.如果实地调查得第5,第8、第3号三个果园的 产量(单位:104 千克)分别为15,12,7,计算 该村八个果园的总产量的估计量和估计量的均方偏 差。再用简单估值法进行估计,并比较两个结果的 优劣。
Sen-Midzuno抽样方法
大体思路
解决样本量超过2的麻烦,使πi近似地正比于Xi
实现步骤
1、以概率pi抽取第一个样本单元
2、从剩下的N-1个单元中,抽取容量为n-1的简单随 机样本(不放回)
i pi (1pi)N n11 pi( f很小时 )
ijN n 1 1 N N n 2(pipj)N n 2 2
V(YˆRH)C有一个无偏估计 2 v(Y ˆRH ) CN N 2 2( n k(1 n ) k k()n N k)tn n1Z X t p yiitt Y ˆRH C
其中 pit是样本yi单 t对元 应的总体中 模正 测比 度于 的
率,即
N
pit Xit X,X Xi
i1
有放回抽样的效率比无放回低但分析计算较简单

抽样调查:不等概率抽样

抽样调查:不等概率抽样
——Sampling with Probability Proportional to Size
总体单元 Yi 规模测度 Mi 0. 在抽取样本单元时,各单元被抽取的概率正比于Mi .
有放回PPS 抽样是常见的一种不等概率抽样方案。每次抽取,第i
单 元Yi 被 抽 中 的 概 率p i



M
响,只有 Mi m时它才入样,因此第 i 个单元入样的概率与
Mi的大小成正比,此时 Zi Mi M0
二、估 值 法
PPS抽样法的估值法的理论依据
定理3.1.1 在有放回PPS抽样下,
是总体总数Y
N
Yi
Yˆ PPS
的无偏估计.
பைடு நூலகம்
1 n
n
i 1
yi pi
i 1
( pi为第i个样本单元yi时的抽取概率,而不是总体中第i单元对应的抽取概率.)
i j ij
j
) yi
yj
,
v2 ( YˆHT
)
Nn
( i
j
ij
i1 ji
ij
) (
yi
i
yj
j
)2 .
注:两估计量均有可能取负值,通过模拟比较,v2较稳定且
较少取负值。
§3.3 Rao-Hartley-Cochran随机分群抽样
拉奥-哈特利-科克伦(1962)
设总体个体单元总数N nM k( 0 k n ) 1. 将总体随机分成n个群 其中k个群有M 1个个体单元,n k个群有M个个体单元; 2. 在每一个群中,以正比于规模测度的概率抽取一个单元 作为样本单元。
估计的均方偏差为:
V(Yˆ PPS
)

抽样调查不等概率抽样课件

抽样调查不等概率抽样课件

59.04 .
这一估计旳均方偏差旳估计为
v( YˆPPS
)
1
n
(
n( n 1 ) i1
yi pi
YˆPPS
)2
4.93
2、Hansen-Hurwitz (汉森—赫维茨)估计量
若 y1 , y2 , , yn 是按 Zi为入样概率旳多项抽样而得旳样 本数据,它们相应旳 Zi值自然记为 z1 , z2 , , zn ,则对总
例如,要了解上海地域钢铁企业旳景气情况,总体有上钢一厂、三 厂、五厂……等等,再加上宝钢。因为宝钢规模极大,它是否景气对整 个上海地域钢铁工业起着至关主要旳作用。而在抽样中将它与其他规模 较小旳单位处于同等地位就会既不公正又使抽样推断成果有较大可能发 生大旳偏差。
§3.1 PPS 抽 样
Байду номын сангаас
PPS抽样:抽取概率正比于规模测度。
第三章 不等概抽样
简朴随机抽样旳特点:总体中每个个体被抽中入样旳概率都相同。对
于各单元所处地位几乎 “平等” 旳总体,这种抽样原则既公正又以便 。
不等概率抽样:但在许多社会经济活动中并非全部单元地位相同。
使得“大”单元入样概率大,“小”单元入样概率小,这里旳“大”、 “小”与我们所关心旳调查指标有着亲密旳关系。
n ( yi
z i 1
i
yHH )2
§3.2 不等概 PS 抽样
有放回不等概率抽样:从实施上还是从估计计算以及精度估计都显得
十分以便。但一种单元被抽中两次以上总会使样本旳代表性打折扣,从 而引起抽样误差旳增长。 实际调查工作者一般倾向于使用不放回形式。
问题:最简朴旳不放回不等概率抽样方式自然会想到逐一抽样这在第
N

不等概率抽样问题的研究

不等概率抽样问题的研究

不等概率抽样问题研究目录摘要 (1)1 不等概率抽样方法的介绍 (2)1.1 不等概率抽样估计的定义 (2)1.2 不等概率抽样 (2)1.2.1 放回不等概率抽样 (2)1.2.2 不放回不等概率抽样 (5)2 结论 (9)谢辞 (11)参考文献 (12)不等概率抽样问题研究李娟指导教师:苗刚摘要:在实际抽样中,我们常常遇到很多不同的情况,对于不同的情况我们也会采用不同的抽样方法进行研究。

常用的抽样方法主要有等概率抽样与不等概率抽样。

本文将针对不等概率抽样问题进行研究。

关键词:抽样;不等概率;样本;指标在现实生活中,由于现实的局限性,我们常常需要对总体进行抽样估计,抽样估计的方法也是多种多样。

在实际运用中,我们常常会发现运用等概率抽样方法来对总体指标进行估计时会出现单位均值估计不足的缺陷,那么我们应该如何改变这种现状,以提高抽样估计的效率呢?随着抽样调查在我国应用领域的不断扩展,很多学者对于抽样调查中等概率抽样估计的不足提出了建议。

他们提议如果我们运用不等概率抽样方法对总体指标进行估计,那么这些问题将迎刃而解。

1 不等概率抽样方法的介绍1.1 不等概率抽样估计的定义不等概率抽样估计,也就是大单位赋予大的入样概率,小单位赋予小的入样概率,入样概率一般与单位规模大小成正比。

1.2不等概率抽样方法的分类不等概率抽样方法按不同的分类方法可以分成许多不同的类型。

但最主要的分类方法是按抽样过程中被抽到的单位是否被放回总体中进行分类,分为放回不π。

等概率抽样)psPPS和不放回不等概率抽样()(抽样抽样1.2.1 放回不等概率抽样所谓放回不等概率抽样,是指在抽样之前就给总体中每一个单位赋予一个确定的抽样概率,在放回抽样的每一次抽取中,每个单位被抽中的概率都不变,直到抽够n个样本单位为止,对于放回不等概率抽样,由于每次抽取时总体的分布都不变,所以各次抽取是相互独立的,因此,无论抽样的实施,还是目标量的估计,都特别简单,这是这种抽样方法的最大优点。

抽样技术不等概率抽样

抽样技术不等概率抽样

抽样技术:不等概率抽样引言在统计学和数据分析中,抽样技术是一项重要的工具,用以从总体中选择一部分元素进行研究。

而抽样技术的核心就是如何从总体中选取样本,以保证样本能够准确地反映总体的特征。

其中一种常用的抽样技术是不等概率抽样。

不等概率抽样是指在抽取样本时,各个个体被选中的概率不相等。

与等概率抽样相比,不等概率抽样更能满足实际问题的需求,更能提高样本的效率和精确性。

本文将介绍不等概率抽样的原理、常用方法以及应用案例,希望能够帮助读者更好地理解和应用抽样技术。

不等概率抽样的原理不等概率抽样的原理基于概率论和统计学的基本原理。

在进行不等概率抽样时,需要根据总体的特征和研究目的,选择合适的抽样方法和样本选择概率,以使样本能够准确地反映总体。

不等概率抽样的核心在于赋予每个个体被选中的概率,也称为抽样概率。

抽样概率可以根据总体特征和研究目的进行选择,常见的选择方法包括:概率比例抽样、系统抽样、整群抽样等。

概率比例抽样是一种根据个体在总体中所占比例来确定抽样概率的方法。

具体而言,可以先计算出样本所需的个体数目,再根据各个个体在总体中的比例,分配相应的抽样概率。

这样可以保证样本能够按比例反映总体的特征。

系统抽样是一种按照一定规律选择样本的方法。

具体而言,可以在总体中确定一个起始点,然后以固定的间隔选择样本个体。

系统抽样具有简单方便、无需随机表和随机数的优点,常用于总体具有周期性分布的情况。

整群抽样是一种将总体划分为若干群体,然后随机选择部分群体进行抽样的方法。

这种方法适用于总体分布不均匀,但各群体内部相对均匀的情况。

通过整群抽样,可以减小样本误差,提高样本的代表性。

不等概率抽样的常用方法不等概率抽样有多种不同的方法和技术,根据实际问题的需求和样本特征的不同,可以选择合适的抽样方法。

以下将介绍几种常用的不等概率抽样方法。

简单随机抽样是不等概率抽样中最基本的方法之一。

简单随机抽样是指每个个体都有相等的被选中概率,且个体间的选择是相互独立的。

概率抽样和非概率抽样概率抽样PPT精选文档

概率抽样和非概率抽样概率抽样PPT精选文档

,写上1-10000号,从中随机(或按随机数
)抽取200张,被抽中的居民即为样本。
42
特点
简单、直观 对参数进行估计比较方便
局限性
当总体量很大时,不易构造抽样框 抽出的单位很分散 没有利用其它辅助信息
43
分层抽样
将抽样单位按某种规则划分为不
同的层,然后从不同的层中独立、随机地
抽取样本。
重点调查
总体单位
调查单位
只调查重点单位(单位 数不多但其标志量占标 志总量比重较大的单位)
32
统计调查的组织方式
在对调查对象有一定了解的基础上,
典型调查 有意识地选择少数典型单位 进行
调查的一种非全面调查组织方式
一定条件下能估计总体指 作 标数值 用 可以补充全面调查的不足
可以用来研究新生事物
局 不能确定推断的把握程度, 限 无法计算和控制推断误差
数值型数据表示事物的数量特征,定量数 据或数量数据(qualitative data)。
对不同类型的数据,采用的统计方法可能 有所不同 。
10
4、截面数据(cross-sectional data)
在相同或近似相同的时间点上收集的数 据
描述现象在某一时刻的变化情况 比如,2002年我国各地区的国内生产总
51
系统抽样
定义:将个体按一定顺序排列,在规定的 范围内随机地抽取一个单位作为初始单位 ,然后按事先规定好的规则确定其它样本 单位
优点:操作简便
缺点:对总体参数的估计比较复杂
52
系统抽样的步骤
(1) 将总体单位排列。
(2) 决定抽样间距(总体单位数/样本数)。
(3) 采用简单随机抽样法抽出一个单位作为起点 。

等概率整群抽样和多阶段抽样PPT学习教案

等概率整群抽样和多阶段抽样PPT学习教案

简单随机抽样的方差公式为
Vsrs
(
y
)
1 f nM
S2
由此可计算出等群抽样的设计效应为
deff V ( y) 1 (M 1)
Vsrs ( y)
第15页/共53页
整群抽样的估计效率,与群内相关 系数 的关系密切。

时,deff=M
当 1 时,deff=1
当 为0 负时,deff<1
群内方差为0 群内方差与总体方差相等
多 阶 段 抽 样 每一个 阶段的 抽样可 以相同 ,也可 以 不 同 , 它 通 常与分 层抽样 、整群 抽样、 系统抽 样 结合使用。
第33页/共53页
定理4.44对.3.于2 多两阶阶段段抽抽样估样计,量有的均值和方差
E(ˆ) E1[E2 (ˆ)]
V (ˆ) V1[E2 (ˆ)] E1[V2 (ˆ)]
已知:种植面积X=30525(亩)
用种植面积为辅助变量
Yˆ X
y n
i 1 i
257.1 30525 877.85
x n i1 i
8940
v(Yˆ) N 2 (1 f )
n i 1
(
yi
Rˆxi )2
127.84
n
n 1
s(Yˆ) 127.84 11.3(万公斤)
评价:和n
相比,
yi(万公斤)
xi(亩)
22.0
800
22.8
780
30.2
1000
21.7
700
25.3
880
31.2
1100
26.0
850
20.5
800
33.8
1200
23.6

不等概率抽样的辩证思维

不等概率抽样的辩证思维

不等概率抽样的辩证思维
1.定义
如果总体中每个个体被选入样本的概率是不相等的,则称这种随机抽样的方式为不等概率抽样。

2.优点
这中不等概率抽样能提高抽样精度,减少样本不均衡造成的抽样误差。

使用个体之间差异较大的场所。

3.实现
将总体中每个个体赋予不同的权重,权重大的个体被抽到的概率大,权重小的个体被抽到的概率小。

4.有放回抽样
例:
4.1代码法
代码法是最直接的一种方法,也是最容易想到的一种方法,即分别复制增加每种样本的个数,使得每种样本的个数之比,等于入样概率之比。

每次抽样前,先在整数1,2,3,…M0里面随机等可能的选取一个整数,设为m,若代码m属于第j个单元拥有的代码数,则第j个单元入样。

整个过程重复n次,得到n个单元入样(当然存在重复的可能性)构成样本。

4.2Lahiri法
当N非常大时,累积的M0也将很大,给代码法的实施带来很多不方便,Lahiri提出下列方法:
令:
每次抽取1~N中一个随机整数i,及1~M*内一个随机整数m,如果Mi>m,则第i个单元入样;否则按前面步骤重抽。

抽样调查方法与技术:不等概率抽样

抽样调查方法与技术:不等概率抽样

二、PPS抽样的实施
1、代码法: 为什么说与规模大小成比例? 第i个单位包含的代码个数与其规模Mi相等,
每次抽取产生的随机数假设在1—M0之间均 匀分布,很显然代码个数越多的单位(规模越 大的单位)被抽中的可能性越大。
(抽中的概率早已确定:Mi/M0。)
i
Mi
1 3.84 2 0.68 3 4.63 4 0.49 5 7.18 6 1.28 7 7.01 8 7.42 9 8.80
第一节 问题的提出
一、不等概率抽样的必要性 (P137-138,不等概率抽样运用的两种情形
:) ①需要估计总体总量,但总体单元规模相差很
大的情形; ②由于种种原因不能直接对基本的较小单元抽
样的情形。
第一节 问题的提出
二、不等概率抽样的分类 (一)放回不等概率抽样
所谓放回不等概率抽样是指,在抽样之前 就给总体中每个单位赋予一个确定的抽取概 率,在放回抽样的每一次抽取中,每个单位 被抽中的概率都不变(概率不变,不是概率 相等),直到抽够n个样本单位为止。
(二)不放回不等概率抽样
由于每次抽取采用不放回的形式,样本中 不会出现重复的单位,抽样效率比放回形式 的高,但同时也由于各次抽取相互不独立, 所以无论抽样的实施还是目标量及其方差的 估计都比放回形式复杂。不放回不等概率抽 样方法中,最重要最常用的是样本量固定, 总体中每个单位的入样概率与单位的规模大 小严格成比例的抽样。(πps)
第二节 放回不等概率抽样
一、多项抽样与PPS抽样 P139
设总体包含N个单位,在放回抽样的每一次 抽取中,抽到第i个单位的概率为Zi ( 0≤Zi≤1;i=1,2,…,N) 且 ,按此规定 有放回地独立抽取n次,共抽到n个单位(有 可能重复),称这样的抽样为多项抽样 (Multinomial Sampling)。

抽样技术之不等概率抽样概述

抽样技术之不等概率抽样概述
抽 样 技 术 之 不等概 率抽样 概述(P PT67页 )
抽 样 技 术 之 不等概 率抽样 概述(P PT67页 )
不等概率抽样的分类
放回不等概抽样:按照总体单元的规模大小来确定在每次抽 中的概率。抽取后放回总体,再进行下一次抽样,每次抽
样都是独立的。这种抽样称为放回不等概抽样(sampling with probabilities proportional to sizes,简称PPS抽样)
Mi}=p{a=i} p{b
M i }=
1 N
.
Mi M
显然,z i
Mi
抽 样 技 术 之 不等概 率抽样 概述(P PT67页 )
抽 样 技 术 之 不等概 率抽样 概述(P PT67页 )
拉希里法抽样举例:
例5.1中,M=150,N=10.在[1,10],[1,150] 中分别产 生( i,m)如下:
2.拉希里法(二次抽取法)(统计学家Lahiri最先提出):
设 M1, M2,…MN为单元的规模
令M
max 1i N
Mi
每次从 1,N 中简单随机地抽取一随机数a,
同时再独立从 1,M 中简单随机地抽取一随机数b。
若b
ห้องสมุดไป่ตู้Ma
,
则第a个单元入样,若b
M
则重抽。
a
第i个单元被抽中的概率:
zi =p{a=i,b
其中第2、19号被抽中两次
抽 样 技 术 之 不等概 率抽样 概述(P PT67页 )
抽 样 技 术 之 不等概 率抽样 概述(P PT67页 )
解:根据题中所给资料,n=30,M0=9542, 利用汉森-郝维茨估计量,则有:
YHH
1 n

zCH6不等概抽样第3节

zCH6不等概抽样第3节

大型企业
100
50

1/2
中型企业 1000
100
1/10
小型企业 10000
500
1/20
又如,PPS抽样,2个企业中取1个 净利润
甲 1000万元
入样概率 2/3 扩展

500万元
1/3
2019/5/10
统计学专业必修课3学分
3
CH6内容体系
§6.1 问题的提出
介绍不等概抽样的概念、特点、适用性、种类等
2019/5/10
统计学专业必修课3学分
15
4、要求
基本要求:必须获得各单元的某辅助变量Xi用以确定其Zi 这不仅在抽样时是必需的,在估计推断中也是必要的 ①选择合适的辅助变量 一般是规模变量
表示单元规模的标志有很多,如:以企业为抽样单元, 企业的职工人数、注册资本金、产品销售收入、增加值、 利润等都可用来表示企业的大小。哪个最优?
广义的 PPS抽样
狭义的PPS抽样,简称PPS抽样
πPS抽样
第三节
第二节
2019/5/10
统计学专业必修课3学分
12
2、作用或适用性
①各抽样单元在总体中所占的地位不一致
居民住户调查中,调查家庭的日常消费支出或娱乐/保 健品等奢侈消费支出,会采用不同的抽样设计
为估计一城市的商业销售总额,对各商业网点进行调 查
13
③改善估计量
不等概抽样还广泛应用于由于种种原因不能或不需要 对基本单元(BU: Base Unit)直接抽样的情形,比如
整群抽样(CL: cluster sampling) 中,若群大小 (用群内包含的BU数Mi表示) 相差较大,常采用对 群的不等概抽样

不等概率抽样若干问题探讨

不等概率抽样若干问题探讨
x 与辅助标志 y 在绝对数上有高的正相关关系的
助标志。 既然确定每个个体被抽中的概率和不等概 率抽样的效果都与辅助标志有关, 那么正确选择辅 助标志就至关重要。 总的原则就是要选择与调查标 志正相关关系最密切、 最接近呈等比例变化且具备 全面资料的标志作为辅助标志。 例如, 若要由以乡为 个体的样本来估计全县的粮食总产量, 那么可供选 择的、 衡量乡大小的辅助标志就有村庄数、 人口数和 耕地面积等, 这时该选择哪一个呢? 考虑到与粮食总 产量的关系, 在正常情况下以乡的耕地面积作为辅 助标志来确定各乡被抽中的概率恐怕是最合适的, 因为粮食总产量直接取决于播种面积 ( 亩产水平相 当的情况下) , 其正相关关系高于村庄数和人口数等 因素。 这就告诉我们, 在不等概率抽样以前, 要先对 调查标志与有关辅助标志之间的关系进行必要的分 析研究。 此外, 如果条件允可, 那么以调查标志本身 的近期资料为依据来确定个体被抽中的概率也十分 有效, 甚至优于其他相关标志。 这也是一个很重要的 原则。
即为真实的总体总量 X T , 即:
Nn
δT jZ j = N 2X 2
n 1 n xi 2 ・0 p i n pi n 1 n xi n =N E 2 ・0 p i n pi N n xi = Nn 2 E ( t i) ・0 E (p i) pi
n
n
的理由。 三、 应用不等概率抽样要注意的问题
1 n xi - XT ) 2 2 n pi 2 1 n xi (2 - nX T ) E n pi n xi 1 E 2 ( - X T ) 2+ 0 pi n2 N x 1 i 2 ( - X T ) 2 E ( t i) pi n2 1 N xi 2 ( - X T ) 2p i n pi
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三、严格的πPS抽样
n是固定的;一阶包含概率与单 是固定的; 位规模大小严格成比例, 位规模大小严格成比例,即
πi = nZi
1.当 n = 2 的情况下 1.当 布鲁尔估计法: 布鲁尔估计法: 要求: 要求:总体中最大的单位必须小 于全部单位大小总和的 1 2
记第一个被抽取的单位为i 记第一个被抽取的单位为i,第一个单位 成比例的概率抽取。 按与 Z i (1 − Z i ) 成比例的概率抽取。
设从总体中不放回地抽去 n 个 单位, 单位, 令 π i 为第 i 个单位入样的概率 (一阶包含概率). 一阶包含概率). π ij 为第 i 和第 j 个单位同时入 样的概率(二阶包含概率). 样的概率(二阶包含概率).
1. 霍维茨 汤普森估计量 霍维茨-汤普森 汤普森估计量
总体总值的估计量 X ˆ 估计量的方差为
2
( )
ˆ xi XHH M = ∑ m − M n ( n −1) i=1 i 0
第三节 不重复的 不等概率抽样
一、基本概念 1. πPS 抽样:不放回的与单元规模 抽样:
大小成比例的概率抽样称为严格的
πPS 抽样。 抽样。
2. 在不重复的不等概率抽样中,总 在不重复的不等概率抽样中, 体中的每个单位每次被抽中的概率 为 Zi 。
两个单位同时入样概率称为 二阶包含概率。 二阶包含概率。
包含概率的性质: 包含概率的性质:
(1)
∑π
i =1 N
N
i
=n = ( n − 1) π i
(2)
∑π
i≠ j N
ij
1 ∑∑i π ij = 2 n ( n − 1) (3) i =1 j >
N
二、霍维茨-汤普森和耶茨 格 汤普森和耶茨-格 霍维茨 汤普森和耶茨 伦迪-森 伦迪 森 估计量
2)不足: 不足:
设计复杂,难以操作 设计复杂,
4.不等概抽样分类 4.不等概抽样分类
1 )重复的不等概抽样: 重复的不等概抽样: 在抽样之前, 在抽样之前,对每一个单位赋 予一个确定的概率( 予一个确定的概率(一般是单 位的规模与被抽的概率成正 ),在放回的每一次抽取中 在放回的每一次抽取中, 比),在放回的每一次抽取中,每 个单位被抽中的概率不变. 个单位被抽中的概率不变.
Zj
(1 − Zi − Z j ) 的概 第三个单位按 率在余下的N 个单位中抽取。 率在余下的N-2个单位中抽取。
Zk
总值的估计量 抽样方差
其中
1 n ˆ X R = ∑ ti n i =1
n
ˆ = 1 ∑ t −X ˆ V XR i R n( n −1) i=1
( )
(
)
2
x1 x2 t1 = , t2 = x1 + (1 − z1 ) , L , z1 z2 xn tn = x1 + x2 + L + xn −1 + (1 − z1 − z2 − L − zn −1 ) zn
第三讲 等概率 与不等概率抽样 比较研究
第一节 等概抽样 与不等概抽样概述
一、等概率抽样概述
1.操作方法 1.操作方法 2.适用场合 2.适用场合 3. 优点与不足之处
二、不等概抽样概述
1.操作方法 1.操作方法 2.适用场合 2.适用场合 1)总体单位的调查标志差异大
A.按单位的规模大小分层抽样,对 A.按单位的规模大小分层抽样, 按单位的规模大小分层抽样 单位规模大的层抽取的比例高。 单位规模大的层抽取的比例高。 B.按单位规模的大小决定入样的概 B.按单位规模的大小决定入样的概 使规模大的单位入样概率大, 率,使规模大的单位入样概率大, 规模小的单位入样概率小。 规模小的单位入样概率小。
2)不重复的不等概抽样
在抽样之前, 在抽样之前,对每一个单位赋予一 个确定的概率, 个确定的概率,并对每一次抽取的 概率进行精心的设计,以保证n 概率进行精心的设计,以保证n次 不放回的抽样中总体中的每一个 单位被抽取的概率等于预先赋予 的入样概率. 的入样概率. 不重复的不等概抽样, 不重复的不等概抽样,常用方法的 是样本量固定, 是样本量固定,总体中的每一个单 位的入样概率与单位的规模大小 严格成正比例. 严格成正比例.
方差估计(耶茨-格伦迪-森) 方差估计(耶茨-格伦迪-
ˆ vYGS X B
( )
π 1π 2 − π 12 x1 x2 = − π 12 π1 π 2
2
2. 当 n > 2 的情况下
1) 水野方法:要求总体中单位大小 水野方法: 差异不能太大. 差异不能太大.样本单位是逐个抽取 抽取第一个样本单位的概率: 的.抽取第一个样本单位的概率:
3. 包含概率
在不放回的不等概率抽样中, 在不放回的不等概率抽样中, 每个单位被包含到样本中的 概率为 π i ; 任意两个单位同时被包含到 样本中的概率为 π ij ; 以上统称为包含概率。 以上统称为包含概率。
一阶包含概率 πi
第 i 个单位在所有可能样本 出现的概率称为一阶包含概 率。
二阶包含概率 πij
抽取第一个样本单位后,在剩下的N 抽取第一个样本单位后,在剩下的N1个单位中采用无放回等概率的方 法抽取剩下的n 个单位. 法抽取剩下的n-1个单位.
n( N −1) Zi n −1 Z = − , N −n N −n i = 1,2,L, N
* i
一阶包含概率
π i = nZ i
二阶包含概率
n−1 N −n * * n−2 πij = ( Zi +Zj ) + N −n N −1 N −2
xi
上式可以写成: 上式可以写成:
ห้องสมุดไป่ตู้
ˆ % V xHT = ∑
i =1 N
( )
N
1− πi
πi
π i j − π iπ j x + 2∑∑ xi x j π iπ j i =1 j >i
N N 2 i N N i =1 j >i
% %% = ∑ ∆ ii xi2 + 2∑∑ ∆ ij xi x j
2)群大小不等的整群抽样 3)初级单位大小不同的阶段 抽样 4)等距抽样中的应用
3. 优点与不足
1)优点: 优点:
比较有效地解决调查的总体单位 与抽样的总体单位不一致、 与抽样的总体单位不一致、调查 单位在总体中所占的比重不一致 的问题。 的问题。 可以改善估计量, 可以改善估计量,提高估计精度 而设计。 而设计。
ˆ V X HT = ∑
i =1
HT
=∑
i =1
n
πi
xi
(
)
N
1− πi
πi
π i j − π iπ j x + 2∑∑ xi x j π iπ j i =1 j > i
N N 2 i
若令: xi = 若令: %
πi ∆ii = π i (1 − π i ) , ∆ ij = π ij − π iπ j
三、非严格的πPS抽样 非严格的π
在非严格的πPS抽样中 在非严格的πPS抽样中, 抽样中, 样本量可以不固定, 样本量可以不固定,允许 为随机变量。 为随机变量。可以不是严 格不放回的, 格不放回的,允许一阶包 含概率 πi 与单位规模大 小近似成正比。 小近似成正比。
耶茨耶茨-格伦迪方法 样本单位是逐个抽取的, 样本单位是逐个抽取的,保证每次 都以未入样的单位的规模大小成比 例的概率抽取。 例的概率抽取。 的概率抽取; 第一个单位按 Z i 的概率抽取; 第二个单位按 (1− Zi ) 的概率在余 下的N 个单位中抽取; 下的N-1个单位中抽取;
i =1 N
%% = ∑∑ ∆ ij xi x j
i =1 j =1
N
结论:用霍维茨 汤普森估计量 结论:用霍维茨-汤普森估计量 和用简单随机估计量对常住居民 总人数的估计, 总人数的估计,其总值的平均数 都是2520。 都是 。 霍维茨-汤普森估计 汤普森估计, 霍维茨 汤普森估计,每个样本 单位被抽取的概率不同, 单位被抽取的概率不同,简单随 机估计每个样本单位被抽取的概 率相同,但它们都是无偏估计。 率相同,但它们都是无偏估计。 霍维茨-汤普森估计的总值比简 霍维茨 汤普森估计的总值比简 单随机估计更集中于总体的平均 数。
i =1
N
Mi 总体的规模为 M 0 , M 0 = ∑ M i , Z i = M0 i =1
N
总体单位的规模为 M i 对于样本而言,样本单位的规模为 对于样本而言,
m1 , m2 L , mn
汉森-赫维茨的估计量( 汉森-赫维茨的估计量(无偏估计 量)
ˆ = 1 ∑ xi X HH n i =1 zi
2. 耶茨 格伦迪 森 估计量 耶茨-格伦迪 格伦迪-森
估计量的方差
ˆ VYGS X HT
(
)
2 1 % % % = − ∑∑ ∆ ij ( xi − x j ) 2 i =1 j =1 N N
π ij > 0, i ≠ j
ˆ vYGS X HT
(
)
2 1 % % % = − ∑∑ ∆ ij ( xi − x j ) 2 i =1 j =1 n n
二、汉森-赫维茨估计 汉森设总体为N 现按PPS抽样 设总体为N,现按PPS抽样, 抽样, 个样本单位, 从总体中抽取 n 个样本单位, 所调查的指标为 x 。样本观 测值 x , x L, x
1 2 n
抽到第 i 个单位的概率为
Z i ( 0 ≤ Z i ≤ 1; i = 1, 2, L , N ) , ∑ Z i = 1

Z i (1 − Z i ) D=∑ i =1 1 − 2 Z i
N
πij 可以写成
相关文档
最新文档