整群抽样

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三、群的大小不等时 在许多情况下, 在许多情况下,总体各群的大小 M是不完全相 i 或完全不相等的。若各群的大小相差不大时, 等,或完全不相等的。若各群的大小相差不大时, 总体参数的估计量可按简单估计或比估计来确定: 总体参数的估计量可按简单估计或比估计来确定: (一)简单估计 如果群的抽取是简单随机的,则可将每个群的 如果群的抽取是简单随机的, 群的指标, 总和 Yi 看作是第 i 群的指标,于是总体总和
第七章
第一节 第二节 第三节 第四节
整群抽样
整群抽样概述 等概率整群抽样的情形 不等概率整群抽样的情形 设计效应和样本容量的确定
第一节 整群抽样概述
一、整群抽样的概念 整群抽样是先将总体各单元划分成若干群 然后以群为单位, ( 组 ) , 然后以群为单位 , 从中随机抽取一部分 对中选群内的所有单元进行全面调查。 群 , 对中选群内的所有单元进行全面调查 。 确切 地说,这种抽样组织形式应称为单级整群抽样。 地说,这种抽样组织形式应称为单级整群抽样。 二、分群的原则 尽量扩大群内差异,而缩小群间差异。 尽量扩大群内差异,而缩小群间差异。
五、整群抽样与分层抽样的比较 综合前面的分析, 综合前面的分析 , 比较整群抽样和分层抽样 可以发现二者在分组( 层或群) 的条件、 可以发现二者在分组 ( 层或群 ) 的条件 、 调查的 方式、 分组( 层或群) 的目的、 分组( 层或群) 方式 、 分组 ( 层或群 ) 的目的 、 分组 ( 层或群 ) 的原则、 的原则 、 总体方差的分解等方面都存在着较为明 显的差别。 显的差别。
i =1 i i =1 i
i =1
i =1
将各群的大小 M i 作为辅助变量。因此,可采用比 作为辅助变量。因此, 估计的方法得出有关参数的比估计量。按前面的 估计的方法得出有关参数的比估计量。 论述,比估计量是有偏的,但当 n 充分大时,其 充分大时, 论述,比估计量是有偏的, 偏差可以很小,近似无偏。 偏差可以很小,近似无偏。
第三节 不等概率整群抽样的情形
一、放回的不等概率抽样 PPS抽样的入样概率和实施方法 (一)PPS抽样的入样概率和实施方法 1.入样概率 2.实施方法 代码法(累计和法,由汉森—赫维茨提出) 代码法(累计和法,由汉森—赫维茨提出) 拉希里法 PPS抽样的估计量 (二)PPS抽样的估计量 对于PPS抽样,其估计量可按汉森—赫维茨方 对于PPS抽样,其估计量可按汉森— PPS抽样 法。
1.总体均值 Y 的估计
ˆ 1 n Y = y = ∑ Yi n i =1
2.总体总wenku.baidu.com Y 的估计
ˆ = NM • y = N Y n N ∑ Yi = n y i =1
n
3.总体比例P的估计 总体比例P
1 n 1 n ˆ P = p = ∑ Pi = ∑αi n i=1 nM i =1
(二)估计量的方差及其估计 由于群是按简单随机方法抽取的,因此, 由于群是按简单随机方法抽取的,因此,估 ˆ ˆ ˆ 计量 Y , Y 与 P 的方差及方差的无偏估计量可直 接按第三章的方法构造。 接按第三章的方法构造。
二、最佳群大小的确定 如果样本大小固定, 如果样本大小固定,虽然调查费用随着群大小 的增加和群数的减少而变小,但从前面的结果看出, 的增加和群数的减少而变小,但从前面的结果看出, 抽样误差将随着群大小的增加和群数的减少而变大。 抽样误差将随着群大小的增加和群数的减少而变大。 因此, 因此,就要考虑求得最佳的群数或群的大小以便在 给定费用条件下使抽样误差最小, 给定费用条件下使抽样误差最小,或在给定抽样误 差条件下使费用最省。 差条件下使费用最省。
第四节 设计效应和样本容量的确定
一、设计效应 整群抽样的设计效应为: 整群抽样的设计效应为:
1− f 2 S [1 + (M − 1) ρ C ] V ( y) Deff = ≈ nM 1− f 2 Vsrs ( y) S nM
≈ 1 + ( M − 1) ρ C
可见,整群抽样的设计效应大小( 可见 , 整群抽样的设计效应大小 ( 即精度的 好坏) 好坏 ) 主要取决于总体中群内各次级单元间相关 程度(在此主要是离散的程度)的大小。 程度(在此主要是离散的程度)的大小。
Y =
N
∑Y
i =1
i
的简单估计可依照简单随机抽样的情形来做。 的简单估计可依照简单随机抽样的情形来做。
(二)比估计 当群的大小不等时, 当群的大小不等时,在对群进行简单随机抽 样的情况下,Y = ∑Yi ∑ M i ,我们注意到它同比率 样的情况下,
R=
N N
N N
形式上完全相同, ∑ Y ∑ X 形式上完全相同,只不过在这里是
本章内容讲授结束
第二节
等概率整群抽样的情形
一、群的大小相等时 (一)估计量 整群抽样是以群为单位进行抽样, 整群抽样是以群为单位进行抽样,如果群的 抽取是简单随机的,则当群的大小都相等时, 抽取是简单随机的,则当群的大小都相等时,可 以将简单随机抽样理解为是一种特殊的整群抽样, 以将简单随机抽样理解为是一种特殊的整群抽样, 特别当总体分群后的每个群都只包括一个次级单 元时,整群抽样和简单随机抽样一致。因此, 元时,整群抽样和简单随机抽样一致。因此,整 群抽样的估计量可以比照简单随机抽样方式来构 造。
如果把每一个群看作一个单位, 4.如果把每一个群看作一个单位,则整群抽 样可以被理解为是一种特殊的简单随机抽样。 样可以被理解为是一种特殊的简单随机抽样。 整群抽样也是多阶段抽样的前提和基础。 5.整群抽样也是多阶段抽样的前提和基础。 6.整群抽样有特殊的用途。有些现象的研究, 整群抽样有特殊的用途。有些现象的研究, 如果直接调查作为基本单元的个体, 如果直接调查作为基本单元的个体 , 很难说明问 必须以一定范围所包括的基本单元为群体, 题 , 必须以一定范围所包括的基本单元为群体 , 进行整群抽样,才能满足调查的目的。 进行整群抽样,才能满足调查的目的。 7.整群抽样要求分群后各群所含次级单元数 目应该确知,否则会给抽样推断带来不便。 目应该确知,否则会给抽样推断带来不便。
ˆ Y HT =
n i =1
N
∑π
N
Yi
i
ˆ ˆ V (YHT ) = ∑∑ (π i π j − π ij )(
i =1 j > i
n n
Yi
πi

Yj
πj
) (n固定时)
2
π i π j − π ij Yi Y j 2 ˆ ˆ V (YHT ) = ∑∑ ( − ) (n固定时) π ij πi π j i =1 j >i
三、样本容量的确定 确定整群抽样的样本量一般有两种思路。 确定整群抽样的样本量一般有两种思路。 1.根据设计效应来定
n ≈ n′[1 + M − 1 ρC ] = n′Deff ( )
2.依精度要求来定 依精度要求确定样本量, 依精度要求确定样本量 , 通常是以允许最大 绝对方差形式来确定, 绝对方差形式来确定,此时根据 V( y) 、 (Y) 、 (P)的 V ˆ V ˆ 计算公式可以直接推导出在不同估计目标下样本 量的计算公式。 量的计算公式。
三、整群抽样的特点 在大规模抽样调查中, 1 .在大规模抽样调查中 , 常常没有或很难编 制出包括总体所有次级单元在内的抽样框, 制出包括总体所有次级单元在内的抽样框 , 而整 群抽样则不需要编制庞大的抽样框。 群抽样则不需要编制庞大的抽样框。 在样本单元数相同的条件下, 2 .在样本单元数相同的条件下 , 整群抽样与 简单随机抽样相比, 样本单元的分布相对较集中, 简单随机抽样相比 , 样本单元的分布相对较集中 , 虽然样本的代表性较差, 虽然样本的代表性较差 , 但调查组织实施过程更 加便利, 同时还可以大大地节省调查费用。 因此, 加便利 , 同时还可以大大地节省调查费用 。 因此 , 实际工作中, 在权衡费用和精度之后, 实际工作中 , 在权衡费用和精度之后 , 有时宁可 适当增加一些样本单元数, 也采用整群抽样方法。 适当增加一些样本单元数 , 也采用整群抽样方法 。 整群抽样的随机性体现在群与群间不重叠, 3 .整群抽样的随机性体现在群与群间不重叠 , 也无遗漏,群的抽选按概率确定。 也无遗漏,群的抽选按概率确定。
二、不放回的不等概率抽样 当 n 固定时,对不放回抽样,如果总体每个群 固定时,对不放回抽样, 严格成比例, 的入样概率与其群的大小 M i 严格成比例,则称之 抽样。 为严格的 πPS 抽样。 若群的抽取是用严格的 πPS 抽样方法进行 的估计应该用霍维茨- 的,则 Y 的估计应该用霍维茨-汤普森方法 Horvitz-Thompson)。 (Horvitz-Thompson)。
四、关于群大小的计量 整群抽样中,如何有效地对群的大小进行计量, 整群抽样中,如何有效地对群的大小进行计量, 直接关系到抽样估计效率的高低。研究表明, 直接关系到抽样估计效率的高低。研究表明,对群 的大小的最优计量尺度是各群在所研究标志上的标 志总量大小。但在实际工作中,它是未知的。 志总量大小。但在实际工作中,它是未知的。因此 通常选择与所研究标志高度线性相关的另一辅助标 志作为计量尺度。 志作为计量尺度。 在整群抽样的实际应用中, 在整群抽样的实际应用中,经常选择以各群所 含次级单元数的多少作为群大小的计量尺度。 含次级单元数的多少作为群大小的计量尺度。当各 群所含次级单元数相等时,就称群的大小相等; 群所含次级单元数相等时,就称群的大小相等;当 各群所含次级单元数不相等时, 各群所含次级单元数不相等时,就称群的大小不相 等。
相关文档
最新文档