整群抽样

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

yi
188.00 180.50 149.75 207.88 244.25
si
27.19 17.98 17.32 29.17 45.20
6
7 8
394,256,192,280,267,334,216,289
192,121,172,165,152,224,195,241 230,205,187,176,212,253,189,240
的取值范围是 1 ,1 M 1
例一
i
1 2 3 4 5
yij
240,187,162,185,206,197,154,173 210,192,184,148,186,175,169,180 149,168,145,130,170,144,125,167 202,187,166,232,205,263,198,210 210,285,308,198,264,275,183,231
s : 样本群间方差
2 : 样本群内方差 sw
2 b
n M 1 2 2 yij yi sw n( M 1) i j
第二节 群规模大小相等时的估计
二 估计量
1.
均值估计量
群规模相同,均为M,则 Y 的估计为:
n M ˆ yij Y y
1 n yi nM n
于是 Y的置信度为95%的置信区间为 也即 218.38 1.96(12.013)
194.83元, 241.93元
第二节 群规模大小相等时的估计
例2 由例1数据,计算以楼层为群的群内相关 系数与设计效应
2 s .18 解:由前已算出样本群间方差 b 14186 而群内方差为 n M 1 2 2 sw ( y y ) ij i n( M 1) i 1 j 1
如果总体中各群的基本单元数目相等,称为群规 模相等或群大小相等。例如对以包装箱生产 的产品进行抽检,如果把每箱看作一个群, 则每箱内的产品数量是相同的。如果总体中 各个群的基本单元数目不等,称为群规模不 等,例如对某辖区内住户进行调查,将辖区 内的每个街道看作群,则每个街道的居住人 数是不相等的。本章在说明整群抽样估计量 及其特性时,将分别对群规模相等和不等这 两种情况进行讨论。
44.52
28.29 43.70
12
228,294,182,312,267,254,232,298
258.38
43.52
第二节 群规模大小相等时的估计
解:
已知N=510,n=12,M=8,f=n/N=0.0235

1 n 188 180.5 258.38 y yi 218.38(元) n i 1 12
Y
N
i
Y

2
第二节 群规模大小相等时的估计
证明:已知 y My ,又
M 2V ( y ) 1 f n
N
Y Y
N i
2
N 1
2

1 f V ( y) nM 2 N 1 1 f 2 Sb nM
Y Y
i
1 f nM M ( N 1)
Y Yi N y yi n
n
N
第二节 群规模大小相等时的估计
Y
: 总体中的个体均值
(各群 M i M)
Y Y
M
y
: 样本中的个体均值
y y
M
第二节 群规模大小相等时的估计
S
2:
总体方差
N M 1 2 S Yij Y M t 1 i j
N M 2 2 Sb (Yi Y ) N 1 i
2 ( 188 218 . 38 ) M 8 2 2 sb ( yi y ) 14186 .18 2 n 1 i 1 12 1 (258.38 218.38) n
第二节 群规模大小相等时的估计
1 f 2 1 0.0235 v( y ) sb 14186 .18 144.3 nM 12 8 s( y ) v( y ) 144.3 12.013
Y Y
N i
2
第二节 群规模大小相等时的估计
性质3 V ( y )的样本估计为
1 f 2 v( y ) sb nM
2 2 s 因为 b 是的 Sb 无偏估计,所以v( y )是 V ( y )的
无偏估计
第二节 群规模大小相等时的估计
总体总值 Y NMY
据此,可直接推出其估计量及相应的方差
三 群的规模
一种是无法控制规模的群
对可控制规模的群,群规模不宜过大
在整群抽样中,群的规模具有相当的灵活性,可以大些,也可以小些。
群的规模大,估计的精度差但节省费用;群的规模小,可以提高 估计的精度但费用增大。实践中确定群的规模需要考虑多种因素, 如群的具体结构、精度费用问题、调查实施的组织管理等;理论 上可利用方差函数和费用函数对群的规模作理论上的最优选择讨 论
有群规模相等与不相等两种情况
第二节 群规模大小相等时的估计
一 符号说明
N: 总体群数 n: 样本群数 Yij: 总体第i群的第j单位数值 yij: 样本中第i群的第j单位数值 Mi: 第i群规模(单位个数) 本节中,M1= M2 =……=MN =M
第二节 群规模大小相等时的估计
Mt: 总体单位总数
第一节 概述
二 群的划分
大致可分为两类
1. 2.
根据行政或地域形成的群体(目的是为了方便调
查,节省费用)
调查人员人为确定的(使得调查费用和抽样误差达
到最优)
分群的原则可用方差分析原理说明:
群内差异尽可能大,群间差异尽可能小
极端情况下,当各群基本单元的分布完全相同, 即群间不存在任何差异时,那么只需抽取一 个群进行调查就能充分满足抽样估计精确度 的要求,整群抽样的效率就很高。这和分层 抽样时分层的原则恰好相反。由此看来,整 群抽样和分层抽样是针对不同总体结构而提 出的两种不同抽样方式。对于一些复杂结构 的总体,可以把两种抽样方式结合起来,以 发挥各自的特点。
ˆ NMy Y ˆ ) V ( NMy ) N 2 M 2V ( y ) V (Y
2 2 ˆ v(Y ) N M v( y )
第二节 群规模大小相等时的估计
三 整群抽样效率分析 群内相关系数 表达式为:

E (Yij Y )(Yik Y ) E (Yij Y ) 2
第一节 概述
一 整群抽样及特点
1. 什么是整群抽样 将总体划分为若干群,以群为抽样单元,对群中 的所有单位进行调查。
如果总体中所有的基本单元可以依据存在的某种联系组成规模较大的单 元集合,则在抽样时可以将这种单元集合称为“初级抽样单元” (primary sampling unit),而基本单元称为“次级(抽样)单元” (secondary sampling unit)。从总体中随机抽取一部分初级抽样单 元,并对中选的初级单元中的所有次级单元都进行调查的抽样方法 称为整群抽样(cluster sampling)。
2.整群抽样的特点
1) 2) 3) 4) 5)
抽样框编制得以简化 实施调查便利,节省费用 估计效率较低(群内单元有趋同性) 对某些特殊结构的总体却有好的估计效果 采用整群抽样时,通常无法提前知道调查的总 样本量,因为在进行调查前,通常不知道一个 群内到底有多少个单元。
整群抽样有特殊的用途。有些现象的研究 必须以一定范围所包括的基本单元为群 体,进行整群抽样,才能满足调查的目 的。如人口普查后的复查,要想对普查 的数据质量进行评估,只有采用整群抽 样对一定地理区域内的人口群体作全面 调查才行。类似地诸如人口出生率、流 动率等调查都需要采用整群抽样。
从方法上看,整群抽样可以看成单阶段抽样向多阶段抽样 过渡的桥梁。如果抽出群后,对其中所有的次级单元进 行调查,称为单阶段整群抽样;如果抽出群后,在次级 单元中进一步抽取子样本,称为两阶段抽样;如果进一 步在两阶段抽样的子样本中按更低一级的单元再抽子样 本,称为三阶段抽样;如此类推,等等。如果最后一个 阶段所抽出的单元是组成总体的基本单元,一般称为多 阶段抽样,将在后面章节讨论;如果最后一个阶段所抽 出的单元是群(基本单元的集合),可将其称为多阶段 整群抽样,也即是多阶段抽样中的一种情形。本章仅介 绍单阶段整群抽样。
第二节 群规模大小相等时的估计
群内相关系数也可由样本统计量
s ,s
2 w
2 b
估计
s s ˆ 2 2 sb ( M 1) sw
2 b 2 w
第二节 群规模大小相等时的估计
整群抽样的估计效率,与群内相关系 数 的关系密切
当 =1时,deff=M
当 =0时,deff=1 当 为负时,deff<1
278.50
182.75 211.50
63.87
38.77 27.48
9
10 11
274,208,195,307,264,258,210,309
232,187,150,182,175,212,169,222 342,294,267,309,258,198,244,286
253.13
191.13 274.75
N
M
第二节 群规模大小相等时的估计
事实上,y 的方差可用群内相关系数近似表示
1 1 f V ( y) 2 V ( y) M nM 2 N 1 1 f ( NM 1) 2 S 1 M 1 2 n M ( N 1) 1 f 2 S 1 M 1 nM
Mt Mi
Mi
N
Yi: 总体中第i群的总量 Yi Yij
j 1
Байду номын сангаас
yi: 样本中第i群的总量 yi yij
Mi
第二节 群规模大小相等时的估计
Yi
: 总体中第i群个体均值
Yi yi
Yi yi
Mi Mi
yi : 样本中第i群个体均值
Y
Y : 总体的群均值
y : 样本的群均值
(1)
第二节 群规模大小相等时的估计
2.
估计量
性质1:
y 的性质
y 是 Y 的无偏估计,即
E y Y
因为是按简单随机方法抽取群,所以样本群均值 总体群均值 Y 的无偏估计,因而
y是
Ey Y
M
Y
第二节 群规模大小相等时的估计
性质2
y 的方差为
1 f V ( y) n N 1 1 f 2 Sb nM
例如,对某居民小区的户均消费情况进行调查,可以采用两种不同的抽 样方法,一种是将住户看作抽样的基本单元,采用简单随机抽样对 被选中的住户实施调查;另一种方法是将小区内每幢居民楼看成一 个群,随机抽取一定数量的居民楼,然后对楼内的所有住户进行调 查,这就是整群抽样。同样道理,如果调查是人均消费情况,此时 人是基本单元,按照前述的简单随机原则先抽户,并对入选户的所 有成员进行调查,此时也是整群抽样。 因此,整群抽样中的群(cluster)指的就是初级抽样单元,是由若干个 基本单元按照一定的形式联系起来所组成的集合体。整群抽样与前 面介绍的抽样方法的不同点在于抽样单元是群,而不是基本单元。 也就是调查时将总体划分为若干群,然后以群为抽样单元,从总体 中随机抽取一部分群,对中选群的所有基本单元进行调查。


2
S : 总体群间方差
2 : 总体群内方差 Sw
2 b
N M 1 2 2 Yij Yi Sw N ( M 1) i j
第二节 群规模大小相等时的估计
s : 样本方差
2
n M 1 2 2 yij y s nM 1
n M 2 2 sb ( yi y ) n 1 i
M
上式中的分子为:
(Y
N
ij
Y )(Yik Y )
NM ( M 1) 2
第二节 群规模大小相等时的估计
上式中的分母为:
2 ( Y Y ) ij N M
NM
故 又可写为:
NM 1 2 S MN

2 (Yij Y )(Yik Y ) ( NM 1)(M 1) S 2
2
Y Y
N i
第二节 群规模大小相等时的估计
简单随机抽样的方差公式为
1 f 2 Vsrs ( y ) S nM
由此可计算出等群抽样的设计效应为
V ( y) deff 1 (M 1) Vsrs ( y )
表明当样本量相同时,群规模相等的整群抽样估计量 y 的方差是简 单随机抽样方差的1 (M 1) 倍,也即为了获得相同的估计精度, 整群抽样的样本量是简单随机抽样的1 (M 1) 倍。
相关文档
最新文档