第七章整群抽样

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(8.8)

来自百度文库
Sw2

( NM
1)(1 MN
j 1
—总体平均值
S2

1 NM 1
N i 1
M
(Yij
j 1
Y )2
—总体差异平方和
Sb2

M N 1
N
(Yi
i 1
Y )2
—群间差异平方和
S
2 w

1 N(M
1)
N i 1
M j 1
(Yij Yi )2 —群内差异平方和
将Y 改为 y ,则为相应的样本指标值
采用整群抽样调查的原因有二。其一是在某些情况下, 往往由于不适合采用一个个地抽取样本单位,不得不采用整 群抽样。例如,某些工业产品的质量检验,事实上不能逐个 抽取样本单位来进行,只能在某一时间内,成批地抽取产品 来检验。
其二,即使抽样调查能够一个个地取样,但由于经济的 考虑也会选择整群抽样。例如,职工家庭生活水平调查中, 如果不是以居委会为群进行整群抽样调查,而是以居民户为 单位抽样,这些被抽到的居民户一般分散地居住,必然增加 交通费、延长调查时间等。所以出于对工作时间、经费等客 观条件的考虑,也得采用整群抽样调查。
随机抽样来要低一些。
例如,在一个有500个村庄、100000个农户的县,抽取
1%的农户就是1000户,而抽1%的村庄则只有5个村庄,也
许抽到的5个村庄农户多于1000,但由于样本单位只集中在
5个村庄,显然不如在全县范围内简单随机抽取1000户分布
均匀,代表性一般要差一些,抽样误差较大。
当然我们可以通过多抽几个群来弥补这一缺陷,但最关 键的一条还是在于总体内群的划分。为了使整群抽样的样本 具有一定的代表性,应当使群与群之间尽可能地差异小,而 群内单元之间的差异应当大(注意:这一点与分层抽样中总 体内层的划分有着极大的差别),这意味着每个群均具有足 够的代表性。如果划分的群相互之间颇多相似之处,那么少 量群的抽取足以提供良好的精度。一个总体划分成多少个群 ,每个群的规模大小如何又是一个新问题,通常我们面临的 总体会有自然的初级单元,例如本章开头所说的各所中学它 们互相之间关于学生的体质很相似,但在一个学校里每个学 生之间有一定的差异。
(8.4)
从(8.2)式可知,若 n 也足够大的话, s2也可写成(8.4)形式,
此时,s2就可以看作是S 2的近似无偏估计了。
再引进一个群内相关的记号c ,这个概念的重要性在于
它可以度量群内次级单元的差异程度,因为我们已经知道群 内单元的差异大就可能保证样本的代表性,如何划分群实质 上是一个抽样方案的设计问题。易见设计的效应好还是差在
i 1, 2, , N; j 1, 2, , M
yij ——表示样本中第 i 群中第 j 个次级单元的观测值
i 1, 2, , n; j 1, 2, , M
M
Yi Yij —第 i 群总和 j 1
Yi Yi M —第 i 群平均值
1 N M
Y

NM
i 1
Yij
计算可得 1 c 1 ,c 在一定程度上反映了群内单元的
差异,当然这种差异一般是相对于群间差异而言的。它可以
用群内方差
S
2 w
与群间方差
Sb2
来表示:
1 (M
1)c

M ( N 1)Sb2 ( NM 1)S 2
(8.7)
当N足够大时,近似有
c ( Sb2 S 2 ) ( M 1)S 2
2、设计和组织抽样比较方便。例如,调查农村居民住 户,不必列出农村所有居民住户的抽样框,可以利用现成的 行政区域,如县、乡、村,将农村划分为若干群,这给抽样 设计方案带来很大方便。尤其是对那些无法事先掌握总体单 位情况的总体,采用整群抽样更为合适。
然而,整群抽样由于调查单位只能集中在若干群上,而
不能均匀分布在总体的各个部分,因此,它的精度比起简单
在抽到的群内普查,此时样本不是简单随机的。
由于群的选取是简单随机的,因此
sb2

sw2
分别是
S
2 b

S
2 w

无偏估计,于是得到 S 2的无偏估计为:
Sˆ 2

1 [(N NM 1
1)sb2

N(M
1)sw2 ]
(8.3)
当 N 相当大时,该估计可近似写为:
Sˆ 2 sb2 (M 1)sw2 M
相当程度上与这个c 有关。c 的定义为:
c

E(Yij Y )(Yik Y E(Yij Y )2
)
(8.5)
MM
具体计算得
2
(Yij Y )(Yik Y )
c
i 1 jk
(M 1)(NM 1)S 2
(8.6)
(a2 b2 ) 2ab (a2 b2 )
第七章 整群抽样
若总体可分为 N个初级单元(称为群),每个初级单 元包含若干次级单元。按照某种方式从总体中抽取 n个初级 单元,对这些单元中的所有次级单元全部进行调查。这种抽 样方法称为整群抽样。
在实际工作中,整群抽样方法被广泛采用。例如,在社 会经济调查中的人口调查、家计调查、农林牧业调查以及工 业产品质量检验等等都经常采用整群抽样调查。
整群抽样作为一种抽样组织形式,具有以下的优点:
1、调查单位比较集中,进行调查比较方便,可以减少 调查人员来往于调查单位之间的时间和费用。例如,在进行 农村居民户收入情况调查时,在一个县抽千分之五的村庄, 对其所有居民户进行调查,明显地比从全县直接抽千分之五 的农户进行调查,更便于组织,节省人力、旅途往返时间及 费用。
它们之间的关系为:
S2

1 [(N NM 1
1)Sb2

N(M
1)Sw2 ]
(8.1)
将Y 改为 y ,n 代替N ,由于是整群抽样,M仍为M ,不难
得到样本方差平方和的关系式:
s2

1 [(n nM 1
1)sb2

n( M
1)sw2 ]
(8.2)
s2可作为S 2的估计,但不是无偏估计。这是因为次级单元是
倘若需要我们自行划分群,一般还要考虑到组织管理上 的方便、精度上的要求以及费用的多少等等因素。
§1 群大小相等的整群抽样
首先讨论群大小相等时的简单情况。所谓群的大小相等 主要指群内次级单元的个数相等,假定关于群的抽取是随机 无放回的。
首先引进一些必要的记号:
Yij ——表示第 i 群中第 j 个次级单元
相关文档
最新文档