抽样技术 5 整群抽样

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2.群内相关系数：是表达总体中群内小单元间相关程度的一个指标。定义：
(Y

E (Yij Y )(Yik Y ) E (Yij Y )
2 i 1 j k
N
M
ij
Y )(Yik Y )

2 NCM 2 ( Y Y ) ij i 1 j 1 N M
NM 2 (Yij Y )(Yik Y )
学生2
学生3 学生4 学生5 学生6
83
74 82 66 87
83
79 111 101 69
89
94 109 79 80
105
98 107 129 90
99
132 87 99 124
100
116 99 107 105
115
117 99 106 120
80
63 130 105 86
试估计该学校平均每个学生每周的零花钱，并给出置信度为95%的置信区间。
11 22 17 26 16 27
12 33 17 40 24 17
13 15 10 4 6 8
14 17 18 12 11 10
15 13 9 5 7 9
16 18 23 13 15 8
17 33 5 26 30 11
18 26 15 13 17 3
19 7 32 4 6 9
20 15 1 1 6 5
2 ( Y Y ) i N
Y
N 1
i
Y

2
N 1
5.2 群规模大小相等时的估计
3、 V ( y ) 的样本估计为
1 f 2 1 f v( y ) sb nM n
M n s ( yi y)2 n 1 i 1
2 b
2 ( y y ) i 1
n
n 1
都是等概抽样，由于抽样方法不同，产生的抽样误差也不同。
5.1
概述
二、整群抽样特点： 1.可以简化抽样框的编制。 2.实施调查便利，节省费用。 3.通常比简单随机抽样的抽样误差大，可通过加大样本量来弥补。三、群的划分： 1.根据行政区或地域形成的群体。（方便，节约） 2.调查人员人为确定的。如一大块地分为若干块较小面积的群。 3.分群的原则：群内单元差异大，群间差异小，这样，被抽到的群代表性好，抽样误差小。（和分层抽样中划分层的原则相反）。
5.2 群规模相等时的估计量及其方差
一、符号：总体群数：N 每群含有的单元数：M 总体第i群第j个单元的指标值：Yij 总体中单元总数：M0=NM 样本群数：n，样本中单元总数： nM 样本第i群第j个单元的观测值：yij
5.2 群规模相等时的估计量及其方差
一些记号：总体第 i群的和群和的均值个体均值
5.1 概述
整群抽样是由一阶抽样向多阶抽样过渡的桥梁。在第二阶段中，如果抽出后对其中的所有单元进行调查，是整群抽样；如果再从中抽取子样，即两阶段抽样；也可以从中再继续抽样，叫多阶段抽样；
多阶段抽样中，如果最后一次对抽中群里所有的单元进行调查，则称为多阶段整群抽样。
整群抽样分类： 1、群规模相等的抽样。（抽样方式和估计方法简单） 2、群规模不相等的抽样。

Y的置信度为95%的置信区间为： y 1.96 （ s y ）， y 1.96 （ s y ）即89.66， 106.68
例：调查一片荒地上煌蝻的数量，调查以一平方米为单位，计算煌蝻数，该荒地有5000平方米，现在为方便调查将其划分为每10平方米一块的地块，从500个地块中简单随机的抽取 20个样本，然后对抽中的地块调查每平方米煌蝻数，作整群抽样，调查数据如下表，估计整块荒地的煌蝻数。（本例子选自北京大学教材“抽样调查”125页）
10
15 17 10
12
1 5 5
4
3 11 9
5
6 7 2
16
15.3
24
19.7
26
20.5
28
21.4
39
28. 8
37
25.6
25
25
27
22. 1
1
17.3
7
11.2
23
24.6
27
22.8
12
10.2
27
14.1
14
10.1
26
19.7
21
17.8
7
10.4
12
9.7
1
4.9
每平方米平均有煌蝻数的估计为：
第5章
整群抽样
第七章整群抽样
• •
群规模相等时的整群抽样群规模不相等的整群抽样
5.1 概述
一、整群抽样（cluster sampling）的定义：由若干个基本单元所组成的集合称为群。将总体划分为若干群，然后以群为抽样单元，从总体中简单随机抽取一部分群，对抽中的群中的所有基本单元进行调查的一种抽样技术。二、应用： 1 、农产品实割实测某地产量时，在地块中布点作为样本块，群可以是一行或两行。 2、欲调查某大学的学生体质状况，群可以是班级或系等。 3、工厂产品（例如食品）质量检查时，群可以是一箱、一包，或若干包等。一旦抽中，对群中的每一个单元都进行调查。
样本 sw 2
2 （ y y ） ij i i 1 j 1 M
N （M 1 ） M （Y i Y）
2 i 1 N
（ n M 1 ）
2 M （y i y） i 1 n
群间方差
Sb 2
N 1 （Yij Y）
2 i 1 j 1 N M
sb 2

1 f 2 （ v y ） sb nM
ˆ NMy Y ˆ ) N 2 M 2 v( y ) v(Y
自己练习带入数据进行计算，也可用软件编程计算
三、整群抽样的设计效应： 1.群内、群间差异的定量刻划：
总体群内方差 S w 2 （Yij Y i）
2 i 1 j 1 N M n
2 2 ˆ v(Y ) N M v( 95%的置信区间
例：在一次对某寄宿中学在校生零花钱的调查中，以宿舍作为群进行整群抽样，每个宿舍有6个学生。用简单随机抽样在全部315个宿舍中抽取8个宿舍。全部48个学生上周每人的零花钱及相关数据如下：
宿舍1 宿舍2 学生1 58 91 宿舍3 宿舍4 宿舍5 宿舍6 宿舍7 宿舍8 123 99 110 111 120 96
5.2 群规模大小相等时的估计
二 1、总体均值的简单估计量
SRS抽群,群规模相同，均为M，则
Y
的估计如下，且是无偏的
n M 1 =y Y yi，yi yij n 1 j 1 n n M ˆ y Y y yi / nM yij / nM M i 1 i 1 j 1
14
26 19 20
20
22 24 29
24
27 17 15
37
19 12 38
23
32 34 37
23
16 22 33
21
31 23 21
15
12 36 34
19
6 20 9
14
11 20 16
22
30 34 29
18
15 16 21
17
13 6 11
6
22 14 4
17
14 9 4
16
24 26 28
1 n 1 Y y yi (15.3 19.7 20.5 ... 4.9) 17.56 n i 1 20
这一估计的方差为；
n M 10 20 2 2 2 2 [(15.3 17.56) ... (4.9 17.56) ] sb （ y y ） i 20 1 1 n 1 i 1
i 1 j k 2 ( Y Y ) ij i 1 j 1 N M N M
n 1
2 （ y y ） ij i 1 j 1 n M
NM 1 nM 1 并且sw 2是S w 2的无偏估计，sb 2是Sb 2的无偏估计。
总方差
S2
s2
总体离差平方和的分解：
2 （ Y Y ）（ Y Y Y Y ） i i ij ij 2 i 1 j 1 N i 1 j 1 N 2 （Yij Y i） M （Y i Y） 2 i 1 j 1 i 1 M N M N M
5.1 概述
引例：欲估计某校学生的每月个人消费，假定40000个学生，共10000个宿舍（假设每个宿舍住4人），以下三种抽样方案：
方案一：根据学生名录，按简单随机抽取400名学生
方案二：根据学生宿舍名录简单随机抽取100个宿舍，对抽到的宿舍全面调查。
方案三：先简单随机抽取400个宿舍，每个宿舍简单随机抽取1人。
解：
宿舍1 学生1 学生2 学生3 学生4 学生5 学生6 58 83 74 82 66 87 宿舍2 91 83 79 111 101 69 89.00 宿舍3 123 89 94 109 79 80 95.67 宿舍4 99 105 98 107 129 90 宿舍5 110 99 132 87 99 124 宿舍6 111 100 116 99 107 105 宿舍7 120 115 117 99 106 120 宿舍8 96 80 63 130 105 86 93.33 527.87
yi 75.00 si2 125.60
104.67 108.50 106.33 112.83 42.27 72.57
233.60 299.07 177.87 287.50
n 8, N 315 1 n Y y y i 98.17 n i 1 n M 2 2 sb （y i y ） 928.6648 n 1 i 1 1 f 2 （ v y ） sb 18.8558 nM （ s y ）（ v y ） 4.3423
2 因为 b 是的
s
S
2 无偏估计，所以v( y )是 V ( y ) b
的无偏估计整群抽样的抽样误差和群间方差有关，减少群间差异，增加群内差异有助于提高抽样精度（抽样设计原则）
5.2 群规模大小相等时的估计
• 总体总值
Y NMY
• 据此，可直接推出其估计量及相应的方差
ˆ NMy Y ˆ ) V ( NMy ) N 2 M 2V ( y ) V (Y
( NM 1) S 2 N （M 1 ）S w 2 ( N 1) Sb 2
2 2 N （ M 1 ） S ( N 1) S w b S2 NM 1 2 2 （ n M 1 ） s ( n 1) s w b 同理：样本的s 2 nM 1 ( s 2不是S 2的无偏估计。 ) 2 2 N （ M 1 ） s ( N 1) s w b ˆ2 S 2的无偏估计为：S NM 1
（自加权样本）
1 Y =Y M M 按简单随机法抽群，用样本群均值简单估计总体群均值， E y =E( y )= 且是无偏估计
5.2 群规模大小相等时的估计
对群均值的估计： Y=y
2 ( Y Y ) i N
y
1
n
i
n
1 f 1 V (y) n N 1 y的方差为 V ( y ) V ( y / M ) 1 f 1 1 f 2 nM N 1 n N M 2 2 1 f Sb ( Y Y ) 2 i Sb N 1 i 1 nM
1 6 4 4 21 23
2 24 26 9 14 5
3 18 17 23 9 29
4 14 7 20 24 15
5 24 24 8 39 28
6 25 18 23 37 22
7 32 19 25 23 30
8 35 12 12 22 16
9 29 21 39 16 13
10 2 3 9 7 23
第 i群个体均值
Yi
N
样本
yi
n
Y
j 1
M
ij
y
j 1
M
ij
Y Yi / N
i 1
y yi / n
i 1
Y
Y N M = Yij / NM M i 1 j 1
y n M y = yij / nM M i 1 j 1
Yi =Yi /M
2 b
yi yi / M
群间方差群内方差
M n M N 2 2 sb ( yi y)2 S (Y i Y ) n 1 i 1 N 1 i 1 n M N M 1 1 2 2 2 s ( yij y i )2 Sw (Yij Y i ) w n( M 1) i 1 j 1 N ( M 1) i 1 j 1