抽样调查-第6章整群抽样

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

的相关程度,其表达式为：
返回

E (Yij Y )(Yik Y ) E (Yij Y ) 2
又可表示为：根据组合及平均值的计算，
2 (Yij Y )(Yik Y )
i 1 j k N M

( M 1)( NM 1) S 2
返回
事实上，前面提到的 V ( y ) 可以用群内相关系数近似表示：
返回
若采用简单随机抽样，直接从总体中抽取 nM 个个体单元，则 y 的方差公式为：
1 f 2 Vsrs ( y ) S nM
由此，可以计算等群抽样的设计效应： V ( y) deff 1 ( M 1) VSRS ( y )
这表明，整群抽样的方差约为简单随机抽样方差的
1 ( M 1) 倍
115
80
117
63
99
130
106
105
120
86
112.83
93.33
72.57
527.87
返回
n 解：已知 N 315, n 8, M 6, f 0.0254 , N
故
1 n 75 89 93.33 y yi 98.17 n i 1 8 M n s ( y i y) n 1 i 1 6 [(75 98.17) 2 (93.33 98.17) 2 926.63 8 1
增大样本容量。
返回
另外，群内相关系数
2 b
2 S 也可以用群内方差 w
和群间方差 S 表示，并由样本统计量估计：
s ,s
2 w
2 b
s s 2 2 sb ( M 1) sw
2 b 2 w
返回
【例 4.2】估计例4.1中以宿舍为群的群内相关系数
与设计效应.
2 解：由例4.1已计算出样本群间方差 sb 928.6648
2 2 sb sw 2 0.348256 2 sb ( M 1) sw
deff 1 ( M 1) 1 (6 1) 0.348256 2.741
设计效应2.741表明，在这项调查中，为达到

同样的估计精度，整群随机抽样的样本量大约为
简单随机抽样样本量的2.74倍．而此时简单随机抽样的样本量为:
nsrs
nM 8 6 18 deff 2.74
返回
二、群规模不等时的估计采用整群抽样,如果各群规模 M i 不等,情况会复杂一些. 此时,有多种不同的抽样方法.
1、等概抽样，简单估计
此时，不考虑群规模不等的影响，抽样方法与前节群规模相等时相同，估计方法也相同，即采用简单随机抽样。对总体均值 Y 的估计为：
n
返回
总体中的个体均值：
Y
i 1 j 1
N
Mi
Yij M0
N M 1 2 总体方差： S 2 ( Y Y ) ij M 0 1 i 1 j 1
样本方差：
s2
1
n i 1
i 1 m 1 i
2 ( y y ) ij i j 1
n
mi
返回
总体群间方差：
群的规模又有两种情况：一种是总体中的各个群
规模相等；另一种是总体中各个群的规模不相等。
返回
四、附号说明
总体群（PSU)数：N 样本群数：n
第i个群中的单元（SSU)数量： M i 总体第 i 群中第 j个单元的指标值： Yij
y ij 样本第 i 群中第 j个单元的观测值：
总体中单元总数：M 0
Mi
1 1 f 1 N 2 V ( y) 2 V ( y) . ( Y Y ) i 2 M nM N 1 i 1
1 f NM 1 . 2 .S 2 .[1 ( M 1) ] n M ( N 1)
1 f 2 S [1 ( M 1) ] nM
名学生。用简单随机抽样在全部N=315间宿舍中抽取
n=8间宿舍。全部48个学生上周每人的零花钱
yij 及
相关计算数据如下表。试估计该学校学生平均每周
的零花钱
Y
，并给出其95%置信区间。
返回
8个宿舍48名学生每周零花钱支出额
i
1 2 3 4 5 6 58 91 123 99 110 111 83 83 89 105 99 100 74 79 94 98 132 116
返回
§4.2 等概率整群抽样
在N个初级抽样单元中，第i个初级单元含 M i 个二级抽样单元。对于整群抽样而言，被抽中的群中所有二级单元全部入样。我们先考虑最简单的情形：每个群所包含的单元数M相等，称为群规模相等。（实际问题中只要群规模接近，也可视为群规模相等）。在群规模相等的情况下，整群抽样一般采用简单随机抽样方法抽取群，这时对总体均值的估计十分简单。
而样本群内方差为：
n M 1 2 2 sw ( y y ) ij i n( M 1) i 1 j 1
1 n 1 M 2 ( yij y i ) n i 1 M 1 j 1 1 n 2 si 220.79 n i 1
返回
由相关系数的估计式有
返回
一、群规模相等时的估计
1、均值估计量 y 及其方差
若按简单随机抽样,且群的大小相等,都等于 M ，则对总体 Y 均值的估计为：
yij 1 n y yi n i 1 i 1 j 1 nM
n M
返回
定理4.1
y 是 Y 的无偏估计，即
E ( y) Y
这样的结果是显然的，因为是按简单随机方法抽取群，所以样本群均值 y 是总体群均值 Y 的无偏估计，因而
2 b
返回
下面计算估计量方差的估计值：
1 f 2 1 0.0254 v( y ) sb 926.63 18.81 nM 8 6 s( y ) v( y ) 18.81 4.34
于是置信度为95%的置信区间为98.17±1.96×4.34，
也即[89.66元，106.68元】
yij
82 111 109 107 87 99 66 101 79 129 99 107 87 69 80 90 124 105
yi
75.0 89.0 95.67 104.67 108.50 106.33
si2
125.6 233.6 299.07 177.87 287.50 42.27
7
8
120
95
Sb
2
1 N Mi 2 ( Y Y ) i N 1 i 1 j 1
样本群间方差：
2
sb
1 2 ( y y ) i n 1 i 1 j 1
返回
n
mi
总体中第i个群群内方差：
S
2 i j 1
Mi
(Yij Y i ) M i 1
2
样本第i个群群内方差：
N
N 1
2
1 f i 1 1 f 2 所以 V ( y ) Sb nM M ( N 1) nM
(Yi Y )
返回
定理4.3 V ( y ) 的样本估计为：
1 f 2 v( y ) sb nM
2 由于 sb 是Sb百度文库的无偏估计，
因而 v( y )是V ( y ) 的无偏估计。总体总值 Y NM Y 的估计量为：
Y E ( y) Y M
返回
定理4.2
y 的方差为:
1 f 2 1 f 1 N 2 Sb V ( y) ( Y Y ) i nM n N 1 i 1
证明：因为 y M y, V ( y ) M 2V ( y),
1 f V ( y) n
N
2 ( Y Y ) i i 1
平方和
SSB (Y i Y )
i 1 j 1
N M
均方
2
N
M
SSB S N 1
2 b
2 Sw
SSW (Yi Y i ) 2
i 1 j 1
SSW N (M 1)
总计
NM 1
SST (Yij Y ) 2
i 1 j 1
N
M
S2
SST NM 1
s
2 i j 1
mi
( yij y i ) mi 1
2
返回
群规模相等时整群抽样总体群内方差：
N M 1 2 ( Y Y ) i ij N (M 1) i 1 j 1
Sw
2
群规模相等时整群抽样样本群内方差：
sw
2
n M 1 2 ( yij y i ) n( M 1) i 1 j 1
i 1
N
返回
总体中第i群的群总值： Yi
Y
i 1
Mi
ij
样本中第i群的群总值： yi yij
i 1
Mi
总体中第i群的个体均值： Yi
Yi M yi 样本中第i群的群均值： y i M n Yi 总体中的群均值：Y i 1 N
样本中的群均值：
yi y i 1 n
Y NM y
返回

总体总值 Y NM Y 的估计量的方差为：
V (Y ) V ( NM y ) N 2 M 2V ( y )

1 f 2 v(Y ) N M v( y ) N M ( ) Sb n
2 2 2
下面我们看一个整群抽样的例题
返回
【例4.11】在一次对某中学在校生零花钱的调查中，以宿舍作为群进行整群抽样，每个宿舍都有M=6
返回
整群抽样估计效应与群内相关系数关系密切，
2 S 若群内各单元的值都相等，则群内方差 w 0
1 为最大值， deff M 即整群抽样的估计此时，
量方差是简单随机抽样估计量方差的倍。
若群内方差与整体方差相等，即
0,
deff 1
整群抽样与简单随机抽样估计的效应相当。
元之间的差异尽可能大,以避免同一群内各单元提供重复信息.这个原则与分层抽样中划分层的原则
恰好相反.由此看来,整群抽样和分层抽样是针对不
同总体结构而提出的两种不同抽样方法.
返回
三、群的规模
群的规模是指组成群的单元的数量。群的规模大，估计的精度差，但费用省；群的规模小，估计的精度可以提高但费用增大。实践中，确定群的规模涉及多种因数，如群的具体结构、精度、费用、调查实施的组织管理等。
§4.1 整群抽样
一、整群抽样的定义与特点
1.整群抽样的定义整群抽样是将整体划分为若干群,然后以群为抽样单元,从总体中随机抽取一部分群，对抽中的群中的所有基本单元进行调查的一种抽样技术。 2.整群抽样的优点（1）抽样框编制得以简化（2）实施调查便利，节约费用 3.整群抽样的缺点：抽样误差较大。
1 n 1 n Mi yij y y i n i 1 n i 1 j 1 M i
返回
y 的方差估计为：
1 f 1 n 2 v( y ) . ( y y ) i n n 1 i 1
因为群规模不等，估计时又未考虑权数，所以
返回
二、群的划分
整群抽样中的群大致可分为两类：
一类是根据行政或地域形成的群体，如学校企业
和街道，对此采用整群调查是为了方便调查，节约费用。
另一类群则是调查人员人为确定的，如将一大块
面积划分若干块较小面积的群，这时就需要考虑如何划分群，以使在相同调查费用下调查误差最
小。
返回
群划分的一般原则
为了提高精度,划分群时应力争使同一群内各单
返回
2、整群抽样效率分析
1 f 2 在整群抽样中，由于 V ( y ) Sb nM
估计量的方差主要依赖群间的变异性。因此
S b2 整群抽样中 2 较大，则整群抽样就会损失精度。 Sw
下面我们用方差分析表来讨论这一问题。
返回
群规模相等时的整群抽样
总体方差分析表
来源
群间群内
自由度
N 1
N ( M 1)
返回
我们将整群抽样与简单随机抽样的效率进行比较，假设直接从总体中抽取一个样本容量为nM
的简单随机样本，则样本均值的方差为：
nM S 2 1 f 2 Vsrs ( y ) (1 ) S NM nM nM
但如果该整体被等分为N个规模为M的群，定义
为群内相关系数,描述同一群内成对个体单元之间
返回
若群内方差大于总体方差时，ρ的取值为负， deff 1, 此时，整群抽样的效率高于简单随机抽样。因此，要提高整群抽样的效率，就要通过分群
尽可能降低值。这一点是通过增大群内单元之
间的差异实现的。
对于自然形成的群而言，无法通过调整群内单元
而控制的取值。这时，要想减少抽样误差，就只能

抽样调查-第6章 整群抽样

抽样调查-第6章整群抽样