第六章 整群抽样
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
费额的户平均值 Y ,并给出其95%的置信区
间(P213)。
12个楼层96户居民人均月食品消费额资料
i
yij
1 240, 187, 162, 185, 206, 197, 154, 173
2 210, 192, 184, 148, 186, 175, 169, 180
3 149, 168, 145, 130, 170, 144, 125, 167
比例,在总体中按简单随机抽样抽取n个群,则
p
1 n
n i 1
pi
1 nM
n
ai
i 1
N
V ( p) 1 f n
i 1
(Pi P)2 N 1
v( p)
1 f n(n 1)
n i 1
( pi
p)2
deff
V ( p) Vran ( p)
M NPQ
n
(Pi
i 1
P)2
例3:在例1中,对某居民小区居民进行食品消费
N
mi
Y Yi N , y yi n;
j 1
i 1
N Mi
n
Y
Yij M 0 , y yi n.
i1 j1
i 1
二、按简单随机抽样抽群
➢简单估计
N
Yˆ
N n
n i 1
yi
N y,V ( yˆ)
N 2 (1 n
f)
(Yi Y )2
i 1
N 1
n
v( yˆ) N 2 (1 f ) i1 ( yi y)2
9个工厂成年男子身高资料的平方和分解
变差来源
群(工厂)间 群(工厂)内
总计
平方和 35 618
1 978 596 2 014 214
自由度 8 731 739
均方(方差)
sb2=4 452 sw2=2 707 s2=2 726
7个工厂成年女子身高资料的平方和分解
变差来源
群(工厂)间 群(工厂)内
总计
工人数 mi ,月奖金总额 yi 及人均月奖金 yi
如表(P232)所示。
试用简单估计与比估计两种方法估计
该系统人均月奖金 Y ,并比较其精度。
已知该系统共有职工人数 M0 =337208人 (P232) 。
三、按与群大小成比例的不等概率抽样抽群
➢放回PPS抽样 总体总和Y的汉森----赫维茨估计量:
调查的同时,也进行网络使用情况的调查,下表
是12个样本楼层使用网络的住户数 ai 及在楼层8 户中所占的比例 pi 的资料,试对该小区的网络使 用率 P进行估计(P224)。
i
ai
pi
i
ai
pi
1
4
0.5
7
5
0.625
2
3
0.375
8
2
0.25
3
5
0.625
9
6
0.75
4
6
0.75
10
4
0.5
5
3
0.375
n
n 1
➢比估计
n
N
YˆR M 0Yˆ M 0
yi
i 1 n
mi
,V (YˆR )
N 2 (1 n
f
)
i 1
M
2 i
(Y
i
Y
)2
N 1
i 1
v(YˆR )
N 2 (1 n
f
)
1 n n 1 i1
yi2
2
Y R
n i 1
mi2
2Y
R
n i 1
mi
yi
例4:从共有790个单位的某系统中按简单 随机抽样抽取n=20个单位,这些单位的职
8 230, 205, 187, 176, 212, 253, 189, 240
9 274, 208, 195, 307, 264, 258, 210, 309
10 232, 187, 150, 182, 175, 212, 169, 222
11 342, 294, 267, 309, 258, 198, 244, 286
YˆHH
1 n
n i 1
yi zi
M0 n
n i 1
yi mi
M0 y
y
1 n
n i 1
yi mi
1 n
n i 1
yi
V (YˆHH )
M0 n
N
M i (Y i Y )2
i 1
v(YˆHH )
M
2 0
n(n 1)
n i 1
(yi
y)2
➢不放回πPS抽样
总体总和Y的估计应用霍维茨---汤普
M
( yij y)2
j 1
➢总体群间方差:
Sb2
MN N 1 i1
Yi Y
2
➢样本群间方差:
sb2
M n 1
n i 1
2
yi y
➢总体群内方差:
➢样本群内方差:
S2
1 N (M 1)
N i 1
M j 1
Yij
Yi
2
s2
1
n
n(M 1) i1
M j 1
yij yi
2
二、估计量及其性质
4 202, 187, 166, 232, 205, 263, 198, 210
5 210, 285, 308, 198, 264, 275, 183, 231
6 394, 256, 192, 280, 267, 334, 216, 289
7 192, 121, 172, 165, 152, 224, 195, 241
1
n
1
n i 1
ai2
p2
n i 1
mi2
2p
n i 1
ai mi
M
第四节 群大小不等的一般情形
若群大小Mi 相差不多,以平均群大小M 代替M, 仍可按群大小相等处理;若Mi 相差较大,有两 种处理方法。
一、记号
➢ 总体第i群第j个小单位指标值 Yij,i=1,2,…,N; j=1,2,…, Mi,Mi 是群的大小。
平方和 19 112
1 216 203 1 235 315
自由度 6 524 530
均方(百度文库差)
sb2=3 185 sw2=2 321 s2=2 331
四、整群抽样效率分析及群的划分原则
在总体方差固定的条件下,整群抽样的精 度取决于群内相关系数,群内相关系数愈小, 即群内差异或群内方差愈大,则估计量的精度 愈高。
nM
n
yij
y i1 j1
y
yi
i 1
nM M n
V(y) 1 f nM
Sb2
例1:在一次某城市居民小区居民食品消费 量调查中,以每个楼层(相当于居民小组) 为群进行整群抽样。每个楼层都有M=8个住 户。用简单随机抽样在全部N=510个楼层中 抽取n=12个楼层。全部96个样本户人均月食 品消费额yij及按楼层的平均数 yi 与标准差si 如下表所示。试估计该居民小区人均食品消
12 228, 294, 182, 312, 267, 254, 232, 298
yi
188.00 180.50 149.75 207.875 244.25 278.50 182.75 211.50 253.125 191.125 274.75 258.375
si
27.19 17.98 17.32 29.17 45.20 63.87 38.77 27.48 44.52 28.29 43.70 43.52
一、符号说明 ➢总体群数 N ,样本群数 n ➢第i群中包含的总体单位数 M ➢总体第i群第j个单位指标值 Yij ➢样本第i群第j个单位指标值 yij
➢总体第i群的群和 ➢样本第i群的群和 ➢总体第i群的平均数 ➢样本第i群的平均数
M
Yi Yij j 1
M
yi yij j 1
Yi
Yi M
第七章 整群抽样
第一节 概述 第二节 群大小相等时的整群抽样 第三节 估计总体比例的整群抽样 第四节 群大小不相等的一般情形
第一节 概述
一、什么是整群抽样 ➢整群抽样是将总体划分为若干群,然后以
群为抽样单元,从总体中随机抽取一部分 群,对中选群中的所有基本单元进行调查 的一种抽样技术。
➢要求:群与群之间不重叠,且总体的任何 一个基本单位都只能且必须属于某一群。
➢ 样本第i群第j个小单位指标值 yij,i=1,2,…,n; j=1,2,…, mi,mi 是群的大小。
N
M 0 M i 是总体中小单元的总数; i 1
Mi
mi
Yi Yij , yi yij ;
j 1
j 1
Mi
mi
Y i Yij M i , yi yij mi ;
j 1
j 1
11
3
0.375
6
4
0.5
12
5
0.625
ai
三、群大小不等情形
➢所抽取群的大小为 mi ,群中具有所考虑特征的
小单位数为 ai ,总体比例的估计为:
n
ai
p
i 1 n
mi
i 1
N
V ( p)
1
f
2
nM
M
2 i
(
Pi
P)2
i 1
N 1
M2
1 N
N
Mi
i 1
v( p)
1
f
2
nm
整群抽样中群所起的作用与分层抽样中层 所起的作用正好相反。在分层抽样中,估计量 的方差取决于层内方差,对于整群抽样,应该 采用尽可能使群间方差小而群内方差大的划分 方式。
第三节 估计总体比例的整群抽样
一、问题的提出 ➢在判断一个单元是否具有所考察的某项特征的 调查,普遍采用整群抽样,因它总的效率较高。
➢在估计总体比例时,群大小无论相等或不相等, 对群的抽样均可采用简单随机抽样,不过估计量 需要采用不同的形式:在群大小相等时,一般采 用简单估计;在群大小不等时,需采用比估计。
二、群大小相等情形
➢以 Ai (ai ), Pi ( pi ) 分别表示总体(样本)第i群中具 有所考察特征的小单元数及其在小单元总数中的
三、群内相关系数与设计效应
1、群内相关系数(interclass correlation cofficient) 表示同一群内不同小单元的指标值对总体均值的 离差乘积的期望值与总体中所有小单元指标值对 总体均值离差平方的期望值之比。
c
E(Yij Y E (Yij
)(Yik Y Y )2
)
ˆ c
二、整群抽样的特点及适用场合 ➢抽样框的编制得以简化 ➢实施调查便利,节省费用 ➢通常情况下其抽样误差较大,可通过适当
增大样本量的方法弥补估计精度的损失
➢当群的大小接近时,常采用简单随机抽样 ➢当群的大小相差比较大时,为提高效率则
更多地采用不等概率抽样
第二节 群大小相等的整群抽样
——对群进行简单随机抽样时的估 计量与方差
yi
yi M
➢总体平均群和 Y Yi N
➢样本平均群和 y yi n
➢总体均值
NM
Y Yij MN Y M i1 j1
➢样本均值
nM
y yij Mn y M i1 j 1
➢总体总方差:
S 2
1N NM 1 i1
M
(Yij
j 1
Y )2
➢样本总方差:
s2 1
n
nM 1 i1
森估计量:
YˆHT
n i 1
yi, i
i
nzi
nmi M0
sb2
sb2 s2 (M 1)s2
s2
1 n
n i 1
si2
2、设计效应
V(y) 1 f nM
S 2 1 (M
1)c
1 f Vran ( y) nM
S2
deff
V(y)
Vran ( y )
1 (M
1)c
整群抽样的方差约为简单随机抽样的方差
的 1 (M 1)c 倍。
例2:在某地进行一次人体测量,采用以工 厂为群的整群抽样。其中成年男子组抽了9 个工厂,共测了740人;成年女子组抽了7 个工厂,共测了531人。下表分别是以身高 (单位mm)为指标值的男女两组样本资料 的平方和分解表,试计算各自的群内相关 系数及整群抽样的设计效应(P217)。
间(P213)。
12个楼层96户居民人均月食品消费额资料
i
yij
1 240, 187, 162, 185, 206, 197, 154, 173
2 210, 192, 184, 148, 186, 175, 169, 180
3 149, 168, 145, 130, 170, 144, 125, 167
比例,在总体中按简单随机抽样抽取n个群,则
p
1 n
n i 1
pi
1 nM
n
ai
i 1
N
V ( p) 1 f n
i 1
(Pi P)2 N 1
v( p)
1 f n(n 1)
n i 1
( pi
p)2
deff
V ( p) Vran ( p)
M NPQ
n
(Pi
i 1
P)2
例3:在例1中,对某居民小区居民进行食品消费
N
mi
Y Yi N , y yi n;
j 1
i 1
N Mi
n
Y
Yij M 0 , y yi n.
i1 j1
i 1
二、按简单随机抽样抽群
➢简单估计
N
Yˆ
N n
n i 1
yi
N y,V ( yˆ)
N 2 (1 n
f)
(Yi Y )2
i 1
N 1
n
v( yˆ) N 2 (1 f ) i1 ( yi y)2
9个工厂成年男子身高资料的平方和分解
变差来源
群(工厂)间 群(工厂)内
总计
平方和 35 618
1 978 596 2 014 214
自由度 8 731 739
均方(方差)
sb2=4 452 sw2=2 707 s2=2 726
7个工厂成年女子身高资料的平方和分解
变差来源
群(工厂)间 群(工厂)内
总计
工人数 mi ,月奖金总额 yi 及人均月奖金 yi
如表(P232)所示。
试用简单估计与比估计两种方法估计
该系统人均月奖金 Y ,并比较其精度。
已知该系统共有职工人数 M0 =337208人 (P232) 。
三、按与群大小成比例的不等概率抽样抽群
➢放回PPS抽样 总体总和Y的汉森----赫维茨估计量:
调查的同时,也进行网络使用情况的调查,下表
是12个样本楼层使用网络的住户数 ai 及在楼层8 户中所占的比例 pi 的资料,试对该小区的网络使 用率 P进行估计(P224)。
i
ai
pi
i
ai
pi
1
4
0.5
7
5
0.625
2
3
0.375
8
2
0.25
3
5
0.625
9
6
0.75
4
6
0.75
10
4
0.5
5
3
0.375
n
n 1
➢比估计
n
N
YˆR M 0Yˆ M 0
yi
i 1 n
mi
,V (YˆR )
N 2 (1 n
f
)
i 1
M
2 i
(Y
i
Y
)2
N 1
i 1
v(YˆR )
N 2 (1 n
f
)
1 n n 1 i1
yi2
2
Y R
n i 1
mi2
2Y
R
n i 1
mi
yi
例4:从共有790个单位的某系统中按简单 随机抽样抽取n=20个单位,这些单位的职
8 230, 205, 187, 176, 212, 253, 189, 240
9 274, 208, 195, 307, 264, 258, 210, 309
10 232, 187, 150, 182, 175, 212, 169, 222
11 342, 294, 267, 309, 258, 198, 244, 286
YˆHH
1 n
n i 1
yi zi
M0 n
n i 1
yi mi
M0 y
y
1 n
n i 1
yi mi
1 n
n i 1
yi
V (YˆHH )
M0 n
N
M i (Y i Y )2
i 1
v(YˆHH )
M
2 0
n(n 1)
n i 1
(yi
y)2
➢不放回πPS抽样
总体总和Y的估计应用霍维茨---汤普
M
( yij y)2
j 1
➢总体群间方差:
Sb2
MN N 1 i1
Yi Y
2
➢样本群间方差:
sb2
M n 1
n i 1
2
yi y
➢总体群内方差:
➢样本群内方差:
S2
1 N (M 1)
N i 1
M j 1
Yij
Yi
2
s2
1
n
n(M 1) i1
M j 1
yij yi
2
二、估计量及其性质
4 202, 187, 166, 232, 205, 263, 198, 210
5 210, 285, 308, 198, 264, 275, 183, 231
6 394, 256, 192, 280, 267, 334, 216, 289
7 192, 121, 172, 165, 152, 224, 195, 241
1
n
1
n i 1
ai2
p2
n i 1
mi2
2p
n i 1
ai mi
M
第四节 群大小不等的一般情形
若群大小Mi 相差不多,以平均群大小M 代替M, 仍可按群大小相等处理;若Mi 相差较大,有两 种处理方法。
一、记号
➢ 总体第i群第j个小单位指标值 Yij,i=1,2,…,N; j=1,2,…, Mi,Mi 是群的大小。
平方和 19 112
1 216 203 1 235 315
自由度 6 524 530
均方(百度文库差)
sb2=3 185 sw2=2 321 s2=2 331
四、整群抽样效率分析及群的划分原则
在总体方差固定的条件下,整群抽样的精 度取决于群内相关系数,群内相关系数愈小, 即群内差异或群内方差愈大,则估计量的精度 愈高。
nM
n
yij
y i1 j1
y
yi
i 1
nM M n
V(y) 1 f nM
Sb2
例1:在一次某城市居民小区居民食品消费 量调查中,以每个楼层(相当于居民小组) 为群进行整群抽样。每个楼层都有M=8个住 户。用简单随机抽样在全部N=510个楼层中 抽取n=12个楼层。全部96个样本户人均月食 品消费额yij及按楼层的平均数 yi 与标准差si 如下表所示。试估计该居民小区人均食品消
12 228, 294, 182, 312, 267, 254, 232, 298
yi
188.00 180.50 149.75 207.875 244.25 278.50 182.75 211.50 253.125 191.125 274.75 258.375
si
27.19 17.98 17.32 29.17 45.20 63.87 38.77 27.48 44.52 28.29 43.70 43.52
一、符号说明 ➢总体群数 N ,样本群数 n ➢第i群中包含的总体单位数 M ➢总体第i群第j个单位指标值 Yij ➢样本第i群第j个单位指标值 yij
➢总体第i群的群和 ➢样本第i群的群和 ➢总体第i群的平均数 ➢样本第i群的平均数
M
Yi Yij j 1
M
yi yij j 1
Yi
Yi M
第七章 整群抽样
第一节 概述 第二节 群大小相等时的整群抽样 第三节 估计总体比例的整群抽样 第四节 群大小不相等的一般情形
第一节 概述
一、什么是整群抽样 ➢整群抽样是将总体划分为若干群,然后以
群为抽样单元,从总体中随机抽取一部分 群,对中选群中的所有基本单元进行调查 的一种抽样技术。
➢要求:群与群之间不重叠,且总体的任何 一个基本单位都只能且必须属于某一群。
➢ 样本第i群第j个小单位指标值 yij,i=1,2,…,n; j=1,2,…, mi,mi 是群的大小。
N
M 0 M i 是总体中小单元的总数; i 1
Mi
mi
Yi Yij , yi yij ;
j 1
j 1
Mi
mi
Y i Yij M i , yi yij mi ;
j 1
j 1
11
3
0.375
6
4
0.5
12
5
0.625
ai
三、群大小不等情形
➢所抽取群的大小为 mi ,群中具有所考虑特征的
小单位数为 ai ,总体比例的估计为:
n
ai
p
i 1 n
mi
i 1
N
V ( p)
1
f
2
nM
M
2 i
(
Pi
P)2
i 1
N 1
M2
1 N
N
Mi
i 1
v( p)
1
f
2
nm
整群抽样中群所起的作用与分层抽样中层 所起的作用正好相反。在分层抽样中,估计量 的方差取决于层内方差,对于整群抽样,应该 采用尽可能使群间方差小而群内方差大的划分 方式。
第三节 估计总体比例的整群抽样
一、问题的提出 ➢在判断一个单元是否具有所考察的某项特征的 调查,普遍采用整群抽样,因它总的效率较高。
➢在估计总体比例时,群大小无论相等或不相等, 对群的抽样均可采用简单随机抽样,不过估计量 需要采用不同的形式:在群大小相等时,一般采 用简单估计;在群大小不等时,需采用比估计。
二、群大小相等情形
➢以 Ai (ai ), Pi ( pi ) 分别表示总体(样本)第i群中具 有所考察特征的小单元数及其在小单元总数中的
三、群内相关系数与设计效应
1、群内相关系数(interclass correlation cofficient) 表示同一群内不同小单元的指标值对总体均值的 离差乘积的期望值与总体中所有小单元指标值对 总体均值离差平方的期望值之比。
c
E(Yij Y E (Yij
)(Yik Y Y )2
)
ˆ c
二、整群抽样的特点及适用场合 ➢抽样框的编制得以简化 ➢实施调查便利,节省费用 ➢通常情况下其抽样误差较大,可通过适当
增大样本量的方法弥补估计精度的损失
➢当群的大小接近时,常采用简单随机抽样 ➢当群的大小相差比较大时,为提高效率则
更多地采用不等概率抽样
第二节 群大小相等的整群抽样
——对群进行简单随机抽样时的估 计量与方差
yi
yi M
➢总体平均群和 Y Yi N
➢样本平均群和 y yi n
➢总体均值
NM
Y Yij MN Y M i1 j1
➢样本均值
nM
y yij Mn y M i1 j 1
➢总体总方差:
S 2
1N NM 1 i1
M
(Yij
j 1
Y )2
➢样本总方差:
s2 1
n
nM 1 i1
森估计量:
YˆHT
n i 1
yi, i
i
nzi
nmi M0
sb2
sb2 s2 (M 1)s2
s2
1 n
n i 1
si2
2、设计效应
V(y) 1 f nM
S 2 1 (M
1)c
1 f Vran ( y) nM
S2
deff
V(y)
Vran ( y )
1 (M
1)c
整群抽样的方差约为简单随机抽样的方差
的 1 (M 1)c 倍。
例2:在某地进行一次人体测量,采用以工 厂为群的整群抽样。其中成年男子组抽了9 个工厂,共测了740人;成年女子组抽了7 个工厂,共测了531人。下表分别是以身高 (单位mm)为指标值的男女两组样本资料 的平方和分解表,试计算各自的群内相关 系数及整群抽样的设计效应(P217)。