第七章整群抽样
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i1 j1
i 1
(NM 1)S 2 N(M 1)Sw2 (N 1)Sb2
S2
N(M
1)S
2 w
(N
1) Sb 2
NM 1
同理:s2 n(M 1)sw2 (n 1)sb2 nM 1
(s2不是S 2的无偏估计。)
S 2的无偏估计为:Sˆ 2 N(M 1)sw2 (N 1)sb2 NM 1
1 f nM 2
n
(yi
ˆ YR
mi)2
i 1
n 1
Yˆ
M
ˆ 0YR
例:从某新村中抽了由38户组成的一个简单随机样 本,调查每户参加体育活动的人数,设第i户有
Mi个人,其中参加体育活动的有ai人。经计算:
38
mi 134
i 1 38
ai 30
i 1
38
mi2 536
i 1 38
ai2 58
iY
)2
N
而 (Y iY )2 (NM 1)S 21(M 1)c i 1
代入式(1)得:
V(y)
1 f(NM 1)S 21(M
nM 2 N 1
1)c
(1)
四、样本容量的确定: 1.根据方差公式确定。
若精度要求为V(y) V,确定样本量。
V(y) 1 f nM
S
2 b
V
则n0
S
2 b
MV
,n
n0 1 n0
y
1 n
n i 1
yi mi
1 n
n i 1
yi
2663.4(吨)
因此YˆHH M 0 y 186 2663.4 495392.4(吨)
s(YˆHH)
M 02 n(n
n
1)i(1 yi
y)2
9736.5(吨)
•
生活中的辛苦阻挠不了我对生活的热 爱。21. 1.221.1. 2Satur day , January 02, 2021
样本第i群含有的单元数:mi
样本第i群第j个单元的观测值:yij
总体中单元总数:
N
M 0 M i
i 1
二、按简单随机抽样抽群时,总体总和、均值的估计量 及方差:
设群的样本量为n,则对Y的估计有两种方法。 (1)方法1:加权估计
则总体看作Y1,,YN 样本:y1,,yn
又Y NY
n
yi
M0
Y)2
M0 n
N
M i( Yi Y)2
i 1
例.某市建筑行业集团共有48个单位,有载货汽车186辆。 按每个单位的车辆拥有量成比例的概率进行放回的PPS 抽样,共抽10次。对抽中单位的所有车辆调查季度运量 (单位:吨)。样本数据如下:
样本单位编号i
车辆数mi
单位运量总和yi
1
5
14230
sb2 i1 n 1
nM
(yij y)2
s 2 i1 j1 nM 1
并且sw 2是S w 2的无偏估计,sb 2是Sb 2的无偏估计。
总体离差平方和的分解:
NM
NM
(Yij Y)2
(Yij Yi Yi Y)2
i1 j1
i1 j1
NM
N
(Yij Yi)2 M(Yi Y)2
2
8
21336
3
5
13650
4
4
11568
5
6
15216
6
9
23094
7
5
13650
8
3
7443
9
7
16723
10
3
8391
试估计全集团的季度运量及标准差。
平均每车运量yi
2846 2667 2730 2892 2536 2566 2730 2481 2389 2797
解:全集团季度总运量Y的估计为:
i 1
n i 1
pi
nM
nM
n
n
E( y) Y E( p) P即p是P的无偏估计。
V(p) 1 f
n
1 N 1
N
(Yi
i 1
Y)2
1 f
n
1 N 1
N
(Pi
i 1
P)2
v(p) 1 f
n
1 n 1
n
(yi
i 1
y)2
1 f
n
1 n 1
n
(pi
i 1
p)2,且E(v(p)) V(p)。
123 99 110 111 120 96 89 105 99 100 115 80 94 98 132 116 117 63
109 107 87 99 99 130 79 129 99 107 106 105 80 90 124 105 120 86
试估计该学校平均每个学生每周的零花钱,并给出置信 度为95%的置信区间。
第七章 整群抽样
7.1 概述
一、整群抽样(cluster sampling)的定义: 由若干个基本单元所组成的集合称为群。将总体划分为若干群,
然后以群为抽样单元,从总体中随机抽取一部分群,对抽中的群 中的所有基本单元进行调查的一种抽样技术。
严格来讲也称为单阶整群抽样。 二、特点:
1.可以简化抽样框的编制。 2.实施调查便利,节省费用。 3.但通常比简单随机抽样的抽样误差大。 三、分群的原则:群内单元差异大,群间差异小。 这样,被抽到的群代表性好,整群抽样的效率就高。
•
人生得意须尽欢,莫使金樽空对月。2 0:51:56 20:51:5 620:51 1/2/202 1 8:51:56 PM
•
做一枚螺丝钉,那里需要那里上。21. 1.220:5 1:5620:51Jan-2 12-Jan -21
i 1 25
yi2 82039000000
i 1
25
mi y估计量的最大绝对误差为500美圆(置 信度为95%),应抽多大的样本?
n
解:
ˆ YR
yi
i 1 n
8801
mi
i 1
n
(yi
ˆ YR
mi)2
n
yi 2
ˆ 2YR
n
yi mi
ˆ YR
2
n
N2 1 f n
1 n 1
n
(yi
i 1
y)2且E(v(Yˆ)) V(Yˆ)。
(3)P的估计 : 总体小单元的指标值Yij只能取0或1。
Y
P
N i 1
M
Yij
j 1
N
Ai
i 1
N Ai M
i 1
N
Pi
i 1
NM NM
N
N
y p
n i 1
M
yij
j 1
n
ai
i 1
n ai M
样本:y1,,yn
n
Y的估计为:Yˆ
y
i 1
yi ,且是Y的无偏估计。
n
V(y) 1 f n
S
2 y
1 f n
1 N 1
N
(Yi
i 1
Y)2
v(y) 1 f n
s
2 y
1 f n
1 n 1
n
(yi
i 1
y)2是V(y)的无偏估计。
又Y Y / M , y y / M,并且y是Yˆ的无偏估计
( yij Y )( yik Y )
i1 jk
N M ( yij Y )2 (Ni1Mjk1)(M 1)S 2
(M 1)(NM 1) i1 j1 NM 1
3.整群抽样的设计效应:
整群抽样时,
V(y) 1 f
n
1 N 1
N i 1
(Y
iY
)2
1 f nM 2
1 N 1
N i 1
(Y
N i1 ,且是Y的无偏估计。 n
N 2 1 f
n
1 N 1
N
(Yi
i 1
Y)2
N2 1 f n
1 n 1
n
(yi
i 1
y)2
1 f nM 2
1 n 1
n
(yi
i 1
y)2
(2)比估计:
N
Yi
Y
i 1 N
Mi
i 1
N
1 f nM 2
i 1
M i(2 Yi Y)2 N 1
v(YˆR)
n 8, N 315
Yˆ
y
1 n
n i 1
yi
98.17
sb2
M n 1
n
(yi
i 1
y)2
928.6648
v(y) 1 f nM
sb2
18.8558
s(y) v(y) 4.3423
Y 的置信度为95%的置信区间为:
y 0.975s(y),y 0.975s(y)
即89.66,106.68
例:在一次对某寄宿中学在校生零花钱的调查中,以宿 舍作为群进行整群抽样。每个宿舍有6个学生。用简单 随机抽样在全部315间宿舍中抽取8间宿舍。样本数据 如下:
宿舍1 宿舍2 宿舍3 宿舍4 宿舍5 宿舍6 宿舍7 宿舍8
学生1 学生2 学生3 学生4 学生5 学生6
58 91 83 83 74 79 82 111 66 101 87 69
解:
学生1 学生2 学生3 学生4 学生5 学生6
yi
si2
宿舍1 宿舍2 宿舍3 宿舍4 宿舍5 宿舍6 宿舍7 宿舍8 58 91 123 99 110 111 120 96 83 83 89 105 99 100 115 80 74 79 94 98 132 116 117 63 82 111 109 107 87 99 99 130 66 101 79 129 99 107 106 105 87 69 80 90 124 105 120 86 75.00 89.00 95.67 104.67 108.50 106.33 112.83 93.33 125.60 233.60 299.07 177.87 287.50 42.27 72.57 527.87
mi 2
sd2 i1 n 1
i1
i 1
i 1
n 1
634479260
n
mi
m i1 6.04 25
三.按与群规模Mi成比例的PPS抽样抽取群:
每次按Zi
Mi M0
,i
1,2,,
N的概率抽取第i群。
V(YˆHH)
1 n
N i 1
Z(i
Yi Zi
Y)2
1 n
N i 1
M i( Yi M0 Mi
2.群内相关系数:是表达总体中群内小单元间相关程度的一个指标。
定义:
NM
( yij Y )( yik Y )
i1 jk
c
E( yij Y E( yij
)( yik Y Y )2
)
N
M 2
NM
( yij Y )2
i1 j1
NM
NM
NM
2
( yij Y )( yik Y )
2
Yˆ Yˆ / M y / M y且是Y的无偏估计。
V(y) V( y M
)
1 M2
V(y)
(1)Y
的估计为 :
ˆ Y
y且E( y)
Y。
V(y) 1 f
n
1 N 1
N
(Yi
i 1
Y)2 1 f nM
Sb2
其中Sb2
M N 1
N
(Yi
i 1
Y)2
v(y) 1 f
n
1 n 1
n
(yi
三、整群抽样的设计效应: 1.群内、群间差异的定量刻划:
总体
样本
群内方差 群间方差
方差
NM
(Yij Yi)2
Sw2
i1 j1
N(M
1)
N
M(Yi Y)2
Sb2 i1 N 1
NM
(Yij Y)2
S 2 i1 j1 NM 1
nM
(yij yi)2
sw2
i1 j1
n(M
1)
n
M(yi y)2
NM
Yij
总体均值Y i1 j1 NM
总体的群间方差 :
Sb2
M N 1
N
(Yi
i 1
Y)2
总体的群内方差 :
S
2 w
1 N (M 1)
N i 1
M
(Yij Yi )2
j 1
1 N
N
Si2
i 1
样本
M
样本第i群的群和yi yij j 1
n
yi
样本群和的均值y i1 n
nM
yij
7.2 群规模相等情形,对群进行简单随 机抽样时的估计量及其方差
一、符号: 总体群数:N 每群含有的单元数:M 总体第i群第j个单元的指标值:Yij 总体中单元总数:M0=NM
样本群数:n 样本第i群第j个单元的观测值:yij
总体
M
总体第i群的群和Yi Yij j 1
N
Yi
总体群和的均值Y i1 N
i 1
y)2 1 f nM
sb2
且E(v(y)) V(y)。
(2)Y的估计为:Yˆ NMy且E(Yˆ) Y。
V(Yˆ) V(NMy)
(NM )2 1 f n
1 N 1
N
(Yi
i 1
Y)2
N 2 1 f
n
1 N 1
N
(Yi
i 1
Y)2
v(Yˆ) v(NMy) (NM )2 v(y)
N
(Yi
Y
M
)2
i
Mi
其中S
2 d
i 1
N 1
,M i1 N
例:调查预估计某城市的人均收入,该城市共 415个街区,从中随机抽取了25个进行试点调 查,调查每个街区的居民数Mi和总收入Yi(单 位:美圆),数据如下:
25
mi 151
i 1 25
yi 1329000
i 1
25
mi2 1047
N
2.整群抽样时,V(y)
1 f nM 2
S 2[1(M
1)c ]
Vs(rs Yˆ)
1 f nM
S
2
令V(y) Vs(rs Yˆ),假定抽样比忽略
则n n[1(M 1)c ] nDeff
7.4 群规模不相等的一般情形
一、符号:
总体群数:N
总体第i群含有的单元数:Mi 总体第i群第j个单元的指标值:Yij 样本群数:n
i 1
38
miai 126
i 1
试估计该新村参加体育活动的人所占的比例及其 标准差。(不计算f)
解: 用比估计估计总体比例
n
p
ai
i 1 n
mi
30 0.22 134
i 1
*利用比估计来估计总体均值,精度要求为V时,样本量 的确定:
比估计时,令V(YˆR)
1 f nM 2
S
2 d
V
N
样本均值y i1 j1 nM
样本的群间方差 :
sb2
M n 1
n
(yi
i 1
y)2