等概率整群抽样和多阶段抽样

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
度低
• 等概抽样,比率估计
总体均值估计为 y
n yi nMi
这里辅助变量不是Xi而是群规模Mi
总体总量估计为
Yˆ M0 y M0
n yi nMi
估计量的方差分别是
N
N
1 f
(Yi YMi )2 1 f
M
2 i
(Yi
Y
)2
V ( y) nM 2
N 1
Yi: 总体中第i群的总量 Mi
Yi Yij j 1
yi: 样本中第i群的总量 Mi
yi yij j 1
总体中第i群个体均值 样本中第i群个体均值 总体的群均值
Yi Yi Mi
yi yi M i
N
Y Yi N
样本的群均值
n
y yi n
• 总体中的个体均值
• 样本方差
s2 1
n
nM 1 i1
M j 1
yij y 2
• 样本群间方差

sb2
样本群内方差

M n 1
n i
( yi y)2
sw2

1 n(M 1)
n i
M j
yij yi 2
4.2 等概率整群抽样
1. 群规模相等时的估计
均值估计量
v(y) 1 f nM
sb2
1 0.0254 926.63 18.81 86
s( y) v( y) 18.81 4.34
于是 Y 的置信度为95%的置信
区间为 98.17 1.96(4.34)
也即
89.66元,106 .68元
2. 整群抽样效率分析
群内相关系数 的表达式为:
花钱 yij 及相关计算数据如表.试
估计该校学生平均每周的零花钱Y ,
并给出其95%的置信区间.
8个宿舍48名学生每周零花钱支出额
i
yij
yi
si
1 58 83 74 82 66 87 75.00 125.60
2 91 83 79 111 101 69 89.00 233.60
3 123 89 94 109 79 80 95.67 299.07
方差

NMy
N n
n i 1
yi
V (Yˆ) V (NMy) N 2M 2V ( y)
v(Yˆ) N 2M 2v( y)
例1:在一次对某中学在校生零花钱的 调查中,以宿舍作为群进行整裙抽样, 每个宿舍都有M=6名学生,用简单随机 抽样在全部N=315间宿舍中抽取n=8 间宿舍. 全部48个学生上周每人零
SRS,群规模相同,均为M,则 Y 的估 计为:
ˆ
n
Y y
M
yij
nM

1 n
n
yi
Yˆ NMy n M Nyij n
比较SRS抽 取nM个样本
定理1: y 是Y 的无偏估计,即
Ey Y
因为是按简单随机方法抽取群,所
以样本群均值 y 是总体群均值的
无偏估计,因而
i1 j1
(NM 1)(M 1)S 2
y 的方差可用群内相关系数近似
N
2
V
(y)

1 M2
V
(y)

1 f nM 2
Yi Y
i 1
N 1
1 f n
(NM 1) M 2 (N 1)
S
2 1
M
1

1 f S 21 M 1
解:已知N=315,n=8,M=6,
f=n/N=0.0254 故
y

1 n
n i 1
yi

75 89
8
99.33

98.17(元)
sb2

M n 1
n i1
(
yi

y)2

8
6 1
(75 98.17)2

(93.33

98.17)2


926.63
若 nsrs 令为简单随机抽样的样
本量则
nsrs
Mn deff
86 2.74
18
即用简单随机抽样18个学生,可达 到整群抽样48个学生相同的估计 精度
2 群Mi规模不等时的估计
• 如果各群规模不等,前面简单估计 量是有偏的
• 等概抽样,总体均值的无偏估计
y
n
Mi yi 1 nM nM
1n (
n 1
yi2 y 2
n
M
2 i

2y
n
M i yi )
n
v(Yˆ) N 2 (1 f ) ( yi yM i )2
n
n 1
N 2 (1 f )
1
n
(
n n 1
yi2 y 2
n
M
2 i

2y
n
M i yi )
例3:某县有33个乡,726个村, 某一年度某农作物总种植面积 30525亩. 现采用等概抽样随机 抽出10个乡,要求利用无偏估计 量和比率估计量分别估计全县总 产量,并给出估计量的标准差。
当 为负时,deff<1,取值范围是

1 M
1
,1
群间方差为0
群内相关系数也可由样本统计量
表示 sw2 , sb2
ˆ

sb2
sb2 (M
sw2 1)sw2
sb2 / sw2 较大,则分层抽样精度较高,
而整群抽样的精度较低。
例2 由例1数据,计算群内相关系
数与设计效应
• 在整群抽样中, 群的规模具有相当的灵 活性,可大可小。群的规模大,估计的 精度差但费用省;群的规模小,估计的 精度提高但费用增大
• 实践中,确定群的规模涉及多种因素, 如群的具体结构、精度费用、调查实施 的组织管理等
• 对于规模大的群,通常采用多阶段抽样。
群的规模有两种情况:
• 总体中的各群规模相等 采用等概率的方法抽取群
(各群 M i M ) Y Y M
• 样本中的个体均值
y yM
• 总体方差
S 2 1 N Mt 1 i
M j
2
Yij Y
• 总体群间方差
Sb2

M N 1
N i
(Yi Y )2
• 总体群内方差
S
2 w

1 N (M
1)
N i
M j
Yij Yi 2
nM 2
N 1
N
V (Yˆ)

M 02V ( y)

N 2M
2V ( y)

N 2 (1 n
f
)
(Yi YM i )2 N 1
V ( y) 与 V (Yˆ) 的样本估计分别是
n
v( y) 1 f
( yi yM i )2
nm 2
n 1
1 f
nm 2
• 简单随机抽样的方差公式为
1 f Vsrs ( y) nM
பைடு நூலகம்
S2
• 等群抽样的设计效应为
deff V ( y) 1 (M 1)
Vsrs ( y)
整群抽样的估计效率,与群内相关
系数 的关系密切
当 =1时,deff=M
群内方差为0
当 =0时,deff=1
群内方差与总体 方差相等
抽样,这就是实际调查中所用 的两阶段抽样,其中的群也称 为初级抽样单元,群内再抽样 的单元称为二级抽样单元
欲估计某高校大学生拥有的手机数量. 假 定该大学共有40 000大学生,10 000个 学生宿舍(每个宿舍住4人),抽400人
方案: 1、根据学生名录按简单随机抽样抽400人
2、根据学生宿舍名录随机抽100个宿舍, 并调查抽中宿舍的每个学生
ˆ

sb2
sb2 sw2 (M 1)sw2

926.63 220.79 926.63 (6 1)220.79
0.348
deff 1 (M 1)ˆ
1 (6 1) 0.348 2.74
表明为达到同样的估计精度,整群抽 样的样本量大约为简单随机抽样样本 量的2.74倍.
E(Yij Y )(Yik Y )
E(Yij Y )2
上式中的分子为:
N
(Yij Y )(Yik Y )
i1 jk
NM (M 1) 2
上式中的分母为:
NM
i1
(Yij
j 1
Y )2

NM
1 S 2
NM
MN
故 又可写为:
NM
2
(Yij Y )(Yik Y )
Ey Y M Y
定理2 y 的方差为
N
2
V (y) 1 f
Yi Y
i 1
n
N 1
1 f nM
S
2 b
证明: 由于 y My ,又
N
2
M 2V ( y) V ( y) 1 f
Yi Y
i 1
n N 1

N
2
样本乡 编号
1 2 3 4 5 6 7 8 9 10
村庄数 Mi
15 18 26 14 20 28 21 19 31 17
合计 209
作物总产量(乡) 种植面积(乡)
yi(万公斤)
xi(亩)
N
2
V
(
y
)

1 nM
f
2
Yi Y
i 1
N 1
1 f
Yi Y
i 1
nM M (N 1)
1 f nM
Sb2
定理3 V ( y) 的样本估计为
v( y) 1 f nM
sb2
因为
sb2

S
2 b
的无偏估计,
所以 v( y) 是 V ( y) 的无偏估计
总体总值 Y NMY 的估计
• 总体中的各群规模不等 采用不等概率的方法抽取群
符号说明
• N: 总体群数 • n: 样本群数 • Yij: 总体第i群的第j单位数值 • yij: 样本中第i群的第j单位数值 • Mi: 第i群规模(单位个数) • 本节,M1= M2 =……=MN =M
Mt: 总体单位总数
N
M t M i i 1
第四章 等概率整群 抽样和多阶段抽样
1. 整群抽样 2. 等概率整群抽样 3. 等概率两阶段抽样 4. 等概论两阶段抽样设计
概念:组成总体的基本单元 抽样单元
群:由若干个有联系的基本单 元所组成的集合称为群
整群抽样:抽样时抽取群,并 对入选群的所有单元进行调查。
两阶段抽样:由于群内单元通 常具有相似性, 尤其当群的规 模较大时, 对群内单元进行再
群的划分-大致可分为两类
1. 根据行政或地域形成的群体(如 学校、企业或街道 -节省费用)
2. 调查人员人为确定的(如将一大 块面积划分为若干块小面积的群)
分群的原则:群内差异尽可能大,群间 差异尽可能小 与分层抽样情况相反,总体结构
对复杂结构的总体,可以把两种方式结合使用
群的规模-指组成群的单元的数量
4 99 105 98 107 129 90 104.67 177.87
5 110 99 132 87 99 124 108.50 287.50
6 111 100 116 99 107 105 106.33 42.27
7 120 115 117 99 106 120 112.83 72.57
8 96 80 63 130 105 86 93.33 527.87
解:样本群间方差 sb2 926 .63
而群内方差为
sw2
1 n(M 1)
n i 1
M
( yij yi )2
j 1

1 n
n i 1
1 M 1
M
( yij
j 1

yi )2

1 n
n i 1
si2
1 (125.6 233.60 527.87) 220.79 8
f)
N
(Yi
i 1
Y )2
n
N 1
它的无偏估计为
n
v(Yˆ) N 2 (1 f ) i1 ( yi y)2
n
n 1
均值估计 Y 的方差为 N
V (Y )
1
M
2 0
V
(Yˆ
)

N 2 (1 f )
M
2 0
n
(Yi Y )2
i 1
N 1
群规模差 别大,会 造成Yi差 异大,导 致估计精
n
y yN Yˆ yi M MN M0
其中
N
M ( Mi)/ N
i 1
n
y ( yi ) / n i 1
总体总量Y的估计为 Yˆ M0 y
N
其中, M 0 M i
i 1
或用等价的公式
Yˆ N n
n
yi
i 1
估计量的方差为 V (Yˆ) N 2 (1
3、先根据学生宿舍名录随机抽取400个宿 舍,再在每个宿舍中随机抽取一位学生
• 群的规模相等时经常采用 等概率抽样
• 群的规模不等时也可以使用 等概率抽样 但实际中常采用不等概率抽样。
整群抽样及特点
1.整群抽样:将总体划分为若干群,
以群为抽样单元,对群中的所有 单位进行调查。
2.特点
1)抽样框编制得以简化 2)实施调查便利,节省费用 3)估计效率较低,抽样误差较大 4)对某些特殊结构的总体却有好的 估计效果,如:家庭-男女性别比
nM
N
(Yi Y )2
N
M
Yij Y
2
i
i j

N M
2

Yij Y 2 Yij Y Yik Y
i j
jk

(NM 1)S 2 (M 1)(NM 1)S 2
(NM 1)S 2(1 (M 1))
相关文档
最新文档