整群抽样

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 b
为样本群间方差。 为总体群内方差。 为样本群内方差。
N M 1 N 2 1 S Si (Yij Y i )2 N i 1 N (M 1) i 1 j 1 2 w
n M 1 n 2 1 s si ( yij y i )2 n i 1 n(M 1) i 1 j 1 2 w
若按简单随机抽样从总体中抽取nM个次级单
元,样本均值 y 的方差应为
Vsrs ( y ) 1 f 2 S nM
因此整群抽样的设计效应为
deff
V ( y) Vsrs ( y )
1 ( M 1) c
群内相关系数的样本估计量为
2 2 sb sw ˆc 2 2 sb ( M 1) sw
2 n
按PPS抽样抽群,采用汉森-赫尔维茨估计量
若群的抽取是按与 M i成比例的放回PPS抽样抽取的
Zi
Mi , M0
i 1, 2,, N
在N个群中进行n次放回独立抽样,每次抽取时第i群 被抽到的概率为 Z i ,则总体总和 Y 的汉森-赫尔维茨估 计量为
n n n y y 1 1 1 i i ˆ M ( )M ( y )M y Y HH 0 0 i 0 n i 1 zi n i 1 mi n i 1 ˆ ˆ Y Y 的无偏估计量为 YHH HH y M0
N
N 1
ˆ 2 2 2 ˆ V (YR ) M 0 V (YR ) N M V (YR ) N 2 (1 f ) n N 2 (1 f ) n
2 ( Y YM ) i i i 1 N
N 1
2 2 M ( Y Y ) i i i 1 N
N 1
ˆ ˆ ) 的估计为 V (YR )与V (Y R

对于整群随机抽样,y 作为 Y 的简单估计是无偏的。
1 n M y y y ij M nM i 1 j 1 1 1 N M y 1 E y E E( y ) Y Yij Y M NM i 1 j 1 M M
证明:


1 y V ( y ) 对于整群随机抽样, 的方差为
1 Y N
Y
j 1
N
i
为总体的“群和平均”。 为样本的“群和平均”。
1 y y yi n j 1
Y 1 N M Y Yij 为总体均值。 M NM i 1 j 1 y 1 n M y yij 为样本均值。 M nM i 1 j 1
N M 1 S (Yij Y )2 NM 1 i 1 j 1 2
估计量及其性质
总体均值 Y 的简单估计量为
1 y nM
总体总值
1 y ij nM i 1 j 1
n
M
yi
i 1
n
1 y nM
Y 的简单估计量为
n M n N N N ˆ Y NM y yij yi y n i 1 j 1 n i 1 n
2

(Y
i 1 j 1
N
M
2 Y ) M ( Y Y ) i i ij 2 i 1
N
NM 1
2 N ( M 1) S w ( N 1) Sb2 NM 1
S 2 是常数,当群内方差 S w 增大(或减小) 对于固定的总体, 时,群间方差 必然减小(或增大)。当群内差异扩大时 Sb2 群间差异必然缩小,整群抽样的效率提高。因此群的划分 原则应是使群内差异尽可能大,群间差异尽可能小。
N Mi N
Y Yij Yi 为总体总和。
i 1 j 1 i 1
按简单随机抽样抽群,采用简单估计量
设n个群是按简单随机抽样抽取的,以样本群和
Y 的简单估 y 为样本变量值,为平均数,则总体总和 计量为
ˆN Y n
yi
y
i 1
n
i
Ny
ˆ 是无偏估计,其方差为 Y
2 N ˆ ) (1 f ) V (Y n 2 ( Y Y ) i i 1 N
y
i 1 n i 1
n
i
m
i
从而 Y 的比估计为
ˆ ˆ M Y Y R 0 R M0
y
i 1 n i 1
n
i
m
i
ˆ ˆ 的方差近似为 YR 与 Y R
ˆ 1 f V (YR ) nM 2
(Yi YM i )
i 1
N
2
N 1
1 f nM 2
2 2 M ( Y Y ) i i i 1

对于整群随机抽样,总体方差 V ( y )的无偏估计为
v( y ) 1 f 2 sb nM

对于整群随机抽样,Y的无偏估计量、估计量的方 差及其无偏估计分别为: ˆ NM y Y
2 N M (1 f ) 2 ˆ V (Y ) Sb n
2 N M (1 f ) 2 ˆ v(Y ) sb n
N 1
其中 f
n N
ˆ ) 的一个无偏估计为 V (Y
ˆ) N v(Y
2
( y y) (1 f )
i 1 i
a
2
n
n 1
总体均值 Y 的简单估计量为
ˆ ˆ Y y 1 n Y yi M 0 M Mn i 1
M0 其中 M 是总体群的平均大小。 N
估计量的方差及其无偏估计为:
整群抽样效率分析及群的划分原则
2 整群抽样估计量的方差只与群间方差 S b 有关, 与群内
2 方差 S w 无关。
当直接对调查单元进行简单随机抽样时,
1 f 2 V ( y) S nM
V ( y) V ( y) 1 f 2 2 ( Sb S ) nM
0, Sb2 S 2
1 Yi Mi 1 yi mi
Y
j 1
Mi
ij
为总体第i群的均值。 为样本第i群的均值。
y
j 1
mi
ij
1 Y N
Y
j 1
N
i
为总体的“群和平均”。 为样本的“群和平均”。
M0 Mi
i 1 n
1 n y yi n i 1
1 N Mi Y Yij 为总体均值。 M 0 i 1 j 1 1 n y yi 为样本均值。 n i 1
若 S 0,此时 c 达到极小值
2 b

1 M 1
;
c 的取值范围是 因此,
1 - ,1 M 1
利用群内相关系数
c ,总体均值的估计量 y
的方差可以写成
V ( y) 1-f NM 1 2 S [1 ( M 1) c ] 2 n M ( N 1) 1 f 2 S [1 ( M 1) c ] nM
0, Sb2 S 2
0, Sb2 S 2
2
因此,在相同的调查单元样本量nM下,只有当群间方差 Sb 比总体方差 S 2小时整群抽样才优于简单随机抽样。
总体方差与群内方差、群间方差之间有如下关系:
1 N M 1 N M 2 2 S ( Y Y ) [( Y Y ) +( Y Y )] i i ij ij NM 1 i 1 j 1 NM 1 i 1 j 1
ˆ 是无偏估计,其方差为 Y HH
N N Y M 1 2 2 i 0 ˆ ) Z ( Y ) V (Y M ( Y Y ) i i HH i n i 1 Zi n i 1 V (Yˆ ) 的一个无偏估计为
HH
v(YHH )
ˆ
n yi ˆ 2 M 02 n 1 2 ( Y ) ( y y ) i HH n(n 1) i 1 zi n(n 1) i 1
ˆ 1 f v(YR ) nm2
ˆ 2 ( y Y m ) i R i
n i 1
n 1
n n ˆ n 1 f 2 2 2 ( y YR mi 2YR mi yi ) 2 i n(n 1)m i 1 i 1 i 1
n n ˆ N (1 f ) 1 2 2 2 ˆ ) v(Y ( y Y m R i R i 2YR mi yi ) n n 1 i 1 i 1 i 1
群规模大小不等的情形
符号说明
设总体有N个群,每个群中含有 M i 个次级单元。
Yij 为总体第i群中第jபைடு நூலகம்次级单元的变量值。
yij 为样本第i群中第j个次级单元的变量值。
Yi Yij 为总体第i群的变量值和,简称总体群和。 yi yij 为样本第i群的变量值和,简称样本群和。
j 1 j 1 mi Mi
N 1 f 1 V ( y) (Yi Y ) 2 n N 1 i 1 N 1 f 1 ( MYi MY ) 2 n N 1 i 1
f 2 Sb nM
证明:
1 f M 2 N (Yi Y ) 2 n N 1 i 1
V ( y) V (
1 1 y) V ( y) M M2 N 1 f 1 (Yi Y ) 2 n N 1 i 1 1 f 2 Sb nM
yij 为样本第i群中第j个次级单元的指标值。
Yi Yij 为总体第i群的变量值和,简称总体群和。 yi yij 为样本第i群的变量值和,简称样本群和。
j 1 j 1 M M
1 M Yi Yij 为第i群的总体均值。 M j 1 1 M yi yij 为第i群的样本均值。 M j 1
为总体总方差。 为样本总方差。
n M 1 s ( yij y )2 nM 1 i 1 j 1 2
1 N M M N 2 S (Y i Y ) (Y i Y )2 为总体群间方差。 N 1 i 1 j 1 N 1 i 1
2 b
1 n M M n 2 s ( yi y) ( y i y )2 n 1 i 1 j 1 n 1 i 1

(Yij Y )(Yik Y )
i 1 j k
NM ( M 1) / 2 2 (Yij Y )(Yik Y )
i 1 j k N M
MN

( M 1)( NM 1) S 2
M ( N 1) Sb2 ( NM 1) S 2 c ( M 1)( NM 1) S 2
定义
设总体由N个初级单元组成,每个初级单元 又由若干个较小的次级单元组成,首先从总体 中按某种方法抽取n个初级单元,然后抽出其中 所包含的所有次级单元构成一个样本,这种抽 样称为整群抽样。
群规模大小相等的情形
符号说明
设总体有N个群,每个群中含有M个次级单元。
Yij 为总体第i群中第j个次级单元的指标值。
ˆ) 1 f ˆ V (Y V (Y ) 2 M0 nM 2
(Y Y )
i 1 i
N
2
N 1
ˆ) 1 f ˆ v(Y v(Y ) 2 M0 nM 2
(y
i 1
n
i
y )2
n 1
按简单随机抽样抽群,采用比率估计量
对群进行简单随机抽样,总体均值的比估计量为
ˆ YR
经计算整理得
Sb2 S 2 当N很大时, c ( M 1) S 2
由于
2 2 N ( M 1) S ( N 1) S w b S2 NM 1
2 2 NMSw Sw c =1 1 2 2 ( NM 1) S S
2 0 ,此时 c取最大值1; 若 Sw 2 S 2,此时 c 0 ; 若Sw
YHH 也是无偏估计,其方差为
ˆ V (YHH ) 的一个无偏估计为
ˆ ) ˆ V (Y 1 N 2 HH V (YHH ) M ( Y Y ) i i M 02 nM 0 i 1
2
群内相关系数与设计效应
为研究整群抽样估计量方差与群内调查单元相似
性之间的关系引入群内相关系数的概念。群内相 关系数被定义为
c
E (Yij Y )(Yik Y ) E (Yij Y ) 2
c
N
E (Yij Y )(Yik Y ) E (Yij Y ) 2
M 2 ( Y Y ) ij i 1 j 1 N M
相关文档
最新文档