抽样技术第七章整群抽样ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

11
三、群内相关系数与设计效应
群内相关系数
c

E(Yij Y E(Yij
)(Yik Y Y )2
)
上式中的分子为
NM
(Yij Y )(Yik Y )
i1 jk
NM (M 1) 2
12
上式中的分母为
NM
i1
(Yij Y )2
j 1

NM
1S2
1N
1N
Y

M0
i1
Yij
j 1

M0
Yi
i1

M0
M iYi
i1
21
二、按简单随机抽样抽群
1.简单估计 2.比估计 3.总体比例的估计
22
1.简单估计
在大多数情形,群大小Mi是不相等的。此时,若Mi 相差不多,则仍可按§7.2中的方法处理,用平均群
大 则小这种M方法N1精iN1度M较i 差代。替M。反之,若Mi相差较多,
n
1 n
n 1 i1
yi y 2
1 f nM
sb2
其中f=n/N为抽样比。可见,sb2 是Sb2的无偏估计。
8
当n足够大时,总体均值Y 的置信度为1−α的置信区 间为:
y u 2s y
例7.1 在一次某城市居民小区居民食品消费量调查 中,以每个楼层(相当于居民小组)为群进行整群抽 样。每个楼层都有M=8个住户。用简单随机抽样在 全部N=510个楼层中抽取n=12个楼层。全部96个 样本户人均月食品消费额yij及按楼层的平均数yi 与 标准差si ,如下表所示。试估计该居民小区人均食 品消费额的户平均值 ,并给出其0.95的置信区间。
N
2
N
2
V
YˆR
N 2 1 f i1
n
Yi YMi N 1
N 2 1
f
M
2 i
i1
Yi Y
n
N 1
27
s2 YˆR

N 2 1
n
f

1 n
n 1 i1
yi2


YˆR M0
2
n i1
mi2
2

YˆR Mi

n i1
mi yi


N 2 1
n
f


1
n
n 1 i1
yi2


n
yi
i1 n
mi
i1
2

n i1
mi2
2

n
yi
i1 n
mi
R

P
31
例7.4 为估计城市居民中男、女性别的比例,用简 单随机抽样抽取n=56户,每户的人口数mi;,男性 与女性人口数ai与bi的数据见下表。试对男、女性别 比例分别作出估计(1−f可忽略),并估计deff的值。
32
33
§7.4 按与群大小成比例的 不等概率抽样抽群
对群进行与其大小Mi成比例的不等概率抽样,即采 用放回PPS抽样或不放回πPS,并采用相应的估计量 。
平衡,二是从抽样实施的组织管理等因素来考虑。
4
§7.2 群大小相等的情形
一、记号 二、总体均值的估计 三、群内相关系数与设计效应 四、总体比例的估计
5
一、记号
记Yij为总体第i群中第j个次级单元的观测值 (i=1, ⋯, N;j=1, ⋯, M,M是群的大小);
yij是样本第i群中第j个次级单元的观测值 (i=1, ⋯, n;j=1, ⋯, M)。
N
总体次级单元的总数: M 0 Mi
i1
第i群的总值:
Mi
mi
Yi Yij , yi yij
j 1
j 1
第i群的平均值:
Yi Yi M i , yi yi mi
20
平均群总值:
Y

1 N
N
Yi ,
i1
y

1 n
n i1
yi
均值:
1 N Mi
18
§7.3 群大小不相等的情形
一、记号 二、按简单随机抽样抽群 三、按与群大小成比例的不等概率抽样抽群
19
一、记号
记Yij为总体第i群中第j个次级单元的观测值
(j=1, ⋯, Mi ;i=1, ⋯, N,Mi是群的大小);
yij是样本中第i群中第j个次级单元的观测值
(j=1, ⋯, mi; i=1, ⋯, n)。
30


1 nM
f
2
M
2 i

Pi

P
2
i1
N 1
其中 M

1 N
N
M
是总体群的平均大小。
i
i1
s
2

p


1 f nm2
1 n 1
n i1
ai2

p2
n i1
mi2

2
p
n i1
aimi

注:
X

M,
Xi

Mi,
Yi Xi

Pi ,
2
§7.1 概述
设总体由N个大单元,即初级单元组成,每个初级 单元又由若干个较小的次级单元或二级单元组成。 从总体中按某种方式抽取n个初级单元,观测其中所 包含的所有次级单元。这种抽样称为整群抽样。确 切地说,应称为单阶整群抽样。
如果总体中的单元可以分成多级,则可以对前几级 单元采用多阶抽样,而在最后一阶中对该级抽样单 元(称为整群抽样单元或简称为群 )中所包含的全 部最低级单元进行观测,即是多阶整群抽样。
第i群的总值:
M
M
Yi Yij , yi yij
j 1
j 1
第i群的平均值: Yi Yi M , yi yi M
平均群总值:
1 N
1n
Y

N
Yi ,
i1
y n i1 yi
6
均值:
Y

1 NM
N i 1
M
Yij
j 1

Y M

1 N
N
Yi ,
N
N
Ai Ai
P
i1 N

Mi
i1
M0
i1
29
其比估计为
n
ai
p
i1 n
mi
i1
注:
Yi Ai , X i M i , yi ai , xi mi
N
R Y

Ai
i1
P,
X M0
n
Rˆ y x
ai
i1 n
mi
p
i1
p

1 n
n i1
pi
16
它是无偏的,
N
V p 1 f
Pi P2
i1
n N 1
n
s2 p 1 f
pi p2
i1
n n 1
当n足够大时,总体比例P的置信度为1−α的置信区 间为
p±uα/2s(p)
17
例7.3 在例7.1中,对某居民小区居民进行食品消费调查的同 时,也进行了电话拥有情况的调查。下表是12个样本楼层装 有电话的住户数ai及在楼层8户中所占的比例pi的资料,试对 该小区的电话拥有率P进行估计。
V y 1 f
n
NM 1 M 2 N 1
S
2
1


M
1 c
1 f nM
S 2 1 M
1 c
对简单随机抽样
Vran y

1 f nM
S2
14
设计效应
deff

Vy Vran y

NM
M N
1
1
1
讨论对总体总和 Y
N
Mi
Yij
N
Yi 的估计,对总体
i1 j1
i1
平均数Y 的估计可以从对Y的估计推出来。
23
Y1,Y2, ⋯,YN构成一总体,y1,y2, ⋯,yn是一简单随机样 本

N n
n i1
yi
Ny
是Y的无偏估计,它的方差为
N
V Yˆ N 2 1 f i1 Yi Y 2
M
1 c
1
M
1 c

当群内均方S
2 w

0时,ρc=1;
当群内均方与总方差相等,即 Sw2 S 2 时,
ρc=−1/(NM−1)≈0;
当 Sw2 S 2时,ρc<0。

ρc的取值范围是
1, M 1
1

例7.2 估计例7.1中居民食品消费支出调查以楼层(
居民小组)为群的群内相关系数与设计效应。
15
四、总体比例的估计
设总体中具有某种特征的单元的比例为P,总体第i 个群的比例为Pi (i=1, ⋯, N) ,则有
N
P
Ai
i1
NM

1 N
N
Pi
i1
又设样本群数为n,样本第i群中具有某种特征单元
的比例为pi (i=1, ⋯, n),则总体比例P的估计量为
若群的抽取是按与Mi成比例的放回PPS抽样抽取的 ,即进行n次独立的抽样,每次按
Zi=Mi/M0, i=1,2,⋯,N 的概率抽取第i个群。设观测到的群和与群的大小分
mi
别为yi yij 与mi,则总体总值Y的估计采用汉森—
赫维茨估j计1 量: 34
其中
YˆHH

1 n
n i1
Yi Y
2
,
群内均方:
sb2

M n 1
n i 1
yi y 2
Sw2 N
1 M 1
NM
Yij Yi
i1 j1
2
,
sw2 n
1 M 1
nM i1 j1
yij yi
2
S2

1 NM

1

N
1 Sb2

N
M
i 1
总方差(总均方):
y

1 nM
n i 1
M
yij
j 1

y M

1 n
n i 1
yi
S2 1
NM
NM 1 i1 j1
Yij Y
2
,
s2 1
nM
nM 1 i1 j1
2
yij y
群间均方:
Sb2

M N 1
N i 1
3
采用整群抽样的理由: (1)缺少次级单元的抽样框 (2)实施便利,节省费用
群划分的原则: 群的划分应尽可能使群与群之间的差异小,而群内 差异则愈大愈好。这样,每个群都具有足够好的代 表性。如果所有的群都相似,那么抽少数群就可获 得相当好的精度。
实际中,一般群内差异小而群间差异大。 至于群规模的选择,一是取决于精度与费用之间的
YˆR
M0
i1 n
mi
i1
(xi mi ,
Xi Mi,
X M0,
R Y Y Y) X M0
26
Y 的估计为
n
ˆ YR

YˆR M0

yi
i1 n
mi
i1
称为对大小的比估计。
YˆR 或YˆR 是有偏的,但当n大时,它们是近似无偏的
。此时YˆR 的近似方差及其估计分别为
1 Sw2
7
二、总体均值的估计
机Y1样, 本,Y。N 构故成y 一 1n个in总1 y体i 是,Yy1,
, yn 是它的一个简单随
1 N
N
Yi
i1
的无偏估计,且
V y 1 f n
1N N 1 i1
Yi Y
2 1 f nM
Sb2
s2 y 1 f
i1

n i1


mi
yi


V YˆR 的大小主要取决于Y1, ,YN 之间的差异的大小
。在多数实际情形中,Y1, ,YN 的差别不是很大。
28
三、总体比例的估计
群大小Mi不相等,使用比估计估计P。记 Ai 为第i群中具有某特征的单元数,i=1,2,⋯,N ai为样本第i群中具有某特征的单元数,i=1,2,⋯,n 总体比例
9
10
解 N=510, n=12, M=8, f=0.02344
y

1 12
12 i1
yi

2620.5 12

218.375
s2
y

112 510 12
1 12 1
12 i1

yi

y 2
144.3089
s y 144.3089 12.013
故Y 的0.95置信区间为 218.375±1.96×12.013=(194.83, 241.92)
n
N 1
其中f=n/N,而它的一个无偏估计为
24
n
s2


N 2 1
f

yi
i1

y 2
n
n 1
Y 的简单估计为
ˆ Yˆ Ny y Y
M0 M0 M
其中 M M0 N 是总体群的平均大小。
25
2.比估计
采用以群的大小Mi为辅助变量的比估计,
n
yi
NM
NM
故有 可推得
NM
2
(Yij Y )(Yik Y )
c
i1 jk
(M 1)(NM 1)S 2
c
1
NMSw2 (NM 1)S 2
1
Sw2 S2
13
ρc可估计为
ˆc

sb2
sb2 (M
sw2 1) sw2
y 的方差可写成如下形式:
yi zi

M0 n
n i1
yi mi
M0y
y

1 n
n i1
yi mi

1 n
n i1
yi
可作为总体均值Y 且
的估计量。YˆHH , y
都是无偏估计,
第七章整群抽样71概述72群大小相等的情形73群大小不相等的情形74按与群大小成比例的不等概率抽样抽群71概述设总体由n个大单元即初级单元组成每个初级单元又由若干个较小的次级单元或二级单元组成
《抽样技术》第七章
1
第七章 整群抽样
§7.1 概述 §7.2 群大小相等的情形 §7.3 群大小不相等的情形 §7.4 按与群大小成比例的不等概率抽样抽群
相关文档
最新文档