第七章 整群抽样 PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Y Yi Yij
i1
i1 j1
Y
Y A
1 A
A i1
Yi
样本总值及按群平均的样本均值:
a
aM
y yi yij
i 1
i1 j 1
y
y a
1 a
a i 1
yi
第二节 群大小相等的整群抽样
LOGO
一 、符号说明
按调查单位平均的总体均值:Y
Y AM
1 AM
A i1
M
Yij
j 1
1A Yi
• 掌握群大小不等情形与简单随机抽样相匹配的简单估计量、 比率估计量及与抽样相匹配的汉森-赫维茨估计量及性质。
• 掌握估计总体比例的整群抽样方法及简单估计量、比率估 计量。
第一节 抽样方式
LOGO
一、整群抽样及其实施理由
• 定义:
一级抽样单位
设总体由A个初级抽样单位组成,在总体中按某种方 法抽取a个初级抽样单位,如果对被抽中初级抽样单位的次 级单位不再进行抽样观测而是全部进行调查,则称此抽样方 法为整群抽样(cluster sampling),初级抽样单位称为群。
LOGO
三、按简单随机抽样抽群,采用比率估计量
a
• Y 的比率估计量:
ˆ
YR
yi
i 1 a
(有偏)
mi
i 1
A
A
M
1 A
A i 1
Mi

方差:
V
ˆ (YR
)
1 aM
fwenku.baidu.com
2
(Yi YMi )2
i1
A 1
1 f aM 2
M
2 i
(Yi
Y
)2
i1
A 1

方差的样本估计:
ˆ v(YR )
1 f am2
AM 1
AM 1
对于固定的总体,S
2是常数,故当群内方差
S
2 w
增大(或减
小)时,群间方差
S
2 b
必然减小(或增大)。
群的划分原则:使群内差异尽可能大,群间差异尽可能小。
第二节 群大小相等的整群抽样
四、群内相关系数与设计效应
• 群内相关系数定义: E(Yij Y )(Yik Y )
AM
E(Yij Y )2
a
si2
i1
1 a(M 1)
a i1
M
( yij
j1
yi )2
样本第i群群内方差:
si2
1
M 1
M
( yij
j 1
yi )2
LOGO
第二节 群大小相等的整群抽样
LOGO
二、估计量及其性质

总体均值Y 的无偏估计: y y
aM
1 aM
a i 1
M
yij
j 1
1 a
a i 1
yi
y M

方差:
M
( A 1)Sb2 ( AM 1)S 2 ( AM 1)(M 1)S 2
① 当群内方差 Sw2 0 时, 1为极大值;

当群内方差与群间方差相等,即
S
2 w
Sb2
时,
0;
(分群过程完全随机,为简单随机抽样)

当群间方差 Sb2 均值都相等。
0
时,
1 ,为极小值,此时各群的
M 1

的取值范围是:
➢ 将总体划分为若干群,以群为抽样单位,对群中的所有单位进行调查。 二级抽样单位
第一节 抽样方式
LOGO
• 实施理由: ① 缺少调查单位的必要信息无法对其直接编制抽样框实施
概率抽样,而由调查单位组成的群是现成的或者群很容 易划分从而编制群抽样框非常容易时,常采用整群抽样。 ② 使调查实施便利、节省费用而采用整群抽样。 ③ 对某些由特殊结构的群组成的总体实施整群抽样能使精 度有较大提高。
a
A 1
a

方差的无偏估计:
v(Yˆ) A2 (1 f )
( yi y)2
i 1
a
a 1
第三节 群大小不等的整群抽样
LOGO

总体均值Y 的无偏估计:

Yˆ M0
Ay M0
y M
,其中
M
M0 A
A

方差:
ˆ V (Yˆ) 1 f
V (Y )
M
2 0
aM 2
(Yi Y )2
i 1
A 1
a

方差的无偏估计:
v(Yˆ )
v(Yˆ )
M
2 0
1 f aM 2
( yi y)2
i 1
a 1
• Y 及Y 的简单估计量的方差主要取决于群总值之间的差异。
• 在实际问题中常有各个群规模差异很大,而群的均值之间差异很小, 则群总值之间必然差异较大,此时简单估计量的精度很低。
第三节 群大小不等的整群抽样
Y M0
1 M0
A
Yi
i 1
A i 1
Mi Yi M0
按调查单位平均的样本均值:
y
1 a
a
i 1
yi
第三节 群大小不等的整群抽样
LOGO
二、按简单随机抽样抽群,采用简单估计量

总体总值 Y的无偏估计:

A a
a i 1
yi
Ay
A

方差:
V (Yˆ) A2 (1 f )
(Yi Y )2
i 1
LOGO
【例7.1】某居民小区共有600个单元,每个单元均居住10户。现以单元 为群进行整群抽样,随机抽取15个单元,调查每户每周食品支出费用, 调查结果及各单元样本均值和标准差如表7-1所示。
试求该居民小区平均每户每周食品支出费用并给出其置信水平为95%的 置信区间。
第二节 群大小相等的整群抽样
(基本出发点是群的组成应有利于整群样本估计量精度尽可能高)
• 二是如何确定群的规模。
(群的规模的选择取决于精度与费用之间的平衡)
第二节 群大小相等的整群抽样
LOGO
一 、符号说明
总体由A个群组成,从中随机抽取a个群,对抽中群的所有单位全部调查。
A: 总体群数 a: 样本群数 Yij: 总体第i群的第j单位调查标志值 yij: 样本中第i群的第j单位调查标志值 Mi: 第i群规模(单位个数)
第二节 群大小相等的整群抽样
LOGO
总体方差分解:
S2
1A AM 1 i1
M
(Yij Y )2
j 1
1A AM 1 i1
M
[(Yij Y i ) (Y i Y )]2
j 1
AM
A
i 1
(Yij
j 1
Y i )2 M
(Y i Y )2
i 1
A(M
1)Sw2 ( A 1)Sb2
1 M 1
,1

的样本估计是:
r
sb2
sb2 (M
sw2 1)sw2
第二节 群大小相等的整群抽样
LOGO
• y 的方差用群内相关系数近似表示:
V (y) =
1- f a
( AM M 2(A-
1) 1)
S
2
轾 臌1+
(M
-
1)r
?
1- f aM
S 2 轾 臌1
(M -
1)r
• 表明:整群抽样估计量精度与群内相关系数有密切关系,r
LOGO
三、整群抽样效果分析及群的划分原则
当直接对调查单位进行简单随机抽样时,有:V ( y) 1 f S 2
aM
V (y) V (y)
1 f aM
(Sb2
S2)
0, Sb2 S 2 0, Sb2 S 2 0, Sb2 S 2
在相同的调查单位样本量aM下,只有当群间方差Sb2 比总 体方差 S 2小时整群抽样才优于简单随机抽样。

方差:
V
(YˆHH
)
1 a
A i 1
Zi
( Yi Zi
Y )2
M0 a
A
M i (Yi Y )2
i 1

方差的无偏估计: v(YˆHH
)
1 a(a 1)
a i1
(
yi zi
YˆHH
)2
M
2 0
a(a 1)
a i1
( yi
y)2
第三节 群大小不等的整群抽样
LOGO

Y
的无偏估计量:
ˆ YHH
第三节 群大小不等的整群抽样
LOGO
四、按PPS抽样抽群,采用汉森-赫维茨估计量
在A个群中进行a次放回独立抽样,每次抽取时第i群被抽到的概率为Zi
• 总体总值Y的汉森-赫维茨估计量(无偏):
YˆHH
1 a
a i 1
yi zi
M
0
(
1 a
a i 1
yi Mi
)
M
0
(
1 a
a i 1
yi ) M 0 y
A
M0: 总体包含调查单位总数 M 0 M i i 1
LOGO
第三节 群大小不等的整群抽样
LOGO
一 、符号说明
Mi
总体第 i群总值及均值: Yi Yij j 1 mi
样本第 i群总值及均值: yi yij j 1
总体总值及按群平均的总体均值:
Y i
Yi Mi
1 Mi
Mi
Yij
j 1
yi
yi mi
1 mi
mi
yij
j 1
A
A Mi
Y Yi Yij
i1
i1 j1
Y
Y A
1 A
A i1
Yi
样本总值及按群平均的样本均值:
a
a mi
y yi yij
i 1
i1 j1
y
y a
1 a
a i 1
yi
第三节 群大小不等的整群抽样
LOGO
一 、符号说明
按调查单位平均的总体均值:Y
V ( y) 1 f aM
Sb2

方差的无偏估计: v( y) 1 f
aM
sb2
第二节 群大小相等的整群抽样
二、估计量及其性质
• 总体总值Y的无偏估计: Yˆ AM y

方差:
V (Yˆ)
A2M (1 a
f ) Sb2

方差的无偏估计:
v(Yˆ)
A2M
(1 a
f
)
sb2
LOGO
第二节 群大小相等的整群抽样
YˆHH M0
y

方差:
V
ˆ (YHH
)
V
(YˆHH
M
2 0
)
1 aM 0
A
Mi (Yi Y )2
i 1

方差的无偏估计:
ˆ v(YHH )
v(YˆHH )
M
2 0
1 a(a 1)
a i 1
( yi
y)2
• Y 及Y的汉森-赫维茨估计量的方差主要取决于群均值之
A i1
M
(Yij Y i )2
j 1
总体第i群群内方差:
Si2
1 M 1
M j 1
(Yij
Y
i
)2
第二节 群大小相等的整群抽样
一 、符号说明
样本方差: s2
1 a aM 1 i1
M
( yij y)2
j 1
样本群间方差:
sb2
M a 1
a i 1
( yi
y)2
样本群内方差:
sw2
1 a
A i1
Y M
按调查单位平均的样本均值:y y aM
1 aM
a i 1
M
yij
j 1
1 a
a i 1
yi
y M
总体方差:
S2
1A AM 1 i1
M
(Yij Y )2
j 1
总体群间方差:
Sb2
MA (Y i
A 1 i1
Y )2
总体群内方差:
S
2 w
1 A
A i1
Si2
1 A(M 1)
第七章 整群抽样
本章要点
LOGO
对于整群抽样,本章给出了群大小相等和群大小不等 的整群抽样方法及与之匹配的估计量、估计量的方差及方差 的估计量。
• 具体要求:
• 掌握群大小相等情形对群进行简单随机抽样简单估计量的 无偏性、方差及方差的无偏估计,掌握群的划分原则;了 解群内方差、群间方差概念及其对整群抽样精度的影响。
第一节 抽样方式
LOGO
二、整群抽样的特点
• 调查精度:整群抽样估计量的精度(估计量方差)与群的 划分有直接关系。
• 调查费用:整群抽样调查单位相对集中,平均单位调查费 用较少,因此可以通过适当扩大群样本量以提高整群抽样 的精度,同时使调查费用仍比较省。
第一节 抽样方式
LOGO
三、群的划分原则
✓ 一般群是自然形成的,或者是现有的单位。 ✓ 当群需通过划分确定时需考虑两个问题: • 一是如何定义群的组成;

分子:
(Yij Y )(Yik Y )
i1 jk
AM (M 1) 2
AM

分母:
i 1
(Yij
jk
Y )2
AM
1 S 2
AM
MN
AM
2
(Yij Y )(Yik Y )

经计算可以得到:
i1 jk
( AM 1)(M 1)S 2
LOGO
第二节 群大小相等的整群抽样
LOGO
• 变形:
)
M
02V
ˆ (YR
)
A2 (1 a
f)
i 1
M
2 i
(Yi
Y
)2
A 1

方差的样本估计:
v(YˆR ) M 02v(YˆR )
A2 (1 a
f)
a
( yi
ˆ YR
mi
)2
i 1
a 1
• Y 及Y 的比率估计量的方差主要取决于群均值之间的差异。
• 在多数实际问题中,群均值之间的差异不是很大,即 Yi与Mi之间大致 有正比例关系,此时比率估计量的精度较高。
• 表明:按调查单位的相同样本量,整群抽样的方差为简单 随机抽样的方差的1 (M 1) 倍。
第三节 群大小不等的整群抽样
一 、符号说明
总体由A个群组成,第i群含Mi个调查单位
A: 总体群数 a: 样本群数 Yij: 总体第i群的第j单位调查标志值 yij: 样本中第i群的第j单位调查标志值 Mi: 第i群规模(单位个数)
本节中,M1= M2 =……=MN =M
第二节 群大小相等的整群抽样
LOGO
一 、符号说明
M
总体第 i群总值及均值: Yi Yij j 1
M
样本第 i群总值及均值: yi yij j 1
Y i Yi
M
1 M
M
Yij
j 1
yi
yi M
1 M
M
yij
j 1
总体总值及按群平均的总体均值:
A
AM
a
( yi
ˆ YR
mi
)2
i 1
a 1
m
1 a
a i 1
mi
1 f a(a 1)m2
a
(
i 1
yi2
YˆR2
a i 1
mi2
ˆ 2YR
a i 1
yimi )
第三节 群大小不等的整群抽样
LOGO
a

Y的比率估计量:
YˆR
ˆ M 0YR
M0
yi
i 1 a
mi
i 1
A
• 方差: V
(YˆR
越大即群内调查单位之间相似程度越大,群内差异越小, 估计量方差就越大。
第二节 群大小相等的整群抽样
LOGO
• 若按简单随机抽样直接从总体中抽取aM个调查单位,则 样本均值的方差为:
Vsrs
(
y
)
1 f aM
S2
• 整群抽样的设计效应为:
deff V ( y) 1 (M 1)
Vsrs ( y )
相关文档
最新文档