第5章等概率整群抽样.知识讲解

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

全都入样,即

M i mi
16
(一)群规模相等时的估计
总体N个群中,每个群中的元素数量都相等,
即有 Mi mi M,则称群规模相等。将群的总值 看成是观测值,可得到一个含有n个观测值的简
单随机样本ti :iS ,此时全体群群总值的均

tS
i S
ti n
。运用简单随机抽样样本估计总体的
方法,求出总体的总值。在单阶段整群抽样中没有
访问组中的20家住户比随机选择20家住户更 节省经费,也更容易,所以整群抽样的单位美元花 费可能产生更多的信息。
同一群中元素比整个总体中SRS选择的元素更 趋于同质性——同一品种的鱼在同一湖里更容易具 有相同的汞浓度;同一疗养院的居民容易对护理质 量具有相同意见。
由于同质性存在,在一个群里调查所有成 员,在一定程度上会造成信息重复,将导致对总体 的估计不足,精度下降。为了使精度提高,分群的 原则是:群内差异尽可能大,群间差异尽可能小。
15
二、单阶段抽样
单阶段整群抽样只能选择群中的所有元
素入样,或者群中的所有元素均不入样。跟二阶段
抽样相比,抽取SSU的成本相对于抽取PSU的成本可
忽略不计,通常会将选中群的所有SSU全部调查。
在N个psu的总体,第i个psu中包含 个ssus。
在单阶段整群抽样中,被选中的群psus中所有M ssi us
2 t
分别代表总体psu间的方差
和样本psu间的方差。
St2
1N N1i1
ti
Nt 2
st2
1 n1iS
ti
tˆ N
2
19
2、估计总体中每个人的平均收入 y U
yˆ tˆ NM
(5.4)
Vyˆ (NM 1)2V(tˆ)(1N n)nSM t22 (5.5)
SE yˆ 1 (1n)st2 (5.6) M Nn
11
(六)符号说明 psus:初级抽样单元 ssus:次级抽样单元
u :含有N个psu的总体
S:N个psu的总体中入样的psus S i : psu中代表第i个入样的ssus
y i j :第i个psu中的第j个元素值
12
psu-总体指标
N 总体中psus的个数
M i 总体中第i个psu中ssus的个数
20
P171例5.2
一个学生想估计他所在宿舍楼里同学的绩点 (GPA)的平均值。没有列出宿舍楼所有学生的名 单再进行随机抽样,他发现宿舍区共有100间套房, 每间有4名学生;他从中随机抽取了5间套房,询 问了其中每个人的GPA。
PSU就是套房,N=100,n=5,M=4。总体总 值估计就是整个宿舍楼所有学生的绩点。
9
抽样方法 组织方式
分层抽样 整群抽样
对各层SRS, SRS所有群, 观测抽样点 观测群内点
影响方差 层内值差异 群间值差异
提高精度
层内值相似, 群内值差异, 层间值差异 群均值相似
10
(四)群的划分 1、根据行政或者地域; 2、调查人员人为确定。
(五)群的规模 1、与总体各群规模相等; 2、与总体各群规模不等。
注意: 1、抽样单元(PSU)不同于观测单元(SSU); 2、同容量的整群抽样观测单元提供的信息 少于SRS; 3、花费而言,整群抽样更物超所值; 4、分群的原则是:群内差异尽可能大,群 间差异尽可能小。
p
社区里一些组的住户主要是由家庭构成,他们 拥有更多的自行车;而社区里另外一些组的居民主 要是退休人员,他们的自行车较少。同一组里的 20家住户不如随机选择的20户更能反映出社区的 多样性。因此这种情况下,整群抽样比同样规模的 简单随机抽样的每次观测所获得的信息可能更少。
引入新的内容,我们利用了简单随机抽样的结果,从N个
单位的总体中抽取n个单位的简单随机样本。这里我们把 群总值看成是简单随机抽样中的观测值。
17
在住户调查中估计两口之家的收入,则个体观测
值 y i j 为家庭i中第j个人的收入,而 t i 代表第i个家 庭的总收入( t i 是已知的,因为入样家庭的两个成员
Mi j1
yij Mi
ti Mi
第i个psu的总体均值
2
N Mi
S2
yij yU
总体方差
i1 j1 M0 1
2
Mi
Si2
j1
yij yiU Mi 1
总体第i个psu内ssu间方差
样本指标
n 样本中psus的个数
m i 样本中第i个psu中ssus的个数
y i
y ij m j S i i
第i个psu中的样本均值
tˆi
jSi
Mi mi
yij
第i个psu总值的估计量
tˆunb
iS
N n
tˆi
总体总值的无偏估计量
st2
1 n1iS
tˆi
tˆunb N
2
样本psu间的方差
si2
1
mi 1jSi
yij yi
2
第i个psu内ssu间的样本方差
w ij 第i个psu中第j个ssu样本权重
第5章等概率整群抽样.
调查目的:调查含10000家住户的社区中住户拥有 自行车数目;
策略一:样本容量为400个住户的简单随机抽样; 策略二:整群抽样。整群抽样步骤: 1、将社区分为500个组(每个组20家住户)从500个 组中随机抽取20个组(组:初级抽样单元PSU) 2、从随机抽取20组中普查组内的每一家住户(住 户:二级抽样单元SSU)
一、概述及符号说明
(一) 定义(What) 将总体划分为若干群(psus),然后以群为抽样
单元,从总体中随机抽取一部分群,对被选 群内的所有或部分单元(ssus)进行调查的一 种抽样技术。
(二)特点(Why)
优点: 1、抽样框编制得以简化。 2、实施调查便利、节省费用。 不足:
抽样误差较大。
(三)整群抽样与分层抽样
N
M 0 M i
总体ssus的个数
i 1
Mi
t i
y ij
j 1
第i个psu的总值
N
N Mi
t ti
yij
总体总值
i1
i1Hale Waihona Puke Baiduj1
St2
1 N N1i1
ti
N t 2
psu间的方差(总值)
13
Syt ij
ssu-总体指标
总体均值 yU
N i1
y Mi ij
M j1 0
yiU
均已被调查),t U 代表总体中每个家庭的平均收入,y U
表示总体中每个人的平均收入。求总收入。
P170
18
1、估计总收入t(总体总值):tˆ
N n
i S
ti
(5.1)
方差为:V(tˆ)N2(1 n)St2 (5.2)
Nn
标准误为:SE(tˆ)N (1 n)st2 (5.3)
Nn
其中
S
s 2
t

相关文档
最新文档