抽样调查整群抽样与系统抽样

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

V(YˆS
K
Y)SK
N0
(
N0
Yij
Yj)2
i1 j1
j1
N 0
K
K(Y ji Y i)22 K K N 0N 0(Y ji Y i)Y (jl Y l)
i 1j 1
j 1i l
K N0N0
(Yji
Yi)
(Yjl
Yl)0,系统



于样分
j1 il
系统抽样的效率
例 假设总体有表中的30个单元,欲取5个构成系统样 本,与简单随机抽样和分层抽样同样本量的结果进行 比较(两种排列方式).
一般 S 内 2S2 , 有所 C 介 以 0 , 1 于 之间
群内相关系数方便计算的另一表达式
K Ni
2
K
(Yij Y )
Ni
(Yij Y )2
i1 j1
C
K
i1 j1
Ni
(Ni 1) (Yij Y )2
i 1
j 1
目标量的估计
例3 某县有33个乡,共726个村,某一年度农作物总 种植面积为30525亩。先采用等概抽样随机抽出10个 乡进行该种作物的产量调查,要求利用无偏估计量和 比率估计量(以群规模为辅助变量,以种植面积为辅 助变量)分别估计全县总产量,并计算估计量的标准 差。数据如表.
此时系统抽样估值的精度与K的选取有很大关系, 应避免K=t 对周期资料选择合适K进行系统抽样,可得到比较 理想的精度 实际呈现精确周期排列的资料是没有的,而具有 一定周期性的资料很多,例如季节资料、月度资 料、星期资料等
个体的次序随机排列
对总体的某种排列次序,系统抽样精度可能优于 简单随机抽样也可能劣于简单随机抽样,但对N个个 体的所有N!种排列而言,系统抽样的平均精度与简单 随机抽样相等
i1
j1
若群内各单元指等标,均 则 C相 达最大1值
群内相关系数是衡量群内单元同质性的一个指标
整群抽样的设计效应
N i N 0 (i 1 ,2 , ,K )时
V(Y ˆCS ) EK k2 1K k K 1 1iK 1 N j 0 1Y ijK Y 2
V(Y ˆ)K k2 1K k K 1 1iK 1N j 0 1YijY2(K,N 较大 )
当个体指标具有某种特殊结构时,常对取样方法进行 人为调整,有点典型抽样的味道,非完全概率抽样
看作简单随机抽样 看作分层抽样
看作简单随机抽样
将系统抽样看 机作 抽简 样 V(Y 单 ˆS, Y)S随 可用
v1(YˆSY)SN N02
1N0s2 N
来估计,其中
s2
1 N0
N01j1
Yj
Y
2
当个体单元并非完全随机排列时这个估计会产生 偏量:群内相关系数小,会高估均方偏差;群内 相关系数大,会低估均方偏差。
然后对号码1,2,…,K作随机抽样,若i入样,则 K+i,2K+i,…,皆入样,组成一个系统样本
若将同一列个体看做一个群,系统抽样可视为整群抽样
一般假定N=KN0,并且只从1~K中抽选一个样本单元
系统抽样的优点是抽样非常方便
系统抽样的估值法
将系统抽样看作整群抽样抽取一个一级单元,有
(1)YˆSYSKN0 Yj是Y的无偏估计量
§6.1 整群抽样 §6.2 群内相关系数 §6.3 系统抽样
§6.4 个体指标具有特殊结构时的 系统抽样
§6.5 系统抽样估计量方差的估计
整群抽样的提法 目标量的估计
整群抽样的Байду номын сангаас法
整群抽样的提法与特点
在多阶抽样中,当某一单元被抽中,对该单元 包含的下一级抽样单元不再抽样,而是进行普查 抽样框要求简单
(2)YˆCPP的 S 均方偏差为
V(YˆCPP)S1kiK 1
pip1i
Ni
2
Yij Y
j1
(3)V(YˆCPP)的 S 一个无偏估计量为
v(YˆCPP)Sk(k11)
k 1 i1pi
Ni
Yi j
j1
2
YˆCPPS
也可将整群抽样看作单阶抽样,同样可以得到上述 两个定理
目标量的估计
例1 在一次针对某城市大学生月生活费支出的调查中, 以小组为群进行整群抽样。每个小组有8名大学生, 采用简单随机抽样在510个组中抽取12个小组,全部 96个样本大学生月生活费支出数据如表.试估计该城 市大学生人均月生活费及其95%的置信区间.
看作分层抽样
将两行个体看作一个层,每层有两个样本单元。 两个样本单元构造一个该层的方差估计,再按分层抽 样汇总出一个均方偏差的估计
v2(Y ˆSY ) SK 2 1K 1 N j0 /1 2Y (2j)Y (2j 1)2 v 3(Y ˆSY ) S N N 0 2 1 K 1 2 (N 1 0 1 )jN 0 2Y j Y (j 1 )2
例2 调查一片荒地上蝗蝻数量,以一平方米为单位 。N=5000,K=500,N0=10,k=20,作简单随机的整群抽 样,估计整块荒地蝗蝻数.数据如表
群内相关系数的概念 整群抽样的设计效应
群内相关系数的概念
群内相关系数
K Ni Ni
(Yij Y )(Yil Y )
i1 jl
C
K
Ni
(Ni 1) (Yij Y )2
v2,v3有很广适用范围,特别是v3为许多实际工作者 所采用。
看作分层抽样
例 调查某单位员工档案工资外的收入情况,该单位有 员工660人,备有以出生年月为顺序的花名册。以花 名册作为抽样框,拟抽取30个样本单元,故取K=22作 系统抽样。从1,2,……,22中随机取出一数为R=7, 入样的单元号码为7,29,……,623,645。对花名 册对应号码的员工进行调查,得当月各人收入资料如 表(单位:元),估计每人平均收入及估计量的均方 偏差.
简单随机抽样 分层抽样V(U ˆSE )N2(N11)2K ( 1)
V(UˆSt)NK(1K221)
此时分层抽样精度最高,系统抽样次之,简单随 机抽样精度最低
与次序有某种周期关系
设个体指 t为标 周(以 N期 M)t
Y 1 1 , Y 2 2 , , Y t t , Y t 1 1 , , Y 2 t t ,
S2 S内 2时,简单随机抽样 系优 统于 抽样 S2 S内 2时,系统抽样优于 随简 机单 抽样 S2 S内2时,两者精度相同
系统抽样的效率
与分层抽样的比较
将总体N 分 0个 为层,每层简取 单一 随个 机样 抽本
Yˆst
N N0
N0
Yii
i1
V(Yˆst)KN0
K
(YjiYi)2
i1 j1
个体指标与其次序有线性关系 个体指标与其次序有某种周期关系 个体的次序随机排列
个体指标与其次序有线性关系
Y ii,i 1 ,2 , ,N 设 U i(Y i)/i
则 U N 2 1 ,S 2N 1 1iN 1(U i U )2 (N 1 1 )N 2
系统抽样
U ˆSYSN1 2N(NK) V(UˆSY)SN2(1K221)
社会态度
税务信息
住宅 城市居民 离开的旅客
学生 成年村民
土地所有者
街区 住宅区 航班
班级

分类台帐页
目标量的估计
将整群抽样看作二阶抽样的特例
定理6.1 对简单随机抽样的整群抽样,总体总数Y的估 计有
(1)Y的无偏Yˆ估 CS E计 K ki k1为 N j 1 i Yij
(2)YˆCS的 E 均方偏差为
j1
(2)V(YˆSY)SKiK 1N j01YijK Y2
K
N0N
i1
Yi Y
2
由这个思路无法给出其均方偏差的估计量
系统抽样的效率
与简单随机抽样的比较 (N 1 )S 2 N 0 (K 1 )S 外 2 (N 0 1 )K 内 2S V(Y ˆS)EN(K1)S2
V(Y ˆSY ) SN 0N(K1)S外 2N (N 1 )S2N (N K )S 内 2 V ( Y ˆ S) Y V ( S Y ˆ S )E N ( N K )S 2 ( S 内 2 )
V(YˆCS)E K k21K kK11iK 1jN i1YijK Y2
(3)V(YˆCS)E的一个无偏估计量为
v(YˆCS)EKk21K kk11i k1N j1i Yij YˆC KSE 2
目标量的估计
定理6.2 对有放回PPS整群抽样,总体总数Y的估计有
(1)Y的无偏 Y ˆC估 P PS k 1计 i k1p1为 i N j 1 i Yij
系统抽样的提法 系统抽样的估值法 系统抽样的效率
系统抽样的提法
选一正K整 ,数 将总 (N体 )中的 N个单元依次
1, 2, , K, K 1, K 2, , 2K, 2K 1, 2K 2, , 3K,
直至N为止
N不是K整数倍的处理方法
1.N/K较大(≥50)可忽略每 群个体差
2.将个体单元首位衔接循 环取样
DefV fV (Y(ˆC Yˆ)S)E1(N01)C
C较大N,0较大时,整群抽差样得精多度
对第一级为简单 样随 的机 二抽 阶抽样有
Deff1C(n0 1)
整群抽样的设计效应
实 际 当 各 群, 容常 量 K 1用 i不 K 1Ni 等 N0来 时估 计
设计效应
群 内 相 关 系 数 的 另 一 表 达 式 为 C = 1 N N 1 S S 内 2 2 1 S S 内 2 2
样本相对集中,方便调查
特定场合具有较高精度
因为样本集中,可增大样本量弥补精度上的损失 群内次级单元差异很大反映总体分布时,其精度 不见得低
整群抽样的提法
整群抽样的适用场合
表6.1 可能适合整群抽样的实例
某个城市 某个城市 某机场 某大学 某乡
城市土地 所有者档案
住户特征 某项消费 旅游信息 就业计划
相关文档
最新文档