抽样调查第6章 整群抽样与系统抽样

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§6.1 整群抽样 §6.2 群内相关系数 §6.3 系统抽样 §6.4 个体指标具有特殊结构时的 系统抽样
§6.5 系统抽样估计量方差的估计
整群抽样的提法 目标量的估计
整群抽样的提法
整群抽样的提法与特点
在多阶抽样中,当某一单元被抽中,对该单元 包含的下一级抽样单元不再抽样,而是进行普查 抽样框要求简单 样本相对集中,方便调查 特定场合具有较高精度 因为样本集中,可增大样本量弥补精度上的损失 群内次级单元差异很大反映总体分布时,其精度 不见得低
2 K Ni
2
ˆ )的一个无偏估计量为 (3)V (Y CSE ˆ Y K k 1 CSE ˆ ) v(Y 1 Y CSE i j k K k 1 i 1 K j 1
2 k N i

2
目标量的估计
定理6.2 对有放回PPS整群抽样,总体总数Y的估计有 Ni k 1 1 ˆ (1)Y的无偏估计为YCPPS Yi j k i 1 pi j 1 ˆ 的均方偏差为 (2)Y CPPS
ˆ ) K ( Y Y ) 2 V (Y SYS ij j
i 1 j 1 j 1 K N0 N0
K (Y ji Yi ) 2 K (Y ji Yi )(Y jl Yl )
2 i 1 j 1 j 1 i l
N0
K
K N0 N0
(Y ji Yi )(Y jl Yl ) 0,系统抽样优于分层抽样
j 1 i l
K N0 N0
系统抽样的效率
例 假设总体有表中的30个单元,欲取5个构成系统样 本,与简单随机抽样和分层抽样同样本量的结果进行 比较(两种排列方式).
个体指标与其次序有线性关系 个体指标与其次序有某种周期关系 个体的次序随机排列
j 1
N0
K Y ˆ ) K Y N N Y Y 2 (2)V (Y SYS ij 0 i K i 1 j 1 i 1
K N0
2
由这个思路无法给出其均方偏差的估计量
系统抽样的效率
与简单随机抽样的比较
2 2 ( N 1)S 2 N0 ( K 1)S外 ( N0 1) KS内
村 分类台帐页
目标量的估计
将整群抽样看作二阶抽样的特例
定理6.1 对简单随机抽样的整群抽样,总体总数Y的估 计有 k Ni K ˆ Y (1)Y的无偏估计为Y CSE j k i 1 j 1 i ˆ 的均方偏差为 (2)Y CSE
K k 1 Y ˆ Yij V (YCSE ) 1 k K K 1 i 1 K j 1
v2,v3有很广适用范围,特别是v3为许多实际工作者 所采用。
看作分层抽样
例 调查某单位员工档案工资外的收入情况,该单位有 员工660人,备有以出生年月为顺序的花名册。以花 名册作为抽样框,拟抽取30个样本单元,故取K=22作 系统抽样。从1,2,……,22中随机取出一数为R=7, 入样的单元号码为7,29,……,623,645。对花名 册对应号码的员工进行调查,得当月各人收入资料如 表(单位:元),估计每人平均收入及估计量的均方 偏差.
Yij Y j 1 ˆ )的一个无偏估计量为 (3)V (Y CPPS
K Ni
1 1 ˆ V (YCPPS) pi k i 1 pi
k
2
1 1 ˆ ) v(Y CPPS k (k 1) i 1 pi
ˆ Yi j Y CPPS j 1
个体的次序随机排列
对总体的某种排列次序,系统抽样精度可能优于 简单随机抽样也可能劣于简单随机抽样,但对N个个 体的所有N!种排列而言,系统抽样的平均精度与简单 随机抽样相等 当个体指标具有某种特殊结构时,常对取样方法进行 人为调整,有点典型抽样的味道,非完全概率抽样
看作简单随机抽样 看作分层抽样
整群抽样的提法
整群抽样的适用场合
表6.1 可能适合整群抽样的实例 总 体 变 量 基本单元 群(初级单元)
某个城市 某个城市 某机场 某大学 某 乡
城市土地 所有者档案
住户特征 某项消费 旅游信息 就业计划
社会态度 税务信息
住宅 城市居民 离开的旅客 学生
成年村民 土地所有者
街区 住宅区 航班 班级
N i
2
也可将整群抽样看作单阶抽样,同样可以得到上述 两个定理
目标量的估计
例1 在一次针对某城市大学生月生活费支出的调查中, 以小组为群进行整群抽样。每个小组有8名大学生, 采用简单随机抽样在510个组中抽取12个小组,全部 96个样本大学生月生活费支出数据如表.试估计该城 市大学生人均月生活费及其95%的置信区间. 例2 调查一片荒地上蝗蝻数量,以一平方米为单位。 N=5000,K=500,N0=10,k=20,作简单随机的整群抽样, 估计整块荒地蝗蝻数.数据如表
群内相关系数的概念 整群抽样的设计效应
群内相关系数的概念
群内相关系数
C
(Y
i 1 j l K i 1
K
Ni
Ni
ij
Y )(Yil Y )
Ni
2 ( N 1 ) ( Y Y ) i ij j 1
若群内各单元指标均相等,则C达最大值1
群内相关系数是衡量群内单元同质性的一个指标
2 S 2 S内 时,简单随机抽样优于系统抽样 2 S 2 S内 时,系统抽样优于简单随机抽样 2 S 2 S内 时,两者精度相同
系统抽样的效率
与分层抽样的比较
将总体分为N 0个层,每ห้องสมุดไป่ตู้简单随机抽取一个样本单元 N0 K N0 N ˆ ) K (Y Y ) 2 ˆ V ( Y Y Y i st ji i st N 0 i 1 i i 1 j 1
例3 某县有33个乡,共726个村,某一年度农作物总 种植面积为30525亩。先采用等概抽样随机抽出10个 乡进行该种作物的产量调查,要求利用无偏估计量和 比率估计量(以群规模为辅助变量,以种植面积为辅 助变量)分别估计全县总产量,并计算估计量的标准 差。数据如表.
系统抽样的提法 系统抽样的估值法 系统抽样的效率
与次序有某种周期关系
设个体指标以t为周期( N Mt )
Y1 1, Y2 2,, Yt t , Yt 1 1,, Y2t t ,
此时系统抽样估值的精度与K的选取有很大关系, 应避免K=t 对周期资料选择合适K进行系统抽样,可得到比较 理想的精度 实际呈现精确周期排列的资料是没有的,而具有 一定周期性的资料很多,例如季节资料、月度资 料、星期资料等
整群抽样的设计效应
Ni N 0 (i 1,2,, K )时
K k 1 Y ˆ Yij V (YCSE ) 1 k K K 1 i 1 K j 1
2 K N0 2
2 K N0 K k 1 2 ˆ Yij Y ( K , N较大时) V (Y ) 1 k K K 1 i 1 j 1
个体指标与其次序有线性关系
Yi i, i 1,2,, N 设U i (Yi ) / i
N 1 2 1 N ( N 1) N 2 则U ,S ( U U ) i 2 N 1 i 1 12 系统抽样 2 2
N ( K 1) 1 ˆ ˆ U SYS N N ( N K ) V (U SYS ) 12 2 简单随机抽样 2 N ( N 1)( K 1) ˆ V (U SE ) 12 分层抽样 2 NK ( K 1) ˆ V (U St ) 12 此时分层抽样精度最高,系统抽样次之,简单随 机抽样精度最低
系统抽样的提法
选一正整数K,将总体 ( N )中的N个单元依次排列为
1, K 1, 2, K 2, , K , , 2 K ,
N不是K整数倍的处理方法 1.N/K较大(≥50)可忽略每 群个体差
2 K 1, 2 K 2, , 3K , 直至N为止
2.将个体单元首位衔接循 环取样
看作简单随机抽样
ˆ )可用 将系统抽样看作简单随机抽样,V (Y SYS
2 N N0 2 ˆ v1 (YSYS ) 1 s N0 N
N0 1 2 2 s Y Y 来估计,其中 j N 0 1 j 1
当个体单元并非完全随机排列时这个估计会产生 偏量:群内相关系数小,会高估均方偏差;群内 相关系数大,会低估均方偏差。
然后对号码1,2,…,K作随机抽样,若i入样,则 K+i,2K+i,…,皆入样,组成一个系统样本 若将同一列个体看做一个群,系统抽样可视为整群抽样
一般假定N=KN0,并且只从1~K中抽选一个样本单元 系统抽样的优点是抽样非常方便
系统抽样的估值法
将系统抽样看作整群抽样抽取一个一级单元,有
ˆ K Y 是Y的无偏估计量 (1)Y SYS j
ˆ ) V (Y CSE Deff 1 ( N 0 1) C ˆ) V (Y C 较大,N0 较大时,整群抽样精度差得多
对第一级为简单随机抽样的二阶抽样有 Deff 1 C (n0 1)
整群抽样的设计效应
1 K 实际当各群容量不等时,常用 N i N 0来估计 K i 1 设计效应 2 2 S内 N S内 群内相关系数的另一表达式为 C =1 1 2 2 N 1 S S 2 一般有S内 S 2,所以 C介于0, 1之间
看作分层抽样
将两行个体看作一个层,每层有两个样本单元。 两个样本单元构造一个该层的方差估计,再按分层抽 样汇总出一个均方偏差的估计
N0 / 2 1 2 ˆ ) K 2 1 Y v2 (Y Y SYS (2 j ) ( 2 j 1) K j 1 N0 2 N 1 1 2 ˆ ) v3 (Y 1 Y Y j ( j 1) SYS N 0 K 2( N 0 1) j 2
ˆ ) N ( K 1)S 2 V (Y SE
2 ˆ ) N N ( K 1) S 2 N ( N 1) S 2 N ( N K ) S内 V (Y SYS 0 外
ˆ ) V (Y ˆ ) N ( N K )( S 2 S 2 ) V (Y SYS SE 内
群内相关系数方便计算的另一表达式
K Ni 2 ( Y Y ) ( Y Y ) ij ij i 1 j 1 i 1 j 1 C K Ni 2 ( N 1) ( Y Y ) i ij K Ni i 1 j 1 2
目标量的估计
相关文档
最新文档