第七章系统抽样
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
2
2
1k V y = = E y Y y Y = 9 . 4 5 2 s y 1 s y r kr 1
2 2 S N n 1 . 53 2 4 1 w s t V y = 2 . 5 1 6 s t n N 4 3 2
2
73 205 168 146 317
961
1034 1239 1407 1553 1870 1346
二 、 系 统 抽 样 特 点
优 点 :
简 便 易 于 控 制 有 潜 在 分 层 功 能
弱 点 :
有 时 估 计 量 是 有 偏 的 抽 样 误 差 计 算 上 比 较 复 杂
三 、 抽 样 类 型
2
(y Y )( y Y ) 样本(群)内相关系数 E rj ru wsy 2 E (y Y ) rj
层内方差
1 S y y rj j n ( k 1 ) j 1r 1
2 wst n k
2
层均值
同一系统样本内对层均值离差的相关系数
E ( y y y y ) rj j)( ru u wst 2 E ( y y ) rj j
2 . 如 何 解 决 有 偏 问 题 ( 1 ) 循 环 等 距 抽 样
( 2 ) 修 正 直 线 等 距 抽 样
取 随 机 数 r , r / k = 商 … . . 余 数 将 余 数 作 为 起 点 i , 余 数 为 1 的 概 率 0 . 4 余 数 为 2 的 概 率 0 . 3 余 数 为 3 的 概 率 0 . 3
第二节 等概系统抽样
等概系统抽样即等距抽样
1 n ysy yr yrj n j1
N 9 , n 3 , k 3 , 1 i 3 例 : ,
y i 1 时 , Y 1Y 4Y 71
y i 2 时 , Y 2Y 5Y 8 2
i 3 y 时 , Y 3 3Y 6Y 9
y
2 5 8
2 n ( n 1 )( k 1 ) S wst wst
n kV (ysy)
n k 2 j 1 r 1
2
n 2 2 n ( yr Y) yrj y j r 1 j 1 r 1
rj
k
k
2
2y )( y 这时有 ( y rj n (k 1 )S . j ru
E (y Y )( y Y ) rj ru wsy 2 E (y Y ) rj
样本(群)内相关 系数
( 2 ) 用 层 的 有 关 参 数 表 示 令 第 j 层 的 均 值 为 :
K 1 y y . j ij k
层 内 方 差 为
n k 1 2 2 S ( y y ) ws t ij . j n ( k 1 )
E ( y ) 0 . 4 ( y ) 0 . 3 ( y ) 0 . 3 ( y ) Y sy 1 2 3
( 3 )修 正 估 计 量
Kn y ' y i N
' E (y ) Y
3 y Y Y Y Y ) 1' ( 1 4 7 10 10
3 y Y Y Y 2' ( 2 5 8) 10
y Vyst V sy
可以看出,当ρ
wst
1 n 1 wst
<0 时,sy 优于 st
通常情况下,ρ (3)实际处理
wst
>0,系统抽样不如分层抽样效率高。
在(1)中,S2wsy 不知, 在(2)中,S2wst,ρ
wst
不知。
比较srs,st,sy
层 1 2 等距样本数 3 4 5 6 7 8 层均值
不等概系统抽样 PS入样概率与单元大小成比例的系 Mi n 统抽样 i M 0 抽中代码 行政村编号 累计人数 代码法
M
i
人数
1 2 3 4
103 432 96 246
103 535 631 877
100
特别大的单 元事先将从 抽样框中提 出直接放入 样本
723
5
6 7 8 9 10
84
1 . 按 无 关 标 志 排 列 2 . 按 有 关 标 志 排 列 3 . 自 然 排 列
四、与其他抽样方式的关系 设 N n.k
Y1
Yk 1
Yk 2
. .
….. …..
Y( n1) k 1
Y2
. .
Y( n1)k 2
. .
Y Y j k rj 1 r
Yk
Y2 k
…..
3
14 20 34 71
3
12 20 34 69
4
11 24 31 70
5
8 24 30 67
6
8 25 28 67
7
7 27 27 68
3.75
11.5 21.875 32.25
1k 1 k V y = = E y Y y Y = 2 n y n Y = 0 . 2 0 2 s y 2 s y r r kr nkr 1 1
Ynk
层
Y Y j k rj 1 r
Y11 Y21
. .
Y12
….. …..
Y1n Y2 n
. .
群
Y22
. .
Yk 1
Yk 2
…..
Ykn
符号说明
系统样本 平均数
k
1 n yr yrj n j 1
n 2
系统样本(群)内方差
1 S y y rj r wsy k ( n 1 )r 1j 1
Chap7 系统抽样
Systematic sampling
第一节 概述
第一节 概述
一 什么是系统抽样
总体中的N个单元按一定顺序排列, 抽取一个起始单元, 按某种规则选取其它单元直到满n个为止
等距抽样:按照固定的间隔选取
直线等距抽样:
, 2 , ,N 总体中的N个单元已按某种确定顺序编号为 ,1 N nk 先从头K个单元编号中随机抽出一个单 元编号,然后每隔K个单元编号抽出一个单元编号, 直到抽出n个单元编号为止。 圆形等距抽样: 假设总体单元数 N nk总体中的N个单元已按某种 , 2 , ,N 确定顺序编号为1 ,将这些编号看成首尾相 接的一个环,并从1到N中按简单随机抽样方式抽 取一个单元编号作为随机起点,然后每隔 K抽取一 个单元编号,直到抽满n个单元为止
N n2 3 2 41 2 9 . 5 2 3 2 V y S 2 8 . 3 3 3 s r s N n 3 2 4
假设总体单元数假设总体单元数总体中的总体中的nn个单元已按某种个单元已按某种确定顺序编号为确定顺序编号为将这些编号看成首尾相将这些编号看成首尾相接的一个环并从接的一个环并从11到到nn中按简单随机抽样方式抽中按简单随机抽样方式抽取一个单元编号作为随机起点然后每隔取一个单元编号作为随机起点然后每隔kk抽取一抽取一个单元编号直到抽满个单元编号直到抽满nn个单元为止个单元为止直线等距抽样直线等距抽样实施方法编号随机起点入选单元2k3kn1knk2121441717随机起点随机起点8813131111201210圆形等距抽样圆形等距抽样实施方法编号不是直线排列而是环状圆形排列是随机起点的选择范围由11到到kk扩展到11到到nn不等概系统抽样不等概系统抽样入样概率与单元大小成比例的系入样概率与单元大小成比例的系统抽样统抽样代码法代码法ps行政村编号累计人数抽中代码10310310043253596631246877723849617310342051239168140713461461553103171870特别大的单元事先将从抽样框中提出直接放入样本二系统抽样特点优点
直线等距抽样实施方法 :
r(j 1 ) k
( j 1 , 2 , n ) 抽样间隔 K=N/n , 2 , ,N 编号 1 随机起点 i , 1 i k 入选单元 i ,i k ,i 2 k ,....
i
K
2K
3K
(n-1)K
nK
圆形等距抽样实施方法 :
编号不是直线排列而是环状(圆形)排列, 是随机起点的选择范围由1到k 扩展到1到N 21 ⑴
K
k
n
= nkV ( ysy )
2 ( y y ) rj r
k
n
(1)
系统样本 内方差
2 令 Swsy
k n 1 2 ( y y ) rj r k (n 1)
则 K (n 1) S 便有
2 wsy
( yrj yr )
k
n
2
代入(1)
( N 1)S nKV ( ysy ) K (n 1)S
3 Y Y Y Y Y Y Y 1 1 1 4 7 Y 2 5 8 Y 3 6 9 E ( y ) y ( ) sy i 3 3 3 3 3
9 1 Y Y = i 9
N 10 , n 3 , k 取 3 或 4 ,
若 k = 3
i 1 y 时 , Y Y Y Y 1 4 7 1 0 1 i 2 y 时 , Y Y Y 2 5 8 2
y i 3 3 时 , Y Y Y 3 6 9
3 1 E ( y ) y sy i 3
Y Y Y Y Y Y Y Y Y 1 1 4 7 10 2 5 8Y 3 6 9 ( ) 3 4 3 3 Y
有偏
E ( y ) Y 同 理 可 证 k = 4 时 , sy
(1) 反映 sy 与 srs 关系的方差计算公式
KV ( ysy ) ( yr Y )2
K
又
1 k n 2 S ( y Y ) rj N 1
2
( N 1) S ( yrj Y )2
2
K
n
=n
2 2 ( y Y ) ( y y ) r rj r
yrj y j 2
y )1 0 2 .u n ( n 1 )( k ) S wst wst wst
( y y )( y y)
r 1j u j ru u
k
n
此时,估计量的方差为
2 S wst N n V ( y sy ) ( )[1 (n 1) wst ] n N 2 S wst N n 式中, ( ) 为按比例分层抽样的方差 n N
19 ⒅
r ( j 1 ) k N 0
20
17 16 i r (j 1 ) k 15 ⒁ 随机起点
13
3 2 4 ⑸ 6 7 8 ⑼
10
k
N 21 4 .2 n 5
r ( j 1 ) k N 0
11 12
i m i n { rj ( 1 ) k , rj ( 1 ) k N }ຫໍສະໝຸດ ⅠⅡ Ⅲ Ⅳ 总数
1
7 17 27 52
1
8 18 28 55
3
8 20 30 61
3
11 20 31 65
4
12 24 34 74
5
14 24 34 77
6
16 25 36 83
7
16 27 38 88
3.75
11.5 21.875 32.25 69.5
k 1 V y = E y Y = y Y = 9 . 4 5 2 s y s y r k r 1 2 2 S N n 1 1 . 5 3 2 4 w s t V y = 2 . 5 1 6 s t n 2 N 4 3
层内相关系数为 E ( yrj y. j )( yr y. ) wst E ( yrj y. j )2
对ρ 层 1 2 3
wst
的剖析 r=1 1 4 7 r=2 2 5 8 r=3 3 6 9
k n 2 ( y Y )( y Y ) rj ru 2 ( n 1 )( N 1 ) Sr 1 j u
2
N n 2 4 1 2 9 . 5 2 3 2 2 3 V y S 2 8 . 3 3 3 s r s N n 3 2 4
第二层和第四层的观测值次序颠倒
等距样本数 层 1 2 3 4 5 6 7 8 层均值
Ⅰ
Ⅱ Ⅲ Ⅳ 总数
1
16 17 38 72
1
16 18 36 71
3 y Y Y Y 3' ( 3 6 9) 10
1 E ( y ' ) ( y1 ' y 2 ' y 3 ' ) Y 3
(二)
Y 的估计量方差
1. 直观考察 2. 计算公式 按方差定义
K 1 V ( y sy ) E ( y sy Y ) 2 ( yi Y ) 2 K
2
2
2 wsy
( N 1) S K (n 1) 2 得: V ( y sy ) S wsy N N
系统抽样优于简单随机抽样的条件为:
( N 1) S K ( n 1) 2 N n S S wsy N N N n
2
2
( N 1) S 2 N n S 2 K ( n 1) 2 S wsy N N n N
即当
K ( n 1) S w2 sy [( N 1) K ( n 1) S 2
N n 2 ]S n
就 是 S 2 wsy >S 2 , sy 效 率 高 于
srs
作为一种特殊的整群抽样,且群的规模大小都相 等的方差可表示为:
2 S N 1 V ( y ) ( ) [ 1( n 1 ) ] s y w s y n N
2
2
1k V y = = E y Y y Y = 9 . 4 5 2 s y 1 s y r kr 1
2 2 S N n 1 . 53 2 4 1 w s t V y = 2 . 5 1 6 s t n N 4 3 2
2
73 205 168 146 317
961
1034 1239 1407 1553 1870 1346
二 、 系 统 抽 样 特 点
优 点 :
简 便 易 于 控 制 有 潜 在 分 层 功 能
弱 点 :
有 时 估 计 量 是 有 偏 的 抽 样 误 差 计 算 上 比 较 复 杂
三 、 抽 样 类 型
2
(y Y )( y Y ) 样本(群)内相关系数 E rj ru wsy 2 E (y Y ) rj
层内方差
1 S y y rj j n ( k 1 ) j 1r 1
2 wst n k
2
层均值
同一系统样本内对层均值离差的相关系数
E ( y y y y ) rj j)( ru u wst 2 E ( y y ) rj j
2 . 如 何 解 决 有 偏 问 题 ( 1 ) 循 环 等 距 抽 样
( 2 ) 修 正 直 线 等 距 抽 样
取 随 机 数 r , r / k = 商 … . . 余 数 将 余 数 作 为 起 点 i , 余 数 为 1 的 概 率 0 . 4 余 数 为 2 的 概 率 0 . 3 余 数 为 3 的 概 率 0 . 3
第二节 等概系统抽样
等概系统抽样即等距抽样
1 n ysy yr yrj n j1
N 9 , n 3 , k 3 , 1 i 3 例 : ,
y i 1 时 , Y 1Y 4Y 71
y i 2 时 , Y 2Y 5Y 8 2
i 3 y 时 , Y 3 3Y 6Y 9
y
2 5 8
2 n ( n 1 )( k 1 ) S wst wst
n kV (ysy)
n k 2 j 1 r 1
2
n 2 2 n ( yr Y) yrj y j r 1 j 1 r 1
rj
k
k
2
2y )( y 这时有 ( y rj n (k 1 )S . j ru
E (y Y )( y Y ) rj ru wsy 2 E (y Y ) rj
样本(群)内相关 系数
( 2 ) 用 层 的 有 关 参 数 表 示 令 第 j 层 的 均 值 为 :
K 1 y y . j ij k
层 内 方 差 为
n k 1 2 2 S ( y y ) ws t ij . j n ( k 1 )
E ( y ) 0 . 4 ( y ) 0 . 3 ( y ) 0 . 3 ( y ) Y sy 1 2 3
( 3 )修 正 估 计 量
Kn y ' y i N
' E (y ) Y
3 y Y Y Y Y ) 1' ( 1 4 7 10 10
3 y Y Y Y 2' ( 2 5 8) 10
y Vyst V sy
可以看出,当ρ
wst
1 n 1 wst
<0 时,sy 优于 st
通常情况下,ρ (3)实际处理
wst
>0,系统抽样不如分层抽样效率高。
在(1)中,S2wsy 不知, 在(2)中,S2wst,ρ
wst
不知。
比较srs,st,sy
层 1 2 等距样本数 3 4 5 6 7 8 层均值
不等概系统抽样 PS入样概率与单元大小成比例的系 Mi n 统抽样 i M 0 抽中代码 行政村编号 累计人数 代码法
M
i
人数
1 2 3 4
103 432 96 246
103 535 631 877
100
特别大的单 元事先将从 抽样框中提 出直接放入 样本
723
5
6 7 8 9 10
84
1 . 按 无 关 标 志 排 列 2 . 按 有 关 标 志 排 列 3 . 自 然 排 列
四、与其他抽样方式的关系 设 N n.k
Y1
Yk 1
Yk 2
. .
….. …..
Y( n1) k 1
Y2
. .
Y( n1)k 2
. .
Y Y j k rj 1 r
Yk
Y2 k
…..
3
14 20 34 71
3
12 20 34 69
4
11 24 31 70
5
8 24 30 67
6
8 25 28 67
7
7 27 27 68
3.75
11.5 21.875 32.25
1k 1 k V y = = E y Y y Y = 2 n y n Y = 0 . 2 0 2 s y 2 s y r r kr nkr 1 1
Ynk
层
Y Y j k rj 1 r
Y11 Y21
. .
Y12
….. …..
Y1n Y2 n
. .
群
Y22
. .
Yk 1
Yk 2
…..
Ykn
符号说明
系统样本 平均数
k
1 n yr yrj n j 1
n 2
系统样本(群)内方差
1 S y y rj r wsy k ( n 1 )r 1j 1
Chap7 系统抽样
Systematic sampling
第一节 概述
第一节 概述
一 什么是系统抽样
总体中的N个单元按一定顺序排列, 抽取一个起始单元, 按某种规则选取其它单元直到满n个为止
等距抽样:按照固定的间隔选取
直线等距抽样:
, 2 , ,N 总体中的N个单元已按某种确定顺序编号为 ,1 N nk 先从头K个单元编号中随机抽出一个单 元编号,然后每隔K个单元编号抽出一个单元编号, 直到抽出n个单元编号为止。 圆形等距抽样: 假设总体单元数 N nk总体中的N个单元已按某种 , 2 , ,N 确定顺序编号为1 ,将这些编号看成首尾相 接的一个环,并从1到N中按简单随机抽样方式抽 取一个单元编号作为随机起点,然后每隔 K抽取一 个单元编号,直到抽满n个单元为止
N n2 3 2 41 2 9 . 5 2 3 2 V y S 2 8 . 3 3 3 s r s N n 3 2 4
假设总体单元数假设总体单元数总体中的总体中的nn个单元已按某种个单元已按某种确定顺序编号为确定顺序编号为将这些编号看成首尾相将这些编号看成首尾相接的一个环并从接的一个环并从11到到nn中按简单随机抽样方式抽中按简单随机抽样方式抽取一个单元编号作为随机起点然后每隔取一个单元编号作为随机起点然后每隔kk抽取一抽取一个单元编号直到抽满个单元编号直到抽满nn个单元为止个单元为止直线等距抽样直线等距抽样实施方法编号随机起点入选单元2k3kn1knk2121441717随机起点随机起点8813131111201210圆形等距抽样圆形等距抽样实施方法编号不是直线排列而是环状圆形排列是随机起点的选择范围由11到到kk扩展到11到到nn不等概系统抽样不等概系统抽样入样概率与单元大小成比例的系入样概率与单元大小成比例的系统抽样统抽样代码法代码法ps行政村编号累计人数抽中代码10310310043253596631246877723849617310342051239168140713461461553103171870特别大的单元事先将从抽样框中提出直接放入样本二系统抽样特点优点
直线等距抽样实施方法 :
r(j 1 ) k
( j 1 , 2 , n ) 抽样间隔 K=N/n , 2 , ,N 编号 1 随机起点 i , 1 i k 入选单元 i ,i k ,i 2 k ,....
i
K
2K
3K
(n-1)K
nK
圆形等距抽样实施方法 :
编号不是直线排列而是环状(圆形)排列, 是随机起点的选择范围由1到k 扩展到1到N 21 ⑴
K
k
n
= nkV ( ysy )
2 ( y y ) rj r
k
n
(1)
系统样本 内方差
2 令 Swsy
k n 1 2 ( y y ) rj r k (n 1)
则 K (n 1) S 便有
2 wsy
( yrj yr )
k
n
2
代入(1)
( N 1)S nKV ( ysy ) K (n 1)S
3 Y Y Y Y Y Y Y 1 1 1 4 7 Y 2 5 8 Y 3 6 9 E ( y ) y ( ) sy i 3 3 3 3 3
9 1 Y Y = i 9
N 10 , n 3 , k 取 3 或 4 ,
若 k = 3
i 1 y 时 , Y Y Y Y 1 4 7 1 0 1 i 2 y 时 , Y Y Y 2 5 8 2
y i 3 3 时 , Y Y Y 3 6 9
3 1 E ( y ) y sy i 3
Y Y Y Y Y Y Y Y Y 1 1 4 7 10 2 5 8Y 3 6 9 ( ) 3 4 3 3 Y
有偏
E ( y ) Y 同 理 可 证 k = 4 时 , sy
(1) 反映 sy 与 srs 关系的方差计算公式
KV ( ysy ) ( yr Y )2
K
又
1 k n 2 S ( y Y ) rj N 1
2
( N 1) S ( yrj Y )2
2
K
n
=n
2 2 ( y Y ) ( y y ) r rj r
yrj y j 2
y )1 0 2 .u n ( n 1 )( k ) S wst wst wst
( y y )( y y)
r 1j u j ru u
k
n
此时,估计量的方差为
2 S wst N n V ( y sy ) ( )[1 (n 1) wst ] n N 2 S wst N n 式中, ( ) 为按比例分层抽样的方差 n N
19 ⒅
r ( j 1 ) k N 0
20
17 16 i r (j 1 ) k 15 ⒁ 随机起点
13
3 2 4 ⑸ 6 7 8 ⑼
10
k
N 21 4 .2 n 5
r ( j 1 ) k N 0
11 12
i m i n { rj ( 1 ) k , rj ( 1 ) k N }ຫໍສະໝຸດ ⅠⅡ Ⅲ Ⅳ 总数
1
7 17 27 52
1
8 18 28 55
3
8 20 30 61
3
11 20 31 65
4
12 24 34 74
5
14 24 34 77
6
16 25 36 83
7
16 27 38 88
3.75
11.5 21.875 32.25 69.5
k 1 V y = E y Y = y Y = 9 . 4 5 2 s y s y r k r 1 2 2 S N n 1 1 . 5 3 2 4 w s t V y = 2 . 5 1 6 s t n 2 N 4 3
层内相关系数为 E ( yrj y. j )( yr y. ) wst E ( yrj y. j )2
对ρ 层 1 2 3
wst
的剖析 r=1 1 4 7 r=2 2 5 8 r=3 3 6 9
k n 2 ( y Y )( y Y ) rj ru 2 ( n 1 )( N 1 ) Sr 1 j u
2
N n 2 4 1 2 9 . 5 2 3 2 2 3 V y S 2 8 . 3 3 3 s r s N n 3 2 4
第二层和第四层的观测值次序颠倒
等距样本数 层 1 2 3 4 5 6 7 8 层均值
Ⅰ
Ⅱ Ⅲ Ⅳ 总数
1
16 17 38 72
1
16 18 36 71
3 y Y Y Y 3' ( 3 6 9) 10
1 E ( y ' ) ( y1 ' y 2 ' y 3 ' ) Y 3
(二)
Y 的估计量方差
1. 直观考察 2. 计算公式 按方差定义
K 1 V ( y sy ) E ( y sy Y ) 2 ( yi Y ) 2 K
2
2
2 wsy
( N 1) S K (n 1) 2 得: V ( y sy ) S wsy N N
系统抽样优于简单随机抽样的条件为:
( N 1) S K ( n 1) 2 N n S S wsy N N N n
2
2
( N 1) S 2 N n S 2 K ( n 1) 2 S wsy N N n N
即当
K ( n 1) S w2 sy [( N 1) K ( n 1) S 2
N n 2 ]S n
就 是 S 2 wsy >S 2 , sy 效 率 高 于
srs
作为一种特殊的整群抽样,且群的规模大小都相 等的方差可表示为:
2 S N 1 V ( y ) ( ) [ 1( n 1 ) ] s y w s y n N