等距抽样

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(n1)k 2
nk
k 等距抽样相当于从 列中抽出一列
列群
整群抽样,仅抽一个群
假设 N nk
行层
Baidu Nhomakorabea
分层抽样,每层抽到1个单元且位置相同
三、优点 1、方便 2、一般情况下,样本代表性好
注意点:1、等距抽样的精度与单元的排列次序有关 2、要注意单元排列次序是否有周期性变化、 集中趋势等情况
§9.2 估计量及方差
Sw2sy
其中,
S2 wsy

1 k(n 1)
k i 1
n j 1
为yi等j 距样yi本2(群)内方差。
‫ ﻺ‬注1: V ( y不sy仅)与 S 有关,2还与单元的排列次序有关。
例 9.2.1 (p216)
表9.1中:
S2 wsy
7.60
表9.2中:
S2 wsy
166.25
S2
141.61
V ( ysy ) 9.73 VSRS ( y) 28.32
§9.3 等距抽样的精度与总体单元排列次序的关系
一、单元的排列次序是随机的(按无关标识排列)
EV ysy VSRS y
“平均”:
y1,, yN 的一种排列方法下,可求出1个
N! 种排列方法,有 个N! V ysy
n
例:从1~11中,按等距抽样的方法抽取3个数。
方法:
第一步:编号
第二步:计算抽样间隔
k

11 3


k
3.67
N n
4

与 k最接近的整数
k 第三步:从1~ 中随机抽取1个数
i
第四步:确定入样单元为
i 、 i k和 i 2k
假设抽到 i ,2则2、6和10入样
ysy

yi

1 n
n j 1
yij
一、采用S.R.S的方差估计量(单元随机排列时效果较好)
其中,
Vˆ1 ysy
1 f n
s2
s2 1 n n 1 j1
yij yi 2 ,
f n 1 Nk
二、采用分层随机抽样的方差估计量
困难:每层只有一个样本单元,无法给出该层的方差估计 解决方法:将相邻2行组成一层,看作从每层中抽取2个单元
N! 注: 个不同的排列次序中,
V 不变 SRS
y
V ysy
二、总体单元有线性趋势(按有关标识排列)
按某个指标,将单元按从小到大的次序排列,
如:假设 yi i ,再进行等距抽样。
定量分析: Vst Vsy ,当V且SR仅S 当
时等号成n立。1
实际中,指标值未知,可利用历史资料和相关资料 例:欲调查1993年人口出生率,可利用1990年人口 普查资料中的人口出生率,将各地区按出生率从高到低 排列后进行等距抽样。
例子
从荆州平原8个县中按等距抽样方法抽取2个县
第一步:计算抽样组距
k 7695751 3847876 2
第二步:抽取随机起点:2988185
地名 人口数(人) 人口累计数 (人)
随机起点加组距
1 江陵
882802
882802
2 公安
918552
1801354
3 石首 4 监利 5 洪湖 6 沔阳 7 天门 8 潜江
例:欲了解上海市所有企业2006年推出的新产品种类数目, 可以根据各企业的R&D投入在利润中所占比重指标,将企 业进行排序,然后进行等距抽样。
y i 只要 与i 存在某种相关关系,等距抽样的精度一般较高。
三、总体单元有周期性差异
必须慎重地选择抽样间隔 k
§9.5 方差估计量
设 N ,nk 是y第ij i 个等距样本中第 j 个单元的指标值。
‫ ﻺ‬注2:等距抽样比简单随机抽样精度高,即
V
ysy
VSRS
y

S2 wsy

S2
例 9.2.1 (p216)
表9.1中:
S2 wsy
7.60
S2
141.61
V ( ysy ) 128 .82 VSRS y 28.32
表9.2中:
S2 wsy
166.25
假设抽到 i ,3则3、7和11入样
12 34 56 78 9 10 11
1 3
5 6
注意点:1、抽出第一个单元,就决定了整个样本
n 2、为克服“实际样本可能与 差1”的缺陷, 拉希里(Lahiri)提出圆形(或循环)系统抽样。
问题:各单元入样概率相等吗?
另一种形式:按指标值进行等距抽样(一般是不等概率抽样)
n 1、 为偶数的情况
共分为
n层,每层抽2个样本单元。 2
第1层
y11 yi1 yk1
y12 yi2 yk2
第2层
y13 yi3 yk3
y14 yi4 yk4

第 n层 2
y1(n1) yi(n1) yk(n1) y1n yin ykn
y1 y2 yi yk
Y 一、 的估计量
i i 设等距样本是第 列元素,且 是随机的,
取估计量:
Yˆsy ysy yi
则:
E Yˆsy Y
二、估计量的方差
i i 定理9.2.1 设等距样本是第 列元素,且 是随机的,
则:
V
ysy

N 1S2 N

k(n 1) N
第九章 等距抽样 (Systematic Sampling)
一、抽样方法 定义:从
§9.1 什么是等距抽样
N N n 个单元中抽取 个单元,将 个单元按某种
N k 顺序编上1至 号,选最接近 的整数 N为抽样间隔,
产生
上离散均匀的随机数 ,编号n为
1~ k
i 的单元入样。
当i, i 不是k,整i数时2,k实,际样,本i 量可(n能与1)相k差1。 n 这个抽N样方法称为等距抽样,又称系统抽样或机械抽样。
y1
y2 yk
yk 1
yk2 y2k


y y y (n1)k1 (n1)k2
nk
各列(群)均值:
其中:
yi

1 n
n
yij
j 1
y11 y21 yi1 yk1 y12 y22 yi2 yk 2 y1n y2n yin ykn
539689 1164361 744889 1243062 1401912 800484
2341043 3505404 2988185 4250293 5493355 6895267 6836061 7695751
二、与其他抽样方法的关系
y1
y2
yk
yk 1
yk2 y2k


y y y (n1)k 1
相关文档
最新文档