等距抽样

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 2 S 166 . 25 S 141.61 表9.2中: wsy V ( ysy ) 9.73 VSRS ( y) 28.32
§9.3
等距抽样的精度与总体单元排列次序的关系
一、单元的排列次序是随机的(按无关标识排列)
EV ysy VSRS y
“平均”:
假设
N nk
k 列中抽出一列
整群抽样,仅抽一个群 分层抽样,每层抽到1个单元且位置相同
群 层
三、优点 1、方便 2、一般情况下,样本代表性好 注意点:1、等距抽样的精度与单元的排列次序有关 2、要注意单元排列次序是否有周期性变化、 集中趋势等情况
§9.2
估计量及方差
y1 yk 1
y2 yk 2
n
1 f 2
2k 1 yi 2 j yi 2 j 1 2 j 1 nk
2
n
2


2
1 f 2 n
y
2 j 1
n
i 2 j
yi 2 j 1

2
由相邻两指标值之差构造: yi 2 j yi 2 j 1 ——一阶差分 每个指标值只算了一次
y1,, yN 的一种排列方法下,可求出1个 V ysy
N ! 种排列方法,有 N ! 个V ysy
注:N ! 个不同的排列次序中, VSRS
百度文库 不变
二、总体单元有线性趋势(按有关标识排列)
按某个指标,将单元按从小到大的次序排列, 如:假设
yi i
,再进行等距抽样。
N 当 不是整数时,实际样本量可能与 n 相差1。 n
这个抽样方法称为等距抽样,又称系统抽样或机械抽样。
例:从1~11中,按等距抽样的方法抽取3个数。 方法: 第一步:编号 N 第二步:计算抽样间隔 k n
与 k 最接近的整数
11 k 3.67 4 3 第三步:从1~ k 中随机抽取1个数 i 第四步:确定入样单元为 i 、 i k 和 i 2k 假设抽到 i 2 ,则2、6和10入样 假设抽到 i 3 ,则3、7和11入样
‫ ﻺ‬注2:等距抽样比简单随机抽样精度高,即
2 V ysy VSRS y Swsy S2
例 9.2.1 (p216)
2 2 S 7 . 60 S 141.61 wsy 表9.1中: V ( ysy ) 128.82 VSRS y 28.32
1、 n 为偶数的情况 共分为
n 2
层,每层抽2个样本单元。
第1层
y11 yi1 yk1 y12 yi 2 yk 2 y13 yi 3 yk 3 y14 yi 4 yk 4
1 2 s yi 2 yi1 2
2 1
第2层
1 2 s yi 4 yi 3 2
yi 与 i 存在某种相关关系,等距抽样的精度一般较高。
三、总体单元有周期性差异
必须慎重地选择抽样间隔 k
§9.5 设N
方差估计量
nk, yij是第 i 个等距样本中第 j 个单元的指标值。 1 n ysy yi yij n j 1
一、采用S.R.S的方差估计量(单元随机排列时效果较好)
y
j 1
ij
一、Y 的估计量
设等距样本是第 取估计量:
i 列元素,且 i 是随机的,
ˆ Ysy ysy yi
则:
ˆ Y EY sy

二、估计量的方差
定理9.2.1 设等距样本是第 i 列元素,且 i 是随机的,
则:
N 1 2 k (n 1) 2 V ysy S S wsy N N
第九章 等距抽样 (Systematic Sampling)
§9.1
什么是等距抽样
一、抽样方法 定义:从 N 个单元中抽取 n个单元,将 N 个单元按某种
N 顺序编上1至 N 号,选最接近 的整数 k 为抽样间隔, n
产生 1 ~ k 上离散均匀的随机数 i ,编号为
i, i k , i 2k ,, i (n 1)k 的单元入样。
k n 1 2 y y 为等距样本(群)内方差。 ij i k (n 1) i 1 j 1
2 S 其中, wsy
‫ ﻺ‬注1: V ( ysy )不仅与 S 2 有关,还与单元的排列次序有关。
例 9.2.1 (p216)
2 S 表9.1中: wsy 7.60
2 表9.2中: Swsy 166.25

第 n2 组
n 1 f 2 ˆ y V W s 3 sy h h n h2 1 2 s j yij yi ( j 1) 2 , j 2,3,, n 2 2k 1 Wj (n 1)2k n 1
n 1 f ˆ y V yij yi j 1 3 sy 2nn 1 j 2
2341043 3505404 2988185 4250293 5493355 6895267 6836061 7695751
二、与其他抽样方法的关系
y1 yk 1 y( n 1) k 1
等距抽样相当于从 列 行
y2 yk 2 y( n 1) k 2
yk y2 k ynk


2
ˆ y 与 V ˆ y 具有一定的优良性 研究表明, V 2 sy 3 sy
ˆ y 对 V 3 sy
n 无约束,更值得推荐
作业:p226 1 (1)、(3) p227 4
2 2

n 第 层 2
1 s yi ( 2 j ) yi ( 2 j 1) 2
2 j


2
y1( n1) yi ( n1) yk ( n1) y1n yin ykn
1 s yin yi ( n 1) 2
2 n 2


2
2 1 fh 2 ˆ V2 y sy Wh sh nh h 1 2
1 f 2 ˆ V1 ysy s n n 1 n 1 2 2 yij yi , f 其中, s n 1 j 1 N k
二、采用分层随机抽样的方差估计量
困难:每层只有一个样本单元,无法给出该层的方差估计
解决方法:将相邻2行组成一层,看作从每层中抽取2个单元
2、 n 既可以是偶数也可以是奇数的情况 第 组
y11 yi1 yk1 y12 yi 2 yk 2 y13 yi 3 yk 3 y14 yi 4 yk 4
组第 3
第 n 1 组
1
第 组
2
y1( n1) yi ( n1) yk ( n1) y1n yin ykn
y( n1) k 1 y( n1) k 2
1 其中: yi n
yk y2 k ynk
各列(群)均值:
n
y11 y21 y12 y22 y1n y2 n
yi1 yi 2 yin
yk 1 yk 2 ykn
y1 y2 yi yk
1 5
2 6
3 7
4 8
1 3 5
9 10 11
6
注意点:1、抽出第一个单元,就决定了整个样本
n 差1”的缺陷, 2、为克服“实际样本可能与 拉希里(Lahiri)提出圆形(或循环)系统抽样。
问题:各单元入样概率相等吗?
另一种形式:按指标值进行等距抽样(一般是不等概率抽样) 例子 从荆州平原8个县中按等距抽样方法抽取2个县
Vst 定量分析:
Vsy VSRS ,当且仅当 n 1时等号成立。
实际中,指标值未知,可利用历史资料和相关资料 例:欲调查1993年人口出生率,可利用1990年人口 普查资料中的人口出生率,将各地区按出生率从高到低 排列后进行等距抽样。
例:欲了解上海市所有企业2006年推出的新产品种类数目, 可以根据各企业的R&D投入在利润中所占比重指标,将企 业进行排序,然后进行等距抽样。 只要
7695751 3847876 第一步:计算抽样组距 k 2
第二步:抽取随机起点:2988185
地名 1 2 江陵 公安
人口数(人) 人口累计数 随机起点加组距 (人) 882802 882802 918552 1801354
3 4 5 6 7 8
石首 监利 洪湖 沔阳 天门 潜江
539689 1164361 744889 1243062 1401912 800484
相关文档
最新文档