抽样技术课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

yst
L
Wh yh
1 N
Nh yh
Wh
Nh N
V ( yst )
Wh2
S
2 h
nh
(1
fh)
L
Wh2
Sh2 nh
L
Wh Sh2 N
式中:
fh
nh Nh
,
S
2 h
1 Nh 1
Nh i 1
(Yhi
Yh )2
若采用比例抽样,即nh
n.
Nh N
, 将此代入前式
则:V
(
yst
)
1
n
f
P(S)=
1
(
N n
)
每个单元被选入样本的概率
P(i)=
(11
)(
N 1 n1
)
=
(
N n
)
n N
二 基本公式
Mean
Y 1 N
N
Yi
y 1 n
n
yi
1 n
N
i yi
i =
1 0
is is
性质:
E(y) Y
Var( y) (1 f ) S 2
n
f n (Sampling fraction 抽样比)
一、总体与样本 1. 总体 2. 样本
样本:集合的概念(与总体对应)
样本单元:样本中的基础元素(与总体单元对应)
初级单元,二级单元,……最终单元
样本量:样本单元的数量(与总体规模对应)
二、目标总体与抽样总体 1. 目标总体 2. 抽样总体 3. 抽样框
良好抽样框的标志
三、概率抽样与非概率抽样
1. 概率抽样
N
其中 Yi A
Pˆ a y n
由于S 2 n pq n 1
Var(Pˆ) (1 f ) 1 n pq (1 f ) pq
n n 1
n 1
Sample Size
n n0 1 n0 N
n0为重复抽样条件下的样本量
t2S2 n0 2
n0
( ts rY
)2
(tc)2 r
当N很大时,n0 N
0, n n0,wr 与 wor 几乎没有区别。
三. 有关问题 1 样本的抽选
* 随机数字表 * 计算机抽取
2 总体方差的预先估计
计算样本量需要总体方差
历史资料 预调查 两步抽样
两步抽样 第一步:先抽n1个单位用来估计S2,进而确定n 第二步:在抽其余的n-n1个单位
第三章 分层抽样(Stratified Sampling)
属于调查策划。明确通过调查所要获取的信息,确定调查内容,决定 向谁进行调查(确定调查对象) 2. 调查问卷设计 3. 抽样设计 4. 调查方式(数据收集)确定 5. 数据编码与录入
6. 数据审核与插补 7. 数据估计(包括权数确定,计算置信区间) 8. 调查结果表述(调查报告)
抽样设计中涉及一些概念
1. 不同分配方式 n 300
层 Wi Si 常 数 分 配 1 0.2 20 100
与 Si2成 正 比
49
2 0.3 30 100
110
与 Wi成 正 比
60
90
3 0.5 34 100
141
150
n
300
300
300
内曼分配
40 90 170
300
V ( y)
3.86
3.11
3.09
3.00
特点与作用
2. 非概率抽样
(1)方便选样 (2)目的选样 (3)自愿样本 (4)配额选样
特点
四、 等概抽样与不等概抽样
1. 等概抽样 2. 不等概抽样
五、抽样误差与非抽样误差
1. 抽样误差
• 可以计算 • 可以控制
2. 非抽样误差
(1)抽样框误差 (2)无回答误差 (3)计量误差
六. 有关方差的概念
抽样技术与方法
学分:2 课时 10:00——11:30 教科书:抽样:理论与应用(高教出版社) 参考书:抽样:设计与分析 60元 主要问题:学生不同的知识背景 处理:前快后慢 学习方式:讲授与讨论 考试方式:平时30%,期末考试70%
第一章 基本概念
调查步骤
一个完整的调查包括几个阶段性的工作。 1. 调查目标确定
SRS Without replacement wor
现实中通常以wor为主体。 当总体规模 N 很大时,二者没有什么区别,但wr样本单元 之间独立,构造估计量要方便一些。
一.基本概念
1. 简单随机抽样概念: 属于等概率抽样
2. WOR定义 样本组合数:
(
N n
)
=
N! n!(N n)!
每个样本被抽中的概率:
一. 基本问题
什么是分层随机抽样 ? N N1 N2 NL
n n1 n2 nl
作用:可以对各层的参数进行估计,有助于提高估计精度。
应用条件:各层差异较大, 有进行分层的辅助信息。
分层原则 • 层内方差尽可能小 • 层间方差尽可能大
应用特点:在层内可采用不同的抽样方法。
二 分层抽样基本公式: 均值:
N
(1-f):finite population corrections——fpc
有限总体校正系数
Total
Yˆ Ny Var(Yˆ) Var(Ny) N 2Var( y)
proportion
1 Yi 0
如果单位 i 具备某特征 如果单位 i 不具备某特征
P A 1 NN
N
Yi Y (总体)
Wh
S
2 h
若各层方差相同,即
S
2 h
S
2 w
则V
(
yst
)
1
n
f
S
2 w
回到简单随机抽样,分层没有作用。
总量估计:
比例估计:
Yˆst Nyst
V (Yˆst ) N 2V ( yst )
Nh (Nh
nh )
S
2 h
nh
L
Pˆst W hPh
V (Pˆst )
1 N2
N
2 h
(
N
h
总体方差: S (Y Y )2
N 1
样本方差: s ( y y)2Fra Baidu bibliotek
n 1
抽样方差(估计量方差)
S2 V ( y) (1 f )
n
抽样方差估计 v( y) (1 f ) s2 n
七、精度与费用
100%
精 95% .………….. 度
…….
60%
20%
40%
费用
第二章 简单随机抽样
Simple Random Sampling (SRS) With replacement wr
nh ).
phqh
Nh 1
nh

Nh
很大,N h
-1
N

h
V (Pˆst )
Wh2 ph qh nh
(1
fh)
若估计具有某特征的单位总数A
L
Aˆst N.Pˆst N h Ph
V ( Aˆst )
Nh (Nh nh ) nh 1
phqh
如估计不同年龄组智力残疾儿童的人数
三.各层中样本单位数的分配
1. 常数分配,实际中采用不多;
2.
与S
2 i
成正比;
3. 与Wi 成正比,按比例分配,常采用
ni
n Ni N
nWi
4. 内曼分配
ni n
Ni Si n Wi Si
Ni Si
Wi Si
最优分配
分配样本量时考虑费用因素
费用函数C C0 niCi
相关文档
最新文档