抽样调查之分层抽样培训课件PPT(共 43张)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 分层抽样
§4.1 估值法(一) §4.2 估值法(二)—— 组合比估计和回归估计
§4.3 样本量的分配 §4.4 与简单随机抽样之比较 §4.5 如何适当分层 §4.6 后分层估计和定额抽样
4.1 估值法(一)
分层抽样的提法 估值法(一)
分层抽样的提法 (Stratified sampling)
组合比估计的含义
有辅助变量X用于估值分析的,先分别对各层进 行简单估计,再用比估值法获得目标指标量的估计
K
yst Wi yi i1
K
xst Wi xi i1
yRC
yst xst
X
rC X
组合比估计只体需的 X或 知 X,道 无总 需知道 Xi或Xi
组合比估计
估值定理
是Y的无偏估,计 其均方偏差为
V(Yˆst) K Wi2V(Yˆi) i1
估 值 法(一)
系1当各层独立抽取简 的单 都随 是机样本,且 的Yi用简单估,值 则时 估计量
K
yst Wi yi i1
是Y的无偏估,计 其均方偏差为
V(yst)iK 1Wi2n1i (1fi)Si2
iK 1W i21 n ifi S Y 2 i R i2SX 2i 2R i iS Y iSX i
V ( yRS)的一个近似无偏估计为
v(yR)S iK 1W i21 nifi ni1 1jn i1(yijrixij)2
估 值 法(一)
例1 调查某地区居民的奶制品消费支出,以居民户为 抽样单元.根据经济收入水平将居民划分为4层,每层抽 取样本量为10的简单随机样本,调查数据如下表,试估 计该地区居民奶制品的月消费总支出及其置信度为 95%的置信区间.
分层抽样的步骤
分层:将总(体 N)分成互不K个 相子 交总 的体
K
K
(N)(Ni) N N i
i1
i 1
抽样:从每层抽取一个样本构成总的样本
K
y i 1 ,y i2 , ,y iin ,i 1 ,2 , ,K n ni
i 1
采用分层抽样的理由
可同时对子总体进行参数估计 便于组织实施,可根据各层特点采用不同抽样方式
分别比估计与组合比估计的比较
V(yRC )V(yR)S
iK 1W i21 nifi (R2Ri2)SX 2 i 2(RRi) iSYSiXi
iK 1 W i2 1 n ifi(R R i)2 S X 2 i 2 (R R i)i ( S Y S X i i R iS X 2 )
可使样本在总体中分布均匀,从而具有更好代表性
适当分层可提高参数估计的精度
分层抽样的提法
分层抽样的问题
如何分层 如何确定各层样本量 如何估值
记号
Y11 , ,
Y 21 , ,
Y K 1 , ,
Y1 N 1 y11 , ,
Y2N2
Y KN K
ni
yij
j 1
K
Y
i 1
Ni
Yij
j 1
si2
1 ni
ni
1j1(yij
yi)2
YY N
K i 1
N iYi N
KΒιβλιοθήκη Baidu
W iYi
i 1
估 值 法(一)
定理 4.1.1如果分层抽样每 样一 本层 是独 从立抽 且每一 Yi有 层无偏Y估 ˆi,则计估计量
Yˆst K WiYˆi i 1
V ( yst )的一个无偏估计为
v(yst)iK 1Wi2n1i (1fi)si2
估 值 法(一)
系2当各层独立抽取简的单都随是机样本,且
的样本ni额 足够大时K,用比时 估 , 值法
yRS Wiri Xi i1
是Y的近似无偏估 ,其计均方偏差近似为
V (yR)S iK 1W i21 n ifi N i1 1jN i1(Y ijR iX i)j2
定理4.2.1 对分层抽样的组合比估计,有
| E(yRCY)| V(xst)
V(yRC)
| X|
其V中 (yR)C , V(xs)t分别是 yR, Cx 估 s的 t 计 均量 .
组合比估计
当分层抽样 合 的 ,理 且 x样 st本 0(分 不配 依n赖 )时
(1)E(yRCY)O1n (2 )E (y R C Y )2 E (y s tR x s)t 2 O n 1 3 /2 O n 1 3 /2
y 21 ,
y K 1 ,
, ,
y 1 n1
y2n2
y Kn K
K
Ni N
i 1
Wi
Ni N
K
ni n
i 1
wi
ni n
fi
ni Ni
Ni
Yi Yij
j 1
Yi Yi / Ni
yi
1 ni
iK 1W i21 nifi(SY 2 i R 2SX 2 i2RiSYS iX)i (3 )v(yR)C iK 1W i21 n ifi(sy 2 i rC 2sx 2 i 2 rC sx) yi
例3续:给出Y的组合比估计量,估计其精度,与 分别比估计进行比较
组合比估计
估 值 法(一)
例2 对某地区的居民拥有家庭电脑的情况进行调查, 以居民为抽样单位,根据收入水平将居民户划分为4 层,每层按简单随机抽样抽取10户。调查数据如表。
估计该地区居民拥有家庭电脑的比例及抽样标 准误。
估 值 法(一)
例3 已知某公司一般职员及高级管理人员刚进入公司 时的工资总额分别为5523965元、2541660元,欲通过 抽样调查估计当前该公司职员的工资总额Y。抽样按 照一般职员与高管层进行分层随机抽取。一般职员共 390人,抽取15人;高管层共84人,抽取10名。调查 数据如表。
给出Y的分别比估计量,估计其精度
估 值 法(一)
练习1 为调查某地区住户的平均家庭成员数,将该地 去分为城市和乡村2层,每层按照简单随机抽样抽取 10户。调查数据如表。
估计该地区住户的平均家庭成员数及其95%的 置信区间。
4.2 组合比估计和回归估计
组合比估计 组合回归估计
组合比估计 (Ratio combined)
§4.1 估值法(一) §4.2 估值法(二)—— 组合比估计和回归估计
§4.3 样本量的分配 §4.4 与简单随机抽样之比较 §4.5 如何适当分层 §4.6 后分层估计和定额抽样
4.1 估值法(一)
分层抽样的提法 估值法(一)
分层抽样的提法 (Stratified sampling)
组合比估计的含义
有辅助变量X用于估值分析的,先分别对各层进 行简单估计,再用比估值法获得目标指标量的估计
K
yst Wi yi i1
K
xst Wi xi i1
yRC
yst xst
X
rC X
组合比估计只体需的 X或 知 X,道 无总 需知道 Xi或Xi
组合比估计
估值定理
是Y的无偏估,计 其均方偏差为
V(Yˆst) K Wi2V(Yˆi) i1
估 值 法(一)
系1当各层独立抽取简 的单 都随 是机样本,且 的Yi用简单估,值 则时 估计量
K
yst Wi yi i1
是Y的无偏估,计 其均方偏差为
V(yst)iK 1Wi2n1i (1fi)Si2
iK 1W i21 n ifi S Y 2 i R i2SX 2i 2R i iS Y iSX i
V ( yRS)的一个近似无偏估计为
v(yR)S iK 1W i21 nifi ni1 1jn i1(yijrixij)2
估 值 法(一)
例1 调查某地区居民的奶制品消费支出,以居民户为 抽样单元.根据经济收入水平将居民划分为4层,每层抽 取样本量为10的简单随机样本,调查数据如下表,试估 计该地区居民奶制品的月消费总支出及其置信度为 95%的置信区间.
分层抽样的步骤
分层:将总(体 N)分成互不K个 相子 交总 的体
K
K
(N)(Ni) N N i
i1
i 1
抽样:从每层抽取一个样本构成总的样本
K
y i 1 ,y i2 , ,y iin ,i 1 ,2 , ,K n ni
i 1
采用分层抽样的理由
可同时对子总体进行参数估计 便于组织实施,可根据各层特点采用不同抽样方式
分别比估计与组合比估计的比较
V(yRC )V(yR)S
iK 1W i21 nifi (R2Ri2)SX 2 i 2(RRi) iSYSiXi
iK 1 W i2 1 n ifi(R R i)2 S X 2 i 2 (R R i)i ( S Y S X i i R iS X 2 )
可使样本在总体中分布均匀,从而具有更好代表性
适当分层可提高参数估计的精度
分层抽样的提法
分层抽样的问题
如何分层 如何确定各层样本量 如何估值
记号
Y11 , ,
Y 21 , ,
Y K 1 , ,
Y1 N 1 y11 , ,
Y2N2
Y KN K
ni
yij
j 1
K
Y
i 1
Ni
Yij
j 1
si2
1 ni
ni
1j1(yij
yi)2
YY N
K i 1
N iYi N
KΒιβλιοθήκη Baidu
W iYi
i 1
估 值 法(一)
定理 4.1.1如果分层抽样每 样一 本层 是独 从立抽 且每一 Yi有 层无偏Y估 ˆi,则计估计量
Yˆst K WiYˆi i 1
V ( yst )的一个无偏估计为
v(yst)iK 1Wi2n1i (1fi)si2
估 值 法(一)
系2当各层独立抽取简的单都随是机样本,且
的样本ni额 足够大时K,用比时 估 , 值法
yRS Wiri Xi i1
是Y的近似无偏估 ,其计均方偏差近似为
V (yR)S iK 1W i21 n ifi N i1 1jN i1(Y ijR iX i)j2
定理4.2.1 对分层抽样的组合比估计,有
| E(yRCY)| V(xst)
V(yRC)
| X|
其V中 (yR)C , V(xs)t分别是 yR, Cx 估 s的 t 计 均量 .
组合比估计
当分层抽样 合 的 ,理 且 x样 st本 0(分 不配 依n赖 )时
(1)E(yRCY)O1n (2 )E (y R C Y )2 E (y s tR x s)t 2 O n 1 3 /2 O n 1 3 /2
y 21 ,
y K 1 ,
, ,
y 1 n1
y2n2
y Kn K
K
Ni N
i 1
Wi
Ni N
K
ni n
i 1
wi
ni n
fi
ni Ni
Ni
Yi Yij
j 1
Yi Yi / Ni
yi
1 ni
iK 1W i21 nifi(SY 2 i R 2SX 2 i2RiSYS iX)i (3 )v(yR)C iK 1W i21 n ifi(sy 2 i rC 2sx 2 i 2 rC sx) yi
例3续:给出Y的组合比估计量,估计其精度,与 分别比估计进行比较
组合比估计
估 值 法(一)
例2 对某地区的居民拥有家庭电脑的情况进行调查, 以居民为抽样单位,根据收入水平将居民户划分为4 层,每层按简单随机抽样抽取10户。调查数据如表。
估计该地区居民拥有家庭电脑的比例及抽样标 准误。
估 值 法(一)
例3 已知某公司一般职员及高级管理人员刚进入公司 时的工资总额分别为5523965元、2541660元,欲通过 抽样调查估计当前该公司职员的工资总额Y。抽样按 照一般职员与高管层进行分层随机抽取。一般职员共 390人,抽取15人;高管层共84人,抽取10名。调查 数据如表。
给出Y的分别比估计量,估计其精度
估 值 法(一)
练习1 为调查某地区住户的平均家庭成员数,将该地 去分为城市和乡村2层,每层按照简单随机抽样抽取 10户。调查数据如表。
估计该地区住户的平均家庭成员数及其95%的 置信区间。
4.2 组合比估计和回归估计
组合比估计 组合回归估计
组合比估计 (Ratio combined)