第九章(二重抽样)
09-第九章 二阶及多阶抽样
1 M å (Yij - Y i ) 2 M - 1 j =1
则
2 S2 =
1 N
åS
i =1
N
2 2i
9.2.2 总体均值 Y 的估计量及其性质 如果二阶抽样中的每一阶抽样都是简单随机的, 且对每个初级单元, 第 二阶抽样是相互独立的,则样本按次级单元的均值
y=
1 n m 1 n yij = å y i åå nm i =1 j =1 n i =1
=W 2å =W 2å
N
1- f 2 Si m i =1 1- f m i =1
é 1 M ù (Yij - Y i )2 ú å ê ë M - 1 j =1 û N M 1- f 1 (Yij - Y i ) 2 =W 2 åå m M - 1 i =1 j =1 = 1 N2 1m N M M 1 (Yij - Y i ) 2 åå m M - 1 i =1 j =1
(9.1)
作为总体均值
Y=
1 NM
åå Yij =
i =1 j =1
N
N
1 N
åY
i =1
N
i
(9.2)
3
的估计,有如下性质:
E( y) = Y V ( y) = 1 - f1 2 1 - f 2 2 S1 + S2 n mn
(9.3) (9.4)
为证明上述性质, 注意到二阶抽样是分两步进行的, 因此对估计量求均 值与方差需按第六章给出的下述一般公式进行,即:
V ( y) =
将 n = N 代入,有
1 - f2 2 S2 mn 1 - f2 2 S2 mN
V ( y) =
其中 f 2 =
m ,则 M
高中数学必修二第九章知识点总结
高中数学必修二第九章知识点总结一、随机抽样。
1. 简单随机抽样。
- 定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤ N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
- 常用方法。
- 抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
- 随机数法:利用随机数表、随机数生成器或统计软件来抽取样本。
2. 系统抽样。
- 定义:将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样。
- 步骤。
- 先将总体的N个个体编号。
- 确定分段间隔k = (N)/(n)(n是样本容量),对编号进行分段。
- 在第1段用简单随机抽样确定第一个个体编号l(l≤ k)。
- 按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l + k),再加k得到第3个个体编号(l+2k),以此类推,直到获取整个样本。
3. 分层抽样。
- 定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样。
- 适用情况:总体是由差异明显的几个部分组成时。
- 步骤。
- 根据已掌握的信息,将总体分成互不相交的层。
- 计算各层中个体数与总体数的比例,按各层个体数占总体数的比例确定各层应抽取的样本容量。
- 在每一层进行抽样(可以用简单随机抽样或系统抽样)。
二、用样本估计总体。
1. 频率分布表与频率分布直方图。
- 频率分布表。
- 计算极差(最大值与最小值的差)。
- 决定组距与组数(组距=(极差)/(组数),组数通常取5 - 12组比较合适)。
- 确定分点,将数据分组。
- 统计每组的频数,计算频率(频率=(频数)/(样本容量)),列出频率分布表。
第8-9章-多阶段抽样和二重抽样
ˆ ˆ E E E E
2
2
1
2
E 2 E E 2 V E ˆ ˆ E1 2 ˆ 1 2 1 2
E 2 E E 2 ˆ ˆ V1 E2 E1 2 ˆ 1 2 ˆ ˆ V1 E2 E1 V2
2 S2 V ( y ) S12 m
2 当n=1时, V1 (Yi ) S1
这时, 若以n个
yi 的均值 y 推断 Y
,其方差为
2 2 S1 S2 V ( y) n nm
再考虑fpc,则(1)式成立。
V y 的无偏估计为:
证明:
2 1
E (s ) S
2 2
1 f1 2 f1 1 f 2 2 v y s1 s2 n nm
1 1 n 1 1 E1 M iYi M n i 1 MN
M iYi Y i 1
N
估计量的方差为:
1 f1 M i 1 V y M Yi Y nNM 2 nN i 1 i 1
N N
二.按不等概抽初级单元
1.按PPS抽取初级单元 N 第i个单元被选中概率 Z i ,( Z i 1 ) i 1 以总量估计为例,利用Hansen-Hurwitz估计量 ˆ Y的估计: 1 n Y 1 n M y
ˆ YHH
z n
i 1
i
i
n
i 1
i
i
zi
ˆ 可以证明 YHH是Y的无偏估计
二重分层抽样概述
End!
26
4 、分层抽样常比回归和比率均值有特殊的优越 性,特别是在调查变量与辅助变量为非线性关 系时,按比例分层能得到更大的得益;若分层 变量不是数值型时,分层方法仍然可以使用, 而回归和比估计方法则不能用。 5 、如果辅助变量的总体均值是已知的,则回归 和比估计可以在独立于辅助变量的 n 次抽选的 样本上进行,而在分层抽样中,样本 n 必须是 第一重样本n′的子样本。
i
(x
i 1
x)2
性质1: YˆlrD 是一个有偏估计量,其偏倚随着 样本量的增大而缩小。当地二重样本的样 ˆ y b( X ' x ) 是近似无偏 本量足够大时, Y lrD 估计量。即
ˆ )Y E (Y lrD
当n充分大时
ˆ )Y E (Y lrD
性质2 若n′和n均为简单随机样本,则估 计量的方差为
第二节 为分层的二重抽样
一、二重分层抽样概述 二、估计量及其性质
一、二重分层抽样概述
在分层抽样中,我们要求总体各层的 层权应事先已知,如果层权未知或不 能事先确定,则分层抽样在精度上的 得益可能会在很大程度上被抵消掉, 此时,选择二重分层抽样可以较好地 解决层权问题。
符号说明
:第一重样本第h层的单元数 nh :第二重样本第h层的单元数 N Wh h :总体单元第h层的权重 N :第一重样本第h层的权重 nh h
第一步:从总体的中随机抽取第一重样本,对于 第一重样本,仅观测辅助变量信息,用辅助变 量的样本均值估计其总体均值。 第二步:从第一重样本中随机抽取出第二重样本, 对于第二重样本,观测目标变量与辅助变量, 并计算样本回归系数,构造回归估计。 二重回归估计可以采用多种形式,我们这里只 涉及一元线性回归估计。
第九章(多阶抽样)
copyright©princebf,2006-2007
f2=m/M 第二阶段抽样比
copyright©princebf,2006-2007
#二阶抽样图示
总 体
样本
copyright©princebf,2006-2007
• 在上述过程中,如果次级单元又由若干三级单元组成,在抽样 时对每个被抽中的次级单元内的三级单元再进行抽样,则是三 阶抽样。更高阶的抽样以此类推。 • 如果对三级单元不再抽样,而是进行全面调查,则称为二阶整 群抽样。更高阶的多阶整群抽样以此类推。 • 可见,整群抽样可以看作是二阶抽样的特例:第一阶抽取群,
§9.2 初级单元大小相等时的二阶抽样
一、相应符号 二、总体均值的估计和性质
三、总体总量的估计和性质
四、总体比例的估计和性质
copyright©princebf,2006-2007
• 初级单元大小相等是指初级单元内包含的次级单元数目相同, 不妨设每个初级单元包含M个次级单元
• 此时,两阶抽样中的每一阶抽样都可采用简单随机抽样
1 n 2 s2 i n i 1
样本中初级单元内的方差
copyright©princebf,2006-2007
二、总体均值的估计和性质
• 按前述抽样方式(每一阶抽样都是简单随机的;第二阶抽样是 相互独立的),则有:样本按次级单元的均值是总体均值的无偏 估计。即:
ˆ 1 1 Y y yij n yi nm i 1 j 1 i 1
计量经济学第九章二重抽样
第九章二重抽样前面各章介绍的几种抽样技术中,大都需要事先了解一些关于总体的信息,例如分层抽样需要事先知道各层权重,比率估计和回归估计中需要知道总体的某些辅助信息但在一些情况下,这些资料在调查前无法预知。
这时,我们可以先从总体中抽取一个大的初始样本,从而获得总体的辅助信息,然后再从初始样本或从总体中再抽一个子样本,这种方法就是二重抽样。
本章第一节介绍二重抽样的定义、作用及其与两阶段抽样的区别,第二节介绍为分层抽样进行的二重抽样,第三节介绍为比率估计进行的二重抽样,第四节介绍为回归估计进行的二重抽样。
§9.1 引言一、定义二重抽样(double sampling),也称二相抽样或两相抽样(two-phase sampling),是指在抽样时分两步抽取样本。
一般情况下,先从总体N中抽取一个较大的样本'n,称为第一重(相)样本(the first phase sample),对之进行调查以获取总体的某些辅助信息,为下一步的抽样估计提供条件;然后进行第二重(相)抽样(the second phase sample)。
第二重抽样所抽的样本n相对较小,但是第二重抽样调查才是主调查。
一般地,第二重样本(the second phase sample)是从第一重样本中抽取的,也即第一重样本的子样本,但有时也可以从总体中独立地抽取。
由于样本是分两次抽取的,因此称做二重抽样。
例如,欲对某城市体育场馆的营业状况进行抽样调查,鉴于不同场馆功能和面积差异较大,拟采用分层抽样,但由于缺乏分层资料,故先随机抽选一个较大的样本,对该样本仅进行分层及进行层权估计,费用相对较低;然后利用第一次调查获得的分层资料,进行一次较小样本的分层抽样,对该样本进行一次正式调查。
这就是二重抽样。
显然,二重抽样方法也可以推广到多次抽取样本,然后结合起来对总体的有关标志值进行估计,这就是多重抽样或多相抽样。
本章主要讨论二重抽样。
二、二重抽样与两阶段抽样二重抽样和两阶段抽样,在名称上很容易引起混淆。
抽样调查-第9章 二重抽样
二、二重抽样与两阶段抽样的区别
1.两阶段抽样是先从总体N个单元中抽出n个样本 单元,却并不对n个样本都进行调查,而是从中再抽出 若干个二级单元进行调查。
返回
2。两阶段抽样的第二阶段抽样单元与第一阶段抽样 单元往往是不同的。而二重抽样的第二重样本往往是 第一重样本的子样本。
三、二重抽样的作用
(一)有利于筛选主调查对象 (二)节约调查费用 (三)提高抽样效率
80 60 40 20 200 2 7 15 40
2 yij j
2 j
s
400 3100 9600 45120
1.01 2.71 15.38 690.53
解
w1
根据上表可计算各层的权重:
540 0.32, w3 0.10, w4 0.04 0.54, w2 1000
第一重样本第h层方差:sh
2
nh 1 2 2 第二重样本第h层方差:sh ( y y ) hj h nh 1 j 1
二、抽样方法
第一步: 利用简单随机抽样,从总体的N个单元中随机 抽取第一重样本,样本单元数为 n ;根据已知的分层标 n 志将第一重样本分层,令 wh h , (h 1,2,, L) ,则 n 是总体层权 W 的无偏估计。 wh
L
而总体均值估计量的方差为:
1 1 2 L Wh S h2 1 V ( y stD ) ( ) S ( 1) n N n f hD h 1
返回
要在一定的费用约束下使估计方差最小化,则有
L V ( y stD ) (C c1n n c2 h f hDWh )
§9.1 引言
一、二重抽样的定义
二重抽样(double sampling),也称二相抽样,是指分 两步抽取样本。先从总体N中抽样一个较大的 样本 n ,称为第一重样本,对其进行调查以获 取总体的某些信息,为下一步的抽样估计提供 条件;然后在第一重样本中再进行第二次抽样。 这种抽样方法称为二重抽样。
抽样检验中的双重抽样方法与效果评估
抽样检验中的双重抽样方法与效果评估抽样检验是统计学中一种重要的数据分析方法,用于判断样本数据是否代表总体,并进行统计推断。
抽样检验的精确性和准确性对研究结果的可靠性起着至关重要的作用。
为了增加抽样检验的效果评估,双重抽样方法被广泛采用。
本文将探讨双重抽样方法及其在抽样检验中的效果评估。
一、双重抽样方法的概念和原理双重抽样方法指的是采用两次独立的抽样过程,通过分别对两个抽样集合进行统计分析,来对总体进行推断。
这样的双重抽样方法能够在保证数据的可靠性的同时提高推断的准确性。
在使用双重抽样方法时,第一次抽样通常是从总体中随机选择样本,这个样本称为一级样本。
然后,从一级样本中再次随机选择一部分样本,形成二级样本。
通过对一级样本和二级样本的统计分析,可以得到更加精确的估计结果。
双重抽样方法的基本原理就是通过两次独立的抽样,减小抽样误差,提高估计的准确性。
二、双重抽样方法的应用双重抽样方法被广泛应用于各个领域的统计研究中。
下面将介绍其中两个常见的应用案例。
1.医学研究中的双重抽样方法在医学研究中,为了对新药的疗效进行评估,常常采用对患者进行双重随机抽样的方法。
首先,在一级样本中随机选择一部分患者,将其分为实验组和对照组。
然后,在实验组和对照组中再次随机选择一部分患者进行观察和数据采集。
通过对数据的统计分析,可以判断新药的疗效和安全性。
2.社会调查中的双重抽样方法在社会调查中,为了保证样本的多样性和代表性,常常采用双重抽样方法。
首先,在一级样本中随机选择一部分个体,然后在这些个体中进行二级随机抽样,得到用于调查的最终样本。
通过对最终样本的数据分析,可以对总体进行推断,得出调查结果。
三、双重抽样方法的效果评估为了评估双重抽样方法的效果,需要进行有效的效果评估。
下面将介绍两种常见的双重抽样方法的效果评估方式。
1.重抽样法重抽样法是一种用于评估双重抽样效果的常用方法。
在重抽样法中,通过对已有数据进行重复随机抽样,得到同等大小的样本,然后利用这些样本进行统计分析。
第9章 二重抽样
第9章二重抽样§9.1 引言一、定义在设计和实施某些抽样调查时,需要事先掌握有关总体的一些信息。
但在许多场合下,总体的这些有关信息是事先未知的,或者不完全知道,如分层抽样的各层权重、比率估计和回归估计中的辅助信息等。
为此,人们提出了二重或多重抽样的方法,以掌握有关总体信息,然后实施抽样调查。
如何实施抽样呢?其基本做法是:对于一个大总体,先从总体中随机抽取一个较大的样本(第一重样本),由此估计有关总体的结构或辅助指标以及其他有关信息,为第二重抽样估计提供条件;然后再从第一重样本中随机抽取一个较小的样本(第二重样本),利用这第二重样本,对总体所研究变量进行抽样推断。
二重抽样(double sampling),也称二相抽样或两相抽样。
是指在抽样时分两步抽取样本。
一般来说,先从总体N中抽取一个较大的样本n’,称为第一重样本,对之进行调查以获取总体的某些辅助信息,为下一步的抽样估计提供条件;然后进行第二重抽样。
第二重抽样所抽的样本n相对小。
第二重抽样有两种方式:一是从第一重样本中抽取,也即第一重样本的子样本;二是从总体中独立抽取。
二、二重抽样与两阶段抽样三、二重抽样的作用四、二重抽样的原理§9.2 为分层的二重抽样在分层抽样中,我们要求总体各层的层权应事先已知,如果层权未知或不能事先确定,则分层抽样在精度上的得益可能会在很大程度上被抵消掉,此时,选择二重分层抽样可以较好地解决层权问题。
二重分层抽样是先在总体中随机抽取第一重样本n′,对这个样本各单元进行分层后求各层的层权,然后从第一重样本中用分层随机抽样法抽取第二重样本n,用于估计总体指标。
由于第一重简单随机抽样,第二重分层抽样,故其误差同二重的抽样都有关二、估计量及其性质(一)均值估计量(二)估计量方差∑==Lhhh stDywy1'•四、二重分层抽样样本量的分配∑=+==Lh hhD h T TW f c n n c C E C 12''1*)(§ 9.3 为比率估计的二重抽样• 一、二重抽样的比率估计量及方差 •(一)二重抽样的比率估计量(二)二重抽样比率估计的方差的平均数为第一重样本辅助变量’x xx y RD '=xyR s R s R nn s n y v RS S R n n S n y V yx x y RD yx x y RD =--+≈--+≈∧∧∧其中)2)(11(1)()2)(11(1)(22'222'2•三、二重抽样比率估计是样本量的最优分配••§ 9.4 为回归估计的二重抽样• 一、二重抽样回归估计的抽样方法• 第一,从总体中的N 个单元中随机抽取第一重样本,样本单元数为n’;获取辅助变量xi’,计算• ,估计总体均值fc c C n S R RS c RS S R S c f T x yx yx x y 21*'2222221)2()2(+=--+=∑=='1''1n i xn x X• 第二,从第一重样本中随机抽出第二重样本,样本单元数为n;观测变量yi 与辅助变量xi ,计算,•三、二重抽样回归估计是样本量的最优分配§ 9.5 连续抽样中的样本轮换及其估计 一、样本轮换的必要性b 和、x y ∑∑==---==i ini ii xyxx x x y s s b 1212)())(()('x x b y y lrD -+=的估计值为相关系数其中ρρr s r nn s n y v S n n S n y V yy lrD y y lrD 22'222'2)11(1)()11(1)(-+≈-+≈)1()1(2211*21*'2221ρρρρρ-+=+=-=c c c C f c c C n c c f T T二、样本拼配与二重回归估计的应用。
二重抽样
6.1概述 概述
6.1.1二重抽样的定义 二重抽样的定义 二重抽样(也叫二相抽样),抽样过程分两 二重抽样(也叫二相抽样),抽样过程分两 ),抽样过程分 进行: 步进行:
第一步称为第一 第一步称为第一重(相)抽样,是从总体中抽取 抽样, 一个比较大的样本,称为第一重( 比较大的样本 样本。 一个比较大的样本,称为第一重(相)样本。目 的是获取有关总体的某些辅助信息 辅助信息, 的是获取有关总体的某些辅助信息,为下一步的 第二重抽样估计提供条件。 第二重抽样估计提供条件。 第二步称为第二 抽样, 第二步称为第二重(相)抽样,是从第一重样本 中抽取的相对较小的样本,称为第二重( 较小的样本 中抽取的相对较小的样本,称为第二重(相)样 它是第一重样本的一个子样本, 本。它是第一重样本的一个子样本,对它进行的 调查是主调查。 调查是主调查。
Y
′ ystD = ∑ wh yh
h =1
L
性质: 性质:
(1)
E ( ystD ) = Y
1 1 1 2 2 1 (2)V ( ystD ) = − S + ∑ Wh S h − 1 n′ N h n′ γh
V 的一个近似无偏估计: (3) ( ystD ) 的一个近似无偏估计:
1 1 22 1 1 2 ′ v ( ystD ) = ∑ − w′h sh + − ∑ wh ( yh − ystD ) ′ nh n′ N h h nh
证明: 证明:
K (1)E( y ) = E E ( y ) = E E ′ 1 2 ∑ wh yh stD 1 2 stD h=1
二重抽样
表7-1
某银行客户的样本数据
2 2 2 (2 6.42) 0.32 (7 6.42) 0.1 ( 15 6.42) 1 1 L ' 1 1 0.54 2 ( ' ) h ( y h y stD ) ( ) 2 n N h 1 1000 800 0 . 04 ( 40 6 . 42 )
h
y h )] E ( y stD ) E1 [ E 2 ( y stD )] E1 [ E 2 ( wh
h 1
L
y h ) E1 ( y ) Y E1 ( wh
h 1
L
定理7.2
y stD 的方差为:
2 1 1 2 L Wh S h 1 V ( y stD ) ( )S ( 1) n N n f hD h 1 2 f hD 是第二重样本第h 式中,S2是总体方差;S h 是第h层的总体方差;
6.3 不等概率系统抽样
行政村编号 1
人数 134
累计人数 134
抽中代码 100
2 3
4
376 202
106
510 712
818
5
6 7 8 9 10
634
397 306 247 95 588
1452
1849 2155 2402 2497 3085
1128
2156
7.1 二重抽样
前面介绍的抽样技术中,大多需要事先了解关于总体的 信息,例如分层抽样需要事先知道各层权重,比率估计 和回归估计需要知道总体的某些辅助信息,但在有些情 况下,这些信息在调查前无法预知。这时,可以先从总 体中抽取一个大的初始样本,获得总体的辅助信息,然 后再从初始样本或总体中抽取一个子样本,这种方法就 是二重抽样。
第九章(多阶段抽样)
抽样调查
原理与方法
性质1可以推广到分多步抽样的情形,例如 对于三阶段抽样,有
Eˆ E1E2E3 ˆ
V ˆ V 1 E 2 E 3ˆ E 1 V 2 E 3ˆ E 1 E 2 V 3ˆ
抽样调查
原理与方法
第二节 初级单元大小相 等时的二阶抽样
采用 srs,从 N 中抽 n 个初级单元 采用 srs 从每个中选初级单元中抽取 m 个次级单元
M
或S
2 1
S
2 2
M
0 ,则取
。
抽样调查
原理与方法 第三节 初级单元大小不等时的二阶抽样
一、一 般 说 明
几种处理方法 * 先 分 层 ,再 抽 样 *不等概抽样
必要符号补充
N
M 0 : M 0 M i
抽样调查
原理与方法
f 2 i: f 2 i M m i i
S 2 2 i M 1 i 1 M i( Y i j Y i ) 2
C2m)
其中:
S
2
S
2 1
S
2 2
M
抽样调查
原理与方法
使上式达到极小的充要条件是
S S2
m
C1 C2m
从而 mopt 满足
mopt
S2 S
C1 C2
抽样调查
原理与方法
由上式看出,m与
S
2 2
,C
1
成正比,与
S
2 1
,C 2
成反比。
求出m后,利用(4),(5)式,即可求出n.
抽样调查
原理与方法
抽样调查
原理与方法
如果每个二级单元又由更小的三级单元组 成,那么在第二阶段抽样后,若在每个 被抽中的二级单元中再进行三级单元的 抽样,则是三阶段抽样(三阶抽样)。 同样的道理,还可以定义更高阶段抽样 。对于二阶段以上的抽样,称为多阶段 抽样(多阶抽样)。
二重抽样回归估计的抽样方法
N h :总体第h层的单元数
n n f h h :第二重样本第h层的抽样比 nh yhj :第二重样本第h层j单元的观测值
8
1 yh nh
y :第二重样本第h层样本单元的平均值
j 1 hj
nh
S 2 :总体方差
2 Sh :第h层的总体方差
:第一重样本第h层方差 n 1 2 2 :第二重样本第h层方差 sh ( y y ) hj h nh 1 j 1
二、作用
1:用于抽样中的分层和进行比估计和回归估计 2:用于筛选主调查对象(有些调查,调查对象只是 总体的一部分,且与其他单位不易区分) 3:节约调查费用(大规模的多指标调查,有时不需 要相同的样本量) 4:降低无回答偏倚(对最初的无回答再进行一次抽 样,对子样本获取数据,最后用两次样本数据进行 加权估计) 此外,还可以用于了解陌生总体的内在结构或其分 布的大致情况。
4 、分层抽样常比回归和比率均值有特殊的优越 性,特别是在调查变量与辅助变量为非线性关 系时,按比例分层能得到更大的得益;若分层 变量不是数值型时,分层方法仍然可以使用, 而回归和比估计方法则不能用。 5 、如果辅助变量的总体均值是已知的,则回归 和比估计可以在独立于辅助变量的 n 次抽选的 样本上进行,而在分层抽样中,样本 n 必须是 第一重样本n′的子样本。
第二节 为分层的二重抽样
一、二重分层抽样概述 二、估计量及其性质
一、二重分层抽样概述
在分层抽样中,我们要求总体各层的 层权应事先已知,如果层权未知或不 能事先确定,则分层抽样在精度上的 得益可能会在很大程度上被抵消掉, 此时,选择二重分层抽样可以较好地 解决层权问题。
第九章抽样与抽样估计ppt文档
2、特点 (1) 抽样调查建立在随机取样的基础上。
(2)它是由部分推断整体的一种认识方 法。
(3)抽样调查的误差可以事先计算并加以 控制。
3、抽样调查的适用范围
抽样调查方法是市场经济国家在 调查方法上的必然选择,和普查相比, 它具有准确度高、成本低、速度快、 应用面广等优点。
参数估计 二、抽样推断的内容
假设检验 三、有关抽样的基本概念
(一)总体和样本
总体:也称全及总体。指所要认识的研究对 象全体。总体单位总数用“N”表示。
样本: 也称抽样总体,是抽出的单位组成 的整体。样本单位总数用“n”表示。
(二)参数和统计量 1、针对总体计算的指标叫总体参数,也叫全及 指标。参数的值是定值
2、非概率抽样:也叫非随机抽样,是指从 研究目的出发,根据调查者的经验或判 断,从总体中有意识地抽取若干单位构 成样本。重点调查、典型调查、配额调 查等属于非随机抽样。
(六)、抽样框
1、抽样框是包括全部抽样单位的名单框架。编 制抽样框是实施抽样的基础。抽样框的好坏通常 会直接影响到抽样调查的随机性和调查的效果。 2、抽样框主要有三种形式:
以 N 1 代表N个总体单位中具 有某种特征的单位数,N 0 代表N 个
总体单位中不具有某种特征的单位
数,N=N1+N0。有 P N 1 N
从总体中随机抽出容量为n的样本,
n 具有某种特征的单位数为 ,则样本的成
数为 p n1 。
1
例如,n 某工厂生产某种电子元件,某
批产品共10000件,其中不合格品100件,
①系统误差是非随机因素引起的误差, 它系统性偏高或偏低,也称偏差。
② 随机误差也叫偶然误差。它是由偶 然性因素引起的代表性误差。它不可 避免,但可计算与控制。抽样估计中 的抽样误差,就是指这种随机误差。
二重抽样ppt
是总体层权 Wh 的一个无偏估计。 2.进行第二重抽样,是在第一重抽样中进行样本量为n的分 层随机抽样,即在属于第h层的nh '个第一重样本单元中 简单随机抽取nh个作为第二重样本单元,调查目标量Y。 易知每层的抽样比
f hD n h ' nh
本。
n
h
,对这200户个体户作了详细的调查 n 200
h 核实,取得有关数据如下。试估计该城市全年个体户的
销售总额及其抽样标准误差。
分层
第一重样本 量 n
h
第二重样本 量 n
h
样本均值 (万元) 2 7 15 40
yh
2 yhj j
s
2 h
3万元以下 3万元至10万 元以下 10万元至20万 元以下 20万元以上 合计
ˆ 销售总额 Y NystD 8000*6.42 51360 万元
估计量的方差估计: 1 1 1 1 2 v( ystD ) ( ' ) w'2 sh ( ) w'h ( yh ystD ) 2 h nh n h n N h h 0.036822 0.055239 0.092061
调查. 分层抽样的前提:总体中所有单元已按某种分层标志明确的分成若干 层,且层权已知。如果层不明确,分层抽样就无法进行。二重分层抽 样可用以处理此类问题。
7.2.1步骤:
1.用简单随机抽样在总体N个单位中抽取一个样本量为n'的 第一重样本,调查辅助变量X,根据已知的分层标志将第 一重样本中的所有单元归入不同的层,记nh '是属于第h 层的单元数(h=1,2,…,L;L是层数),则
抽样调查-第9章 二重抽样
j 1 ,2 , ,n h ;h 1 ,2 , ,L
第二重样本第h层样本单元的平均数:
总体方差:S 2
,第h层精的选完总整p体pt课方件 差:
S
2 h
yh
1 nh
nh
yhj
j1
返回 4
第一重样本第h层方差:s h 2
第二重样本第h层方差:sh2nh11jnh1(yhjyh)2
二、抽样方法
第一步: 利用简单随机抽样,从总体的N个单元中随机
1.两阶段抽样是先从总体N个单元中抽出n个样本
单元,却并不对n个样本都进行调查,而是从中再抽出
若干个二级单元进行调查。 精选完整ppt课件
返回 1
2。两阶段抽样的第二阶段抽样单元与第一阶段抽样 单元往往是不同的。而二重抽样的第二重样本往往是 第一重样本的子样本。
三、二重抽样的作用
(一)有利于筛选主调查对象 (二)节约调查费用 (三)提高抽样效率 (四)可用于研究样本轮换中的某些问题 (五)降低无回答偏倚
yh
80
2
60
7
40
15
20
40
200
y2 ij j
400 3100 9600 45120
sj
2
1.01 2.71 15.38 690.53
解 根据上表可计算各层的权重:
w 1 1 50 4 0 . 5 0 0 ,w 2 4 0 0 . 3 ,w 3 2 0 . 1 ,w 4 0 0 . 04
精选完整ppt课件
返回11
假设第一重抽样的单元平均调查费用为c 1 ,第二重 抽样第 h 层的单元平均费用为c 2 h 。忽略其他费用,则
费用函数可以表示为:
L
CT c1n c2hnh
抽样调查09
9.3初级单元大小不等时的二阶抽样(I)
• 9.3.1记号
N
记:Yiji=1,K , N,j=1,K , Mi, M0 Mi
i 1
为总体中第i个初级单元中第j个次级单元的指标值,
记:yiji=1,K , n,j=1,K , mi 为样本中第i个初级单元中第j个次级单元的指标值
f1
n N
,f2i
Yˆ HH =
1 n
n i=1
Miyi zi
Var(Yˆ HH )=
1 n
N i=1
Zi
Yi Zi
2
Y
1 n
N
M
2 i
i=1
1 f2i Zi
S22i
v(Yˆ HH )=
1
n n-1
n i=1
Miyi zi
Yˆ HH
2
(9.22) (9.23) (9.24)
9.3初级单元大小不等时的二阶抽样(I)
nm
n i=1
m
yij
j=1
1 n
n
yi
i=1
作为总体均值的估计
Y= 1
NM
N i=1
M
Yij
j=1
1 N
N
Yi
i=1
的估计,有如下性质:
1. Ey Y
2.
Var(y)= 1-f1 n
S12
1-f2 mn
S22
(9.3) (9.4)
9.2初级单元大小相等时的二阶抽样
• 9.2.2总体均值的估计及其性质
一般意义而言,两次抽样的期望和方差公式为:
1. 期望: Eˆ=E1E2ˆ
(9.5)
2.方差:
Var(ˆ)=V1 E2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
原理与方法
第九章
二 重 抽 样
抽样调查
原理与方法
第一节
概述
一 、 什 么 是 二 重 抽 样
N
n ’
n
抽样调查
原理与方法
二、作用
1. 2. 3. 4. 节约调查费用 提高抽样效率 用于时序样本 用于无回答的调整
抽样调查
原理与方法
三 、 一 般 公 式
设E 1, V 1是 对 第 一 步 求 均 值 与 方 差 ; E 2, V 2是 对 第 二 步 求 均 值 与 方 差 ;
ˆ)]E[V ( ˆ V 1[E 2( 1 2 )]
对 于 三 级 抽 样
ˆ) V{E [E ( ˆ)]} ˆ)]} ˆ)]} V( E { V [ E ( E { E [ V ( 1 2 3 1 2 3 1 2 3
抽样调查
原理与方法
第二节 分层的二重抽样
一 、 样 本 抽 选 方 法
N h 均 不 知 N h,W h N
抽 选 步 骤 第 一 步 , 抽 出 n ’, 进 行 事 后 分 层 ,
n h' N h 是 真 实 w ' W h h n ' N
的 无 偏 估 计 ;
抽样调查
原理与方法
第 二 步 , 从 n ’中 抽 取 n , 即 从 n ’h中 抽 取 n h
' h l h 1 '2 h 2
E1[V2 ( w yh )] E1[ w V ( yh )] 1 1 E1[ w s ( ' )] E1[ n nh
'2 '2 h h l ' '2 w h sh l
n'
1 ( 1)] fh
1 1 ' '2 ' ' ( 1) E1 E2 ( wh sh \ wh 固定) n fh
3万元以下 3--10万元 10--20万元 20万元以上 合计
抽样调查
原理与方法
试估计销售总额及抽样标准误差。 解:由表中资料知,
' ' ' w1' 0.54, w2 0.32, w3 0.1, w4 0.04
于是,
ystD w y 0.54* 2 0.32*7 ..... 6.42(万元)
抽样调查
原理与方法
由上表资料可计算出
ˆ 1.1384 y 1186.31, x 1042.08, R s 231543, s 153876, s yx 183578
2 y 2 x
又知
n 80, x 1080, n 13
, ,
抽样调查
原理与方法
ˆ , 1.1384 1080 1230 yRD Rx 231543 1 1 v( yRD ) ( )(1.13842 153876 13 13 80 2 1.1384 183578) 3731.09 2 v( yRD ) 2 61.08 122.16 123
ˆ ) s ( Ny ) N v ( y ˆ stD ) 2427.3245 s(Y stD
抽样调查
原理与方法
第三节 比估计的二重抽样
y yR X x
比 估 计 条 件 :
做 法 :
x' 作 在 一 重 样 本n ’中 ,仅 观 测x , 用 为 的 估 计 。 X 从n ’中 抽 取n, 得 到 二 重 样 本 的 y, x
ˆ y w' y Y hh stD
(3)
1 1 '2 2 1 1 ' ( ystD ) ( ' ) wh sh ( ) wh ( yh ystD ) 2 nh nh n' N
抽样调查
原理与方法
证明(3)式,等式右边第一项 当
w
' 固定时, 2 h
' h
E ( yh ) y ,
例: 某县共有200个村,现欲估计去年全县平均每村交售肉猪的头 数,已知肉猪交售头数与生猪年终存栏数之间有较高的相关,且
存栏头数资料容易获得。现采用二重比估计方法,先抽取80个村
为第一重样本,得到年终平均每村生猪存栏数为1080头,然后在 这80个村中又抽取13个村作为二重样本,分别统计了年终存栏头
抽样调查
原理与方法
y ˆx' y RD x ' R x 2 Sy 1 1 2 V ( y RD ) ( )( R 2 S x 2 RS yx ) n n n'
2 若总体 S y , R, S x2 , S yx 不知,可用样本值替代,计算 ( y RD )
抽样调查
原理与方法
数和肉猪交售头数。试以95.45%的概率估计该县去年平均每村交
售的肉猪头数。
抽样调查
原理与方法
样本村
1 2 3 4 5 6 7 8 9 10 11 12 13
年终生猪存栏头数(x) 全年交售肉猪头数(Y)
550 720 1500 1020 620 980 928 1200 1350 1750 670 729 1530 610 780 1600 1030 600 1050 977 1440 1570 2210 980 865 1710
' h h
ˆ Ny 8000*6.42 51360(万元) Y stD
抽样调查
原理与方法
1 1 '2 2 1 1 2 (ystD ) ( ' ) wh sh ( ) wh ' ( yh ystD ) nh nh n' N
式中所需数据都有,代入得
(y stD ) 0.092061
2 W S 1 1 1 ' 2 h h ' ( 1) E1 ( wh Sh) ( 1) ' n fh n fh
抽样调查
原理与方法
例,N=8000, n
分层 一重样本 ' nh 540 320 100 40 1000
' =1000, n=200
二重样本 nh 80 60 40 20 200 均值(万元) 方差 ' sh yh 2 7 15 40 1.01 2.71 15.38 690.53
' h
l h 1
故有
' ' V1[ E2 ( w yh )] V1 ( wh yh )
1 1 2 V1 ( y ) ( ) S n' N 2 S (1 f ' ) ' n ' n f' N
'
S 2 为总体方差
抽样调查
原理与方法
证明(3)式,等式右边第二项 当
w
'2 ' '2 2 s 有 固定时,对一重样本第 h 层方差 E ( s ) S h 1 h h ,故 h
ˆ) E [E ( ˆ)] E( 1 2 ˆ) V [E ( ˆ)] E [V ( ˆ)] V( 1 2 1 2
( 1) ( 2)
抽样调查
原理与方法
证 明 ( 2) 式
ˆ 2 2 ˆ ˆ)] V() E( ) [E( 2 ˆ2)]{E[E ( ˆ)]} E[E ( 1 2 1 2 2 ˆ2)]{E[E ( ˆ )] ˆ)]} E [ E ( V [ E ( 1 2 1 2 1 2 2 ˆ)]{E[E ( ˆ2)]E[E ( ˆ)] V[E ( } 1 2 1 2 1 2
所以均值估计的置信区间为
1230 123 (1107,1353)
n n h n h' fh,n h
二 、 估 计 方 法
第 二 重 样 本 h层 第 j个 单 元 的 观 测 值 , j= 1 ,2 ,… .n y h hj是
1 yh yhj n h
n h
抽样调查
原理与方法
y h 是 y h ' 无偏估计。
' ' V ( ystD ) V1[ E2 ( wh yh )] E1[V2 ( wh yh )] 2 Wh Sh 1 1 2 1 ( )S ( 1) n' N n ' fh