抽样调查-第8章 多阶段抽样
抽样调查第8章多阶段抽样18210
置信度为95%的置信区间为:160800±1.96×9216 在上面的方差估计式中,第一项是主要的,第二项 要小得多!
返回
(二)对总体比例的估计
如果要估计总体中具有所研究特征的二级单元数占全 体全体二级单元数的比例,则
P
1 N
N
Pi
i1
1 NM
N i1
Ai
式中,Ai 为第i个初级单元中具有所研究特征的二级单元
(1)多阶段抽样保持了整群抽样的样本比较集中、 便于调查、节约费用等优点。
(2)多阶段抽样不需要编制所有小单元的样本框。
三、抽选方法与推断原理
多阶段抽样时,每一个阶段的抽样可以相同,也 可以不同。它通常与分层抽样、整群抽样、系统抽样 结合使用。多阶段抽样时,抽样是分步进行的,因此, 讨论估计量的均值及其方差时,需要分阶段进行这要
S 2 2i
M
1 i
1
Mi j 1
(Yij
Y i )2,
s 2 2i
1 mi 1
mi
( yij
j 1
yi )2
返回
二、估计量及其性质
(一)对初级单元进行简单随机抽样
如果二阶抽样中每个阶段都采用简单随机抽样,并且 每个初级单元中二级单元的抽样是相互独立的,则对 总体总和的估计可以采用简单估计,也可以考虑采用 比率估计。
表中红字为抽中的房号。 这时,初级单元有15个,每个初级单元拥有二级单元 12个。首先将单元从1到15编号,在15单元中随机抽取 5个单元,分别是1,6,9,12,13号;然后在被抽中的 单元中,进行第二次抽样,即分别在12户居民户中随机 抽取4户。
一、符号说明
初级单元和初级单元拥有的二级单元个数:N,M 第一阶段和第二阶段抽样的样本量:n ,m
多阶段抽样方法的实施步骤
多阶段抽样方法的实施步骤1. 引言多阶段抽样方法是一种在大规模调查中常用的抽样技术,其优点是能够有效地减少调查成本和时间。
本文将介绍多阶段抽样方法的实施步骤,并详细说明每个步骤的操作流程和注意事项。
2. 步骤一:确定调查目标和研究问题在进行多阶段抽样之前,需要明确调查的目标和研究问题。
这有助于确定抽样的样本量、抽样层次和抽样规则。
•确定调查目标:明确调查的目的,例如了解人口流动情况、探索消费者购买行为等。
•确定研究问题:制定明确的研究问题,例如“什么因素影响用户选择特定品牌?”或“哪些因素导致人们离开农村?”3. 步骤二:确定抽样层次和抽样框在多阶段抽样中,需要确定抽样的层次和抽样框。
抽样层次是指调查中样本抽取的层次,而抽样框是指每个抽样层次的基本单位。
•确定抽样层次:根据调查目标和研究问题,确定需要抽样的层次。
例如,如果要了解全国各省的人口流动情况,抽样层次可以是省份和县级市。
•确定抽样框:选择合适的抽样框,即每个抽样层次的基本单位。
例如,在省份层次,可以选择各省的行政区划划分为抽样框。
4. 步骤三:确定每个抽样层次的抽样单元在多阶段抽样中,需要确定每个抽样层次的抽样单元,也称为抽样单元划分。
抽样单元是每个抽样层次中可以独立进行抽样的单位。
•确定抽样单元:根据调查目标和研究问题,确定每个抽样层次中的抽样单元。
例如,在省份层次,抽样单元可以是各省内的县级行政区划。
•确定抽样单元划分方法:选择合适的方法将抽样层次划分为抽样单元,例如随机抽取一定数量的县级行政区划。
5. 步骤四:制定抽样规则和确定样本量在多阶段抽样中,需要制定明确的抽样规则和确定所需的样本量。
抽样规则是确定每个抽样单元的抽样方式和抽样比例,样本量是根据需求确定的每个抽样单元的样本数量。
•制定抽样规则:根据调查目标和抽样层次确定抽样规则。
例如,在县级行政区划层次,可以采用等概率抽取的抽样规则。
•确定样本量:根据抽样层次、抽样单元数量和研究目的确定每个抽样单元的样本量。
《抽样技术》第八章-二阶及多阶抽样
m
Yi Yi / M ,
yi yi / m
Y Yij / NM Yi / N ,
i 1 j 1 n m i 1
N
M
N
y yij / nm yi / n
i 1 j 1 i 1 N n 2 1 1 2 2 2 S1 Yi Y , s1 yi y N 1 i 1 n 1 i 1 N M 2 1 1 N 2 S Yij Yi S 2i N M 1 i 1 j 1 N i 1 2 2 M 2 1 2 其中S 2i Yij Yi M 1 j 1 n m 2 1 s yij yi n(m 1) i 1 j 1 2 2
n
二、总体均值Y 的估计量及其性质
如果二阶抽样中的每一阶抽样都是简单随机的,且 对每个初级单元,第二阶抽样是相互独立的,则样 本按次级单元的均值 1 n m 1 n y yij yi nm i 1 j 1 n i 1
是总体均值
1 N M 1 N Y Yij Yi NM i 1 j 1 N i 1 的无偏估计,即E y Y ,且
其中Qi =1−Pi。故p是P的无偏估计,其方差为 N 1 f1 1 N 1 f2 M 2 V p PQ Pi P i i n N 1 i 1 nm N M 1 i 1 V(p)的一个无偏估计为 n n f 1 f 1 f 2 1 2 1 s2 p p p pi qi i 2 n n 1 i 1 n m 1 i 1 其中qi =1−pi。
ˆ Y 1 2 ˆ i ˆ s YHH YHH n n 1 i 1 zi ˆ M y 是Yi 的无偏估计 如果第二阶抽样是简单随机的,则 Y i i i ,而 1 2 2 ˆ V2 Yi M i V2 yi M i2 1 f 2i S 2 i mi 于是有 n M i yi 1 ˆ YHH n i 1 zi
多阶段抽样(PPT69页)
2.比率估计量 为了减小方差,可以考虑将初级单元的大小
Mi作为辅助变量,采用比率估计量对总体总 和进行估计。 对总体总和的比率估计量:
这个比率估计量是有偏的,但随着样本量的增加,其偏倚将趋于0。
• 其近似均方误差为:
• 因为 的差异一般不会很大,因此,当Mi相
差很大时,
要比无偏估计量 的方差
在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
2、对抽中的次级单元进行再抽样,提高了效率
多阶段抽样能充分发挥抽样的效率,克服了整群抽样的缺点,即 避免了对小单元过多调查造成的浪费。
• 估计量p的方差为: V(p)的无偏估计为:
类似于前面总体方差的表达形式,有:
• 【例8.2】欲调查某个新小区居民户家庭装潢聘请专业装潢 公司的比例。在15个单元中随机抽取了5个单元,在这5个 单元中分别随机抽取了4户居民并进行了调查,对这20户 调查结果如下:
样本单元 一栋A座 二栋C座 三栋C座 四栋C座
样本企业
1
60
13
2
43
39
3
58
39
4
50
7
5
57
19
置信区间:
三、对总体的比例的估计
总体中具有所研究特征的二级单元占全体二级 单元数的比例为:
式中:Ai为第i个初级单元中具有所研究特征的二级单元数。 对总体比例P的估计是:
式中:ai为第i个样本初级单元中具有所研究特征的二级单元数 。
• 性质3: 对于二阶抽样,如果两个阶段都是简单 随机抽样,则有
多阶段抽样
假设总体由N个初级单元组成,每个初级单元 又由若干个二级(次级)单元组成,若在总体 中按一定的方法抽取n个初级单元,对每个被 抽中的初级单元再抽取若干二级单元进行调查, 这种抽样被称为二阶段抽样。 如果每个二级单元又由更小的三级单元组成, 那么可以对每个被抽中的二级单元中的三级单 元再进行抽样,则整个抽样过程就是三阶段抽 样。以此类推,可以定义更高阶的多阶段抽样。
1 N s ( yi y ) 2 为样本初级单元间的方差。 n 1 i 1
2 1
n m 1 s ( yij yi ) 2 为样本初级单元内的方差。 n(m 1) i 1 j 1 2 2
1 m yi yij m j 1
(一)总体均值的估计
如果采用简单随机抽样的方法,第一阶段抽出n个初级单 元,第二阶段从每个抽中的单元中抽出m个次级单元,其 中每个初级单元都含有M个次级单元,且对每个初级单元, 第二阶段抽样都是相互独立的,则样本按次级单元的均 值 是总体均值 的无偏估计,即 Y y
总体中具有某种特征的次级单元对总体中所有次 级单元数比例P的无偏估计量 p 的方差V ( p)为
N 1 f1 1 N 1 f2 M 2 V ( p) ( Pi P) PQ i i n N 1 i 1 nm N ( M 1) i 1
V ( p) 的一个无偏估计为
2 2
初级单元大小相等 时的二阶段抽样
符号说明
设总体划分为N个初级单元,每个初级单元中含有M个次级单元。
Yij 为总体第i个初级单元中第j个次级单元的指标值。
Yi Yij 为总体第i个初级单元的指标和。
j 1
M
1 Yi M
第8章 抽样设计
又叫多重抽样,先抽取一有很多单位的大样本,收集 基本信息,然后在这个大样本中抽一个子样本,收集 更详细的信息。第一相收集的数据能够用于分层及筛 选信息,同时也可以用来提高估计的效率。 适用于抽样框缺乏辅助信息,而想对总体进行分层或 筛选部分总体的情况。如:养牛场信息调查。 适用于预算不足,或工作量太大,或调查内容中项目 数据收集成本差异太大。如:健康调查。
14
抽样框的评估
1.抽样框的可能缺陷
不完全覆盖(如新注册成立的公司) 过涵盖(如破产注销的公司) 重复 分类错误
15
2.合格抽样框的标准
关联性:抽样框与目标总体对应的程度和据此与目标 总体的个体接触难易程度的一种度量。 精确性:涵盖误差、分类误差、联系资料。 时效性:抽样框的更新日期与调查标准日期的接近程 度来计量。 费用大小:衡量建立抽样框花费的总费用;并与本次 调查的总费用进行比较。
39
缺点:
注册会计师的审计PPS抽样例子
40
6.其他概率抽样方法
1)多阶段抽样
两个或以上连续阶段抽取样本的过程。第一阶段抽取的单位 成为初级单位,第二阶段抽取的单位称为次级抽样单位,以 此类推。 例如:第一阶段:地理区域,第二阶段:小区内住所; 例如:第一阶段:时间单位,第二阶段:乘客;若更复杂则 第二阶段:达到的客机,第三级单位:飞机上实际座位。
3.分层抽样
又叫分类随机抽样,指将调查总体中的所有单位按照 一定的属性或特征分为不相重叠的若干层次(或类 别),然后每一个层次中进行简单随机抽样或等距抽 样。 对总体分层的标志为总体的某种重要属性或特征。 分层的目的是使样本在各层、类中分布均匀,具有更 好代表性,因此层间要差别明显,层内应保持一致性。
第八章(多阶段抽样)
E1[
S22i ]
n
S12
1 f2 m
S22
抽样调查
原理与方法
所以S12 的无偏估计为
Sˆ12
s12
1
f2
m
s22
将(2)、(3)式结合,得到
(y)
1 f1 n
s12
f1(1 f nm
2
)
s22
(3)
抽样调查
原理与方法
类似的,可以构造三阶抽样 y 的估计方差
( y) 1 f1
抽样过程
前二阶采用PPS,最后一阶按等概率抽取最终单元,且各阶 段样本量对不同单元都等于常数,则所得样本是自加权的。 此时有:
Zi
Mi M0
, Zij
Kij Mi
, Zij
1 Kij
抽样调查
原理与方法
N
N Mi
M 0 Mi
Kij
Yˆ M0 n nmk
m
k
抽样调查
原理与方法
第八 章 多阶段抽样
抽样调查
原理与方法
第一节 概述
一.什么是多阶段抽样
分多个阶段抽到最终接受调查的样本。 初级单元(PSU)----Primary Sampling Unit 二级单元 (SSU)----Second-stage Sampling Unit 三级单元(TSU)----Third-stage Sampling Unit 最终单元 (SSU)----Ultimate Sampling Unit
在 PPS 抽样中
Zi
Mi M0
,代入上式,得
YˆPPS
M0 n
统计学第八章 抽样推断
②
和P的使用及使用条件
(1)σ2取最大值;(2)P取接近于0.5的值
(3)可以用样本 s或2 代p替;(4)可以用估计值或实验值代替。
计算例题:
在10000只电池中,随机抽检1%的产品进行检查,检查结果如下:
电流强度 (安培) 4-4.5 4.5-5 5-5.5 5.5-6 6-6.5 6.5-7
2
f
P 2N 0 1 P 2 N1
f
N
P2N0 1 P2 N1 P2Q 1 P2 P
N
N
P2Q Q2P PQP Q PQ P1 P
例(1):已知某产品的合格率为95%,则其标准差为:
0.951 0.95 21.79%.
2、样本指标(统计量)
根据样本总体各单位的数量标志值或属性计算所得的指 标,称为样本指标。样本指标通常包括:
统计指标 抽样平均数 抽样成数 抽样平均数的标准差 抽样成数的标准差 抽样平均数的方差
抽样成数的方差
未分组资料
x x n
p n1 n
sx
xx 2
n
分组资料
x xf f
sx
x
2
x
f
f
sP p(1p)
s2
2
xx
x
n
sP2 p(1 p)
s2
2
xx f
x
f
四、抽样方法(P151)
(二)抽样极限误差的意义
(三)抽样极限误差的计算
平均数的抽样极限误差
Δx
t
μ x
成数的抽样极限误差
Δp
t
μ p
正态分布图示
68.27%
95.45%
99.73%
第8-9章-多阶段抽样和二重抽样
ˆ ˆ E E E E
2
2
1
2
E 2 E E 2 V E ˆ ˆ E1 2 ˆ 1 2 1 2
E 2 E E 2 ˆ ˆ V1 E2 E1 2 ˆ 1 2 ˆ ˆ V1 E2 E1 V2
2 S2 V ( y ) S12 m
2 当n=1时, V1 (Yi ) S1
这时, 若以n个
yi 的均值 y 推断 Y
,其方差为
2 2 S1 S2 V ( y) n nm
再考虑fpc,则(1)式成立。
V y 的无偏估计为:
证明:
2 1
E (s ) S
2 2
1 f1 2 f1 1 f 2 2 v y s1 s2 n nm
1 1 n 1 1 E1 M iYi M n i 1 MN
M iYi Y i 1
N
估计量的方差为:
1 f1 M i 1 V y M Yi Y nNM 2 nN i 1 i 1
N N
二.按不等概抽初级单元
1.按PPS抽取初级单元 N 第i个单元被选中概率 Z i ,( Z i 1 ) i 1 以总量估计为例,利用Hansen-Hurwitz估计量 ˆ Y的估计: 1 n Y 1 n M y
ˆ YHH
z n
i 1
i
i
n
i 1
i
i
zi
ˆ 可以证明 YHH是Y的无偏估计
抽样方法-多段抽样
多段抽样
定义
• 多段抽样(多级抽样或分段抽样),是按 抽样元素的隶属关系,把抽样过程分为几 个阶段抽样。
具体做法
• :(1)先将调查总体各单位按一定标志分成若干集 体,作为抽样的第一级单位。然后将第一级单位 又分成若干小的集体,作为抽样的第二级单位。 依此类推,还可分为第三级、第四级单位。 • (2)依照随机原则,先在第一级单位中抽出若干 单位作为第一级样本,然后再在第一级样本中抽 出第二级样本,依此类推,还可抽出第三级样本、 第四级样本。调查对象至第二级样本者,为两段 随机抽样;至第三级、第四级样本者,为三段或 四段随机抽样。
关于如何确定每一级别抽样的的单 位数目,主要考虑的因素
• 1.各个抽样阶段中的子总体同性质程度。 • 2.各层子总体的人数。 • 3.研究者的所拥有人力和物力。
关于多段抽样的误差
• 由于多段抽样需要分 阶段,而每阶段抽样 都会产生误差,所以 所分的阶段越多,则 这种抽样方法误差越 大,这是它的主要不 足之处。 • 减少误差的方法:相 对增加开头阶段的样 本数而适当减少最后 阶段的样本数。
需要说明的注意点
• 在每个阶段的抽样中,都要采取简单随机 简单随机 抽样或等距抽样或分层抽样的方法进行。 抽样 • 要在类别与个体之间保持平衡(保持适当 比例)
举例说明
• 为了了解河南大学大一新生上半学期学习与生活 状况,需要从全校大一新生这一总体中抽取样本 进行访谈。我们可以把抽样过程分为几个阶段。 • 1.确定抽样单位 ,我们可以根据学校的情况确定 四个阶段,确定各学院作为第一级单位,专业作 为第二级单位,班级为第三级单位。学生作为第 四级单位。然后,采取不同抽样方法,分四段逐 步抽取样本。 • 2.以院为单位抽样,从新老区中随机抽一部分学 院。然后在抽中的学院中,以专业为抽样单位, 从中在抽取部分专业。接着由专业抽班级,最后 由班级抽学生。
多阶段抽样-详解
多阶段抽样-详解多级抽样(multi-stage sampling)、多阶段抽样(multi-level. sampling)、套抽样(cascade sampling 或nested sampling)目录• 1 什么是多阶段抽样• 2 多阶段抽样的应用• 3 关于多阶段抽样的具体描述• 4 多阶抽样与分层抽样和整群抽样的关系• 5 多阶段抽样的特征什么是多阶段抽样多阶段抽样,也称为多级抽样、多阶抽样、套抽样,是指在抽取样本时,分为两个及两个以上的阶段从总体中抽取样本的一种抽样调查方法。
多阶段抽样的应用当我们面对的总体单元数很庞大,而且分布范围很广时,如果使用前面所学习的单阶抽样方法,不仅工作量大,而且在精度上很难把握,此时如果改用多阶段抽样方法,就会避免上述困难,从而达到理想的抽样效果。
多阶段抽样具体操作过程是:第一阶段,将总体分为若干个一级抽样单位,从中抽选若干个一级抽样单位入样;第二阶段,将入样的每个一级单位分成若干个二级抽样单位,从入样的每个一级单位中各抽选若干个二级抽样单位入样……,依此类推,直到获得最终样本。
关于多阶段抽样的具体描述如果我们面对的一阶单元内总体基本单元数相当大,作全面的调查就会比较困难,或者一阶单元内各二阶单元可以给出相近的结果,作全面的调查又无必要。
此时从费用和抽样估计效率考虑,便可以从总体中随机抽取一部分一阶单元,然后再从被抽中的一阶单元内,随机抽取部分二阶单元并对他们作全面调查,我们把这种抽样技术称为两阶抽样。
如果在被抽中的二阶单元中,再抽取部分三阶单元组成样本,并对抽中的三阶单元进行全面的调查,这就是三阶抽样。
类似地,可以定义四阶抽样或更高阶的抽样,通常将两阶以上的抽样称为多阶段抽样。
需要指出的是,多阶段抽样中,各阶可以采用不同的抽样方法,也可采用同一种抽样方法,要视具体情况和要求而定。
在两阶抽样中,总体各一阶单元所包含的二阶单元数,有相等和不相等的两种情况。
2012年统计学第8章抽样调查理论与方法
8-26
一、估计总体均值时样本容量的确定
重复抽样时
1. 估计总体均值时样本容量n为 允许误差
n x
(z 2 )2 2
2
x
其中: x
z 2
n
2. 可见,样本容量
✓ 与总体方差成正比 ✓ 与允许误差成反比 ✓ 与置信度成正比
《统计学》第8章抽样调查理论与方法
8-27
不重复抽样时:
n x
NZ2 / 2 2
X
1 N
N i 1
Xi
N
X Xi N X
i 1
总体比例 总体方差 标准差
P N1 ,Q N0 N N1 1 P N NN
2
1 N
N
(Xi X )2
i 1
1 N
N
( Xi X )2
i 1
《统计学》第8章抽样调查理论与方法
8-9
统计量:是根据样本的n个单元的变量值计 算出来一个量,也叫估计量
解:Q N 15000 n 150
p 147 98% 150
p
p(1 p) n
0.98 (1 0.98) 1.14% 150
若按不重复抽样方式:
p
p(1 p) (1 n ) 0.98 (1 0.98) (1 150 ) 1.1374%
n
N
150
15000
《统计学》第8章抽样调查理论与方法
8-24
8.5.1影响样本容量确定的主要因素
总体被研究标志的变异程度 调查者对推断精确度的要求 抽样调查的方式和方法 人力、物力和财力的允许条件
《统计学》第8章抽样调查理论与方法
8-25
8.5.2 样本容量的确定
一、估计总体均值时样本容量的确定 二、估计总体比率时样本容量的确定
抽样调查-第8节多阶段抽样
1 1
性质1可以推广到多阶段抽样的情形,例如
对于三阶段抽样,有
E ( ) E1 E2 E3 ( ) V ( ) V1[ E2 E3 ( )] E1{V2 [ E3 ( )]} E1 E2 [V3 ( )]
N n 1 1 按二级单元的平均值: Y Y i , y y i N i 1 n i 1 N 1 2 2 ( Y Y ) , 初级单元间的方差: S1 i N 1 i 1
1 n 2 s ( y y ) i n 1 i 1
2 1
返回
N M 1 2 S ( Y Y ) i ij N ( M 1) i 1 j 1 初级单元内的方差: 2 2 n m 1 2 s ( yij y i ) n(m 1) i 1 j 1 2 2
n
第i个初级单元二级单元间的方差:
mi 1 2 2 1 2 2 s ( y y ) S 2i (Yij Y i ) , 2i ij i mi 1 j 1 M i 1 j 1 Mi
号
9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12 返回
式中,
Qi 1 Pi ; qi 1 pi.
返回
【例8.2】 欲调查某个新小区居民家庭装潢聘请装潢
35第8章抽样调查理论与方法
《统计学》第8章抽样调查理论与方法
8-11
概率抽样
(probability sampling)
又称随机抽样,是指依据随机原则,按照某种事 先设计的程序,从总体中抽取部分单元的抽样方 法
特点
✓ 按一定的概率以随机原则抽取样本
抽取样本时使每个单位都有一定的机会(概率)被 抽中
“随机”不等于“随便” “随机”不等于“等概率” ✓ 用样本指标数值去推断总体的指标数值
✓ 抽样调查会产生抽样误差,这个误差可以计算,并且 可以加以控制
2020/3/25
《统计学》第8章抽样调查理论与方法
8-12
概率抽样 (probability sampling)
概率抽样被视为狭义的抽样调查,在实践中被广 泛加以采用,通常所谓的抽样调查,均指概率抽 样调查。
概率抽样有多种形式:简单随机抽样、分层抽样、 系统抽样、整群抽样等。
2020/3/25
《统计学》第8章抽样调查理论与方法
8-6
便利抽样
是根据调查者的方便与否来抽取样本的一种非概 率抽样方法。典型的形式是“拦截式”调查。调 查过程中由调查员依据方便的原则,自行确定入 抽样本的单位
✓调查员在街头、公园、商店等公共场所进行拦 截调查
✓厂家在出售产品柜台前对路过顾客进行的调查
8-15
分层抽样
(stratified sampling)
一般选择“平均型” 、“众数型”、“特殊型” 单元作为样本
样本量小及样本不易分门别类挑选时有其较大的优 越性
由于其估计精度严重依赖于研究者对调查对象的了 解程度、判断水平和对结果的解释情况,所以,一 般不轻易地用于对总体进行数量方面的判断
2020/3/25
《统计学》第8章抽样调查理论与方法
第8章抽样设计
28
第8章抽样设计
例子
29
第8章抽样设计
2)纽曼分层抽样
➢ 不是简单按照各层单位数占总体单位数的比例分配样本数量,而 是结合考虑其他因素调整各层的样本单位数,如重要性、差异性 等。
➢ 理由:①照顾比例小的层或类;②增加异质性较大的层或类的单 位数;③增加重要的层或类的样本单位。
ni n
NiSi NiSi
8
第8章抽样设计
程序4:确定样本量
➢ 样本量指包含在样本中的个体数目。确定样本量需要 考虑一系列定性和定量的因素
➢ 定性因素:决策重要性、研究性质、变量数目、分析 的性质、发生率、完成率及资源约束
➢ 定量因素:概率抽样方法
9
第8章抽样设计
程序5:执行抽样过程
➢ 抽样过程的执行要求详细指定关于总体、抽样 框架、抽样单位、抽样方法及样本量的抽样设 计决策如何履行。比如抽样单位是家庭,就需 要对家庭有一个操作化定义。
缺点:
➢ 抽样框单元辅助信息; ➢ 费用高,复杂; ➢ 如果调查变量与分层变量不相关,统计效率可能比简单随
机抽样更低; ➢ 估计值计算比简单随机抽样和系统抽样稍复杂。
34
第8章抽样设计
4.整群抽样
➢ 指首先将调查总体区分为若干群,然后采用简单随机 抽样方法抽出一部分群作为样本,最后对这些样本群
3
第8章抽样设计
2、相对劣势
(1)不支持小区域估计 (2)不支持稀少个体的特征估计 (3)调查误差 (4)其他考虑
4
第8章抽样设计
抽样设计的程序
5
第8章抽样设计
程序1:定义目标总体
(注意跟调查总体的区别)
定义目标总体的四个因素:
➢ 总体中个体的类型。个人、家庭还是企业单位; ➢ 个体的特征。包括人口统计特征、行为甚至心理特征; ➢ 个体地理位置。即区域范围; ➢ 调查的标准时点或时期。
抽样调查多阶段抽样
抽样调查多阶段抽样引言抽样调查是一种重要的数据收集方法,在统计学和社会科学研究中广泛应用。
为了保证调查结果的准确性和可靠性,研究人员常常采用多阶段抽样方法进行抽样调查。
本文将介绍什么是多阶段抽样以及多阶段抽样的优点和具体步骤。
什么是多阶段抽样多阶段抽样是一种分层抽样的方法,适用于大规模人口或区域的调查。
它的主要特点是将调查样本分为多个阶段,依次进行抽样。
每个阶段的抽样单元在上一个阶段抽样单元的基础上进行抽样,从而形成一个多级结构。
多阶段抽样的优点多阶段抽样相对于简单随机抽样和分层抽样来说具有一些优点。
1.经济高效:多阶段抽样可以大大降低抽样调查的成本。
由于每个阶段只需抽取一部分样本,相比于全面调查或者单一阶段的抽样,多阶段抽样可以更好地平衡调查的精确性和资源的限制。
2.样本多样性:多阶段抽样可以保证样本的多样性。
通过每个阶段的抽样,可以充分考虑各种调查单元的特点,并确保样本的代表性和广泛性,提高调查结果的可靠性。
3.减小抽样误差:多阶段抽样可以减小抽样误差。
将抽样过程分为多个阶段可以对误差进行控制和修正,从而提高样本的准确性。
多阶段抽样的步骤多阶段抽样通常包括以下几个步骤:第一阶段:区域选择在多阶段抽样中,首先需要选择适当的调查区域,通常是将整个调查范围划分为若干个地理区域,如省、市或县。
这样可以将调查范围分层,便于后续的抽样工作。
第二阶段:群体选择在第一阶段中确定了调查区域后,需要在每个调查区域内选择具体的调查群体。
调查群体可以是人口群体,也可以是其他特定群体,如企业或学校。
第三阶段:单元选择在第二阶段确定了调查群体后,需要在每个调查群体中进一步选择调查单元。
调查单元可以是个人、家庭或其他固定单位。
第四阶段:样本选择在确定了调查单元后,最后一步是从每个调查群体中选择样本。
可以根据每个调查群体的特点和规模,使用合适的抽样方法进行样本选择。
总结抽样调查是进行数据收集的重要方法,多阶段抽样是其中一种常用的抽样方法。
社会调查方法多阶段抽样-PPT精选文档
图3-4 五种概率抽样方法比较图
简单随机抽样
系统抽样
分层抽样(不按比例分层)
分层抽样(按比例分层)
整群抽样
多阶段抽样
举例说明
例3-5:某地有2.4万名教师,他们分布在全市10个区的200所学校 里,现在要抽取一个由1200名教师组成的样本,按照三级抽样 的方法,有以下几种抽样方案(见表3-5): ------出自于《社会调查方法》赵淑兰主编 P59
表3-5 某地教师样本抽取方案
不难发现,这5种抽样方案中,方案2的精确性是最高的,因为它在前两个阶段抽取的 子样本的数量最多,抽样的范围最广;方案5的精确性最低,也是最简便易行的,因为其在 第一个阶段就限定了抽样的范围在一个区内进行。
任务三 抽样方案的制定
(五)多 阶 段 抽 样
定 义
多阶段抽样是一种分阶段从调查对象的总体中抽取样本 进行调查的方法。 • 多阶段抽样首先要将总体单位按照一定的标准划分为若 干群体,作为抽样的第一级单位;再将第一级单位分为若 干小的群体,作为抽样的第二级单位;以此内推,可根据 需要分为第三级或第四级单位。然后,按照随机原则从第 一级单位中随机抽取若干单位作为第一级单位样本,再从 第一级单位样本中随机抽取若干单位作为第二级单位样本, 以此类推,直至获得所需要的样本。 •
夯实基础
• 总体(population)总体一般与构成它的元素共同来定义, 总体就是构成它的所有元素的集合,而元素是构成总体的 最基本单位。社会调查中,我们通常用N表示。 • 样本(sample)样本就是按照一定的方式从总体中抽取出 来的那一部分元素的集合。用n来表示。 • 抽样框(Sampling Frame)抽样框也称抽样范围,是一 次直接抽样的总体中所有抽样单位的名单。
社会调查方法多阶段抽样
每个区抽20所学校 每所学校抽6名教师 每个区抽12所学校 每所学校抽20名教师 每个区抽10所学校 每所学校抽40名教师
方案5
从10个区中抽1个区
每个区抽12所学校 每所学校抽100名教师
不难发现,这5种抽样方案中,方案2的精确性是最高的,因为它在前两个阶段抽取的 子样本的数量最多,抽样的范围最广;方案5的精确性最低,也是最简便易行的,因为其在 第一个阶段就限定了抽样的范围在一个区内进行。
然后按照随机原则从第一级单位中随机抽取若干单位作为第一级单位样本再从第一级单位样本中随机抽取若干单位作为第二级单位样本以此类推直至获得所需要的样本
任务三 抽样方案的制定
(五)多 阶 段 抽 样
定 义
多阶段抽样是一种分阶段从调查对象的总体中抽取样本 进行调查的方法。 • 多阶段抽样首先要将总体单位按照一定的标准划分为若 干群体,作为抽样的第一级单位;再将第一级单位分为若 干小的群体,作为抽样的第二级单位;以此内推,可根据 需要分为第三级或第四级单位。然后,按照随机原则从第 一级单位中随机抽取若干单位作为第一级单位样本,再从 第一级单位样本中随机抽取若干单位作为第二级单位样本, 以此类推,直至获得所需要的样本。 •
图3-4 五种概率抽样方法比较图
简单随机抽样
系统抽样
分层抽样(不按比例分层)
分层抽样(按比例分层)
ቤተ መጻሕፍቲ ባይዱ
整群抽样
多阶段抽样
夯实基础
• 总体(population)总体一般与构成它的元素共同来定义, 总体就是构成它的所有元素的集合,而元素是构成总体的 最基本单位。社会调查中,我们通常用N表示。 • 样本(sample)样本就是按照一定的方式从总体中抽取出 来的那一部分元素的集合。用n来表示。 • 抽样框(Sampling Frame)抽样框也称抽样范围,是一 次直接抽样的总体中所有抽样单位的名单。
抽样调查-多阶段抽样
抽样调查-多阶段抽样1. 简介抽样调查是社会调查中常用的一种调查方法,其目的是从总体中选择一部分样本进行调查,以推断整个总体的特征。
多阶段抽样是一种常见的抽样方法之一,它在大规模调查中被广泛应用。
本文将介绍抽样调查的基本概念和多阶段抽样的原理及步骤。
2. 抽样调查的基本概念抽样调查是指从总体中选择一部分样本进行调查,以推断总体特征的一种调查方法。
总体是指某一特定领域内的所有个体或事物,例如人口、企业等。
样本是从总体中选取的一部分个体或事物,通过对样本的调查和分析,可以得到总体的各种特征。
抽样调查的优点包括成本低、时间短、效率高等。
相比于对整个总体进行调查,只需要对样本进行调查可以节省大量的时间和精力。
另外,通过合理选择样本,可以有效推断总体的特征,从而减少调查的成本。
3. 多阶段抽样的原理多阶段抽样是在大规模调查中常用的一种抽样方法,它通常由多个阶段组成,每个阶段都是一个独立的抽样过程。
多阶段抽样的原理是将总体依次划分成多个层次,在每个层次中进行抽样,从而得到最终的样本。
多阶段抽样的好处在于可以逐步缩小样本的规模,节省调查资源。
在每个阶段中,可以根据需要选择合适的抽样方法,以保证样本具有代表性,进而得到准确的推断结果。
同时,多阶段抽样还可以减少非抽样误差,提高调查的可靠性。
4. 多阶段抽样的步骤多阶段抽样的步骤通常包括总体划分、选择抽样单元、制定抽样方案、抽取样本和调查分析等。
4.1 总体划分在进行多阶段抽样之前,首先需要对总体进行划分。
总体划分可以根据不同的特征进行,例如地理位置、人口密度等。
将总体划分为若干个层次,每个层次包含一定数量的抽样单元。
4.2 选择抽样单元在每个层次中,需要选择抽样单元。
抽样单元可以是个人、家庭、企业等,根据具体调查的目的和要求进行选择。
4.3 制定抽样方案根据总体划分和抽样单元的选择,制定具体的抽样方案。
抽样方案包括确定每个阶段中的抽样比例、样本规模等。
4.4 抽取样本根据抽样方案,在每个阶段中抽取样本。
抽样调查8
n N 时,二阶抽样就化为按比例分配的分层随机抽样,且其层权相等,此时二阶抽样估计
量的方差及其估计也就转变为分层随机抽样估计量的方差及其估计。所以,一般地二阶抽样 也可看作是把一阶单元作为层的不完全的分层抽样。
二、分层二阶抽样
• 设总体分成L层,第h层有Nh个一阶单元, 每个一阶单元均含Mh个二阶单元。在第h 层随机抽了nh个一阶单元,又从每个被抽 中的一阶单元中随机抽了mh个二阶单元。 则的估计量为 L y st Wh yh
方差估计量为
N 2 (1 f1 ) ˆ ˆ V (YR ) n ˆ 2 M ( y i YR )
n i 1 2 i
n 1
N n
2 M i2 (1 f 2i ) s 2i mi i 1 n
ˆ 由此易得关于 YR 估计量的相应结果
ˆ 2 ˆ V (YR ) V (YR ) / M 0
1 Yij K
y
u 1 M
K
iju K
1 Yi MK
N
y
j 1 u 1
iju
1 Y yiju NMK i 1 j 1 u 1
M
K
1 2 S (Yi Y ) N 1 i 1
2 1
N
1 2 S (Yi Yij ) N ( M 1) i 1 j 1
第八章 多阶抽样
第一节 多阶抽样概述
第二节 一阶单元等大小的两阶抽样
第三节 一阶单元不等大小的两阶抽样
返回
第一节 多阶抽样概述 • 一、多阶抽样的基本概念 • 根据实际情况将整个抽样程序分成若干个阶段,一个阶段 一个阶段地进行抽样,以完成整个抽样过程,这种抽样就 叫多阶抽样。从总体中随机抽取一部分一阶单元,然后再 从被抽中的一阶单元内,随机抽取部分二阶单元并对它们 进行全面调查,我们把这种抽样技术称为两阶抽样。它是 由印度统计学家马哈拉诺比斯首先提出来的。 • 二、多阶抽样的特点 • (一)便于组织抽样 (二)抽样方式灵活,有利于提高抽样的 估计效率(三)多阶段抽样对基本调查单元的抽选不是一步 到位的(四)多阶段抽样实质上是分层抽样与整群抽样的有 机结合(五)多阶抽样在抽样时并不需要二阶或更低阶单元 的抽样框 (六)多阶抽样还可用于“散料”的抽样,即散料 抽样
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表中红字为抽中的房号。 这时,初级单元有15个,每个初级单元拥有二级单元 12个。首先将单元从1到15编号,在15单元中随机抽取 5个单元,分别是1,6,9,12,13号;然后在被抽中的 单元中,进行第二次抽样,即分别在12户居民户中随机 抽取4户。
一、符号说明
初级单元和初级单元拥有的二级单元个数:N,M 第一阶段和第二阶段抽样的样本量:n ,m
用到下面的性质。
返回
性质1 对于两阶段抽样,有
E( ) E1E2 ( )
V ( ) V1[E2 ( )] E1[V2 ( )]
式中,E2,V2 为在固定初级单元时对第二阶抽样求均 值和方差; E1,V1 为对第一阶抽样求均值和方差。
性质1可以推广到多阶段抽样的情形,例如 对于三阶段抽样,有
§8.1 引 言
前面提到的整群抽样虽然 有很多优点,但是由于群内单 元通常具有相似性(表现为群 内相关系数大于零)。尤其是 当群比较大时,人们自然会想 到没有必要对群内所有单元都 进行调查,而只要对群内单元 进行再抽样,对被抽中的单元 进行调查,这就是常用的多阶 段抽样。
返回
一、多阶段抽样的定义
先在总体单元(初级单元)中抽出样本单 元,并不对这个样本单元中的所有下一级单元 (二级单元)都进行调查,而是在其中再抽出若 干个二级单元并进行调查。
返回
二、估计量及其性质
(一)总体均值的估计
性质2 对于初级单元大小相等的二阶抽样,如果两个阶
段都是简单随机抽样,且对每个初级单元,第二阶抽样
是相互独立进行的,则对总体均值 Y 的无偏估计为:
Y
y
1 n
n i1
yi
1n nm i1
m j 1
yij
其方差为:
V
(
y)
1 n
f1
返回
第一阶和第二阶的抽样比:
f1
n N
;
f2i
mi Mi
二级单元个数:
N
n
M 0 M i , m0 mi
i 1
i 1
N
指标总和: Y
Mi
Yij , y
n
mi
yij
i1 j1
i1 j1
Mi
mi
第i个初级单元指标总和: Yi Yij , yi yij
N n
n i1
M
2 i
(1
mi
f2i )s22i
式中,
Yu
1
n
Yi
n i1
返回
2.比率估计量
由于初级单元的大小
M
不同,往往
i
造成初级单元的观测值
Yi
差异很大,使得估计量方差
V (Y u )的第一项很大,从而估计量的方差也就变得很大。
这时,可以考虑将初级单元的大小 M i 作为辅助变量,
如果二阶抽样中每个阶段都采用简单随机抽样,并且 每个初级单元中二级单元的抽样是相互独立的,则对 总体总和的估计可以采用简单估计,也可以考虑采用 比率估计。
1.简单估计量 对总体总和的简单估计为:
Yu
N n
n i1
Mi
yi
N n
n
Yi
i1
根据性质1,不仅可以证明这个估计量是无偏的,并
n i1
m
( yij
j 1
yi )2
由
S
2 2
的表达式可知,若记
S 2 2i
1 M 1
M
(Yij
j 1
Y i )2
则有
S22
1 N
N
S2 2i j 1
即
S 22 是
S2 2i
的平均值。同理有
s 2 2i
1 m 1
m
( yij
j 1
yi )2
s22
1 n
n
s2 2i j 1
p)2
f1(1 f2 ) n2 (m 1)
n
i1
pi qi
式中, Qi 1 Pi ; qi 1 pi.
返回
【例8.2】 欲调查某个新小区居民家庭装潢聘请装潢
公司的比例。我们在15个单元中随机抽取了5个单元,在 这5个单元分别随机抽取了4户居民进行调查,对这20户 的调查结果如下表:
采用比率估计量对总体总和进行估计。
样本企业
第一日
第二日
第三日
1
57
59
64
2
38
41
50
3
51
60
63
4
48
53
49
5
62
55
54
要求根据这些数据推算不100家企业该指标的总量,并
给出估计的95%置信区间。
返回
解 将企业作为初级单元,将每一天看着二级单元。
调查月内拥有30天(即拥有30个二级单元)。 首先在初级单元中抽取一个n=5的简单随机样本再
N i1
(Y i
Y )2 ,
s12
1 n 1
n i1
( yi
y)2,
第i个初级单元二级单元间的方差:
S 2 2i
1 Mi
Mi
1
(Yij
j 1
Y i )2,
s2 2i
1 mi 1
mi
( yij
j 1
yi )2
返回
二、估计量及其性质
(一)对初级单元进行简单随机抽样
S12
1 f2 nm
S
2 2
V
(
y)的无偏估计为:v(
y)
1 n
f1
s12
1 f2 nm
s22
返回
【例8.1】欲调查4月份100家企业的某项指标,首先
从100家企业中抽取了一个有板有5家样本企业的简单随 机样本,调查人员对5家企业分别在调查月内随机抽取3 天作为调查日,要求样本企业只填写这3天的流水帐。 调查的结果如下。
对每个样本的二级单元分别独立抽取一个m=3的简单 随机样本
由题意,N=100,M=30,n=5, m=3
f1
n N
5 100
0.05,
f2
m M
3 30
0.10
首先计算样本初级单元的均值 yi 、方差 s22i:
返回
样本企业
yi
s2 2i
1
60
13
2
43
39
3
58
39
4
50
7
5
57
19
于是得到:
y
1 n
n
i1
yi
1 (60 5
43
58
50 57)
53.6
s12
1 n 1
n i1
( yi
y)2
49.3
s22
1 n
n i1
s2 2i
23.4
返回
v( y) 1 0.05 49.3 0.05(1 0.10) 23.4 9.4372
f2
4 12
因此,
p
1
nm
n i1
ai
1 (2 11 0 1) 54
0.25
其方差的估计为:
v(
p)
1 f1 n(n 1)
n
(
i1
pi
p)2
f1(1 f2 ) n2 (m 1)
n
i1
pi qi
0.00657
s( p) v( p) 0.081
P的置信区间为: 0.25 1.96 0.081
E( ) E1E2E3( )
V ( ) V1[E2E3( )] E1{V2[E3( )]} E1E2[V3( )]
返回
§8.2 初级单元大小相等的二阶抽样
第一阶段在总体N个初级单元中,以简单随机 抽样抽取n个初级单元,第二阶段在被抽中的初级 单元包含的M个二级单元中,以简单随机抽样抽取 m个二级单元,即最终接受调查的单元。
返回
§8.3 初级单元大小不等的二阶抽样
一般而言,初级单元的大小是不相等的,如果按初 级单元的大小分层后,层内初级单元的大小差别仍很大, 则需用本节介绍的方法来处理二阶抽样的问题。当初级 单元大小不等时,一般采用不等概抽样。
一、符号说明
总体中初级单元个数及第一阶抽取的样本量:N,n
第i个初级单元中二级单元数: M i 第i个初级单元中第二阶抽样的样本量:mi 第i个初级单元中第j个二级单元的观测值:Yij 样本中第i个初级单元中第j个二级单元的观测值:yij
返回
性质3 对于二阶抽样,如果两个阶段都是简单随机 抽样,则有 E( p) P
估计量 p 的方差为:
V
(
p)
1 n
f1
1
N
1
N i1
(
Pi
P)2
1 f2 nm
M N(M
N
1) i1
PiQi
V ( p) 的无偏估计为:
v(
p)
1 f1 n(n 1)
n
(