整群抽样[1]

合集下载

(抽样检验)第七章整群抽样最全版

(抽样检验)第七章整群抽样最全版

(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。

确切地说,这种抽样组织形式应称为单级整群抽样。

如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。

当诸Mi都相等时,称为等群;否则,称为不等群。

采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。

整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。

如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。

群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。

同分层抽样壹样,整群抽样的前提是先要对总体进行分群。

关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。

这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。

而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。

(抽样检验)第七章整群抽样

(抽样检验)第七章整群抽样

第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。

确切地说,这种抽样组织形式应称为单级整群抽样。

如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。

当诸Mi都相等时,称为等群;否则,称为不等群。

采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。

整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。

如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。

群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。

同分层抽样一样,整群抽样的前提是先要对总体进行分群。

关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。

这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。

而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。

因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。

整群抽样

整群抽样
M
上式中的分子为:
பைடு நூலகம்
(Y
N
ij
Y )(Yik Y )
NM ( M 1) 2
第二节 群规模大小相等时的估计
上式中的分母为:
2 ( Y Y ) ij N M
NM
故 又可写为:
NM 1 2 S MN

2 (Yij Y )(Yik Y ) ( NM 1)(M 1) S 2
(1)
第二节 群规模大小相等时的估计
2.
估计量
性质1:
y 的性质
y 是 Y 的无偏估计,即
E y Y
因为是按简单随机方法抽取群,所以样本群均值 总体群均值 Y 的无偏估计,因而
y是
Ey Y
M
Y
第二节 群规模大小相等时的估计
性质2
y 的方差为
1 f V ( y) n N 1 1 f 2 Sb nM
从方法上看,整群抽样可以看成单阶段抽样向多阶段抽样 过渡的桥梁。如果抽出群后,对其中所有的次级单元进 行调查,称为单阶段整群抽样;如果抽出群后,在次级 单元中进一步抽取子样本,称为两阶段抽样;如果进一 步在两阶段抽样的子样本中按更低一级的单元再抽子样 本,称为三阶段抽样;如此类推,等等。如果最后一个 阶段所抽出的单元是组成总体的基本单元,一般称为多 阶段抽样,将在后面章节讨论;如果最后一个阶段所抽 出的单元是群(基本单元的集合),可将其称为多阶段 整群抽样,也即是多阶段抽样中的一种情形。本章仅介 绍单阶段整群抽样。
Y Yi N y yi n
n
N
第二节 群规模大小相等时的估计
Y
: 总体中的个体均值
(各群 M i M)

06第六章 整群抽样

06第六章  整群抽样
i 1 i 1 j 1
n
n
M

N M 1 S ( yij Y ) 2 为总体方差; NM 1 i 1 j 1 2
n M 1 s ( yij y ) 2 nM 1 i 1 j 1 2
2 b

为样本方差; 为总体群间方差;

M N 1 N 2 S (Yi Y ) N 1 (Yi Y ) 2 N 1 i 1 i 1
第一节 第二节 第三节 第四节

整群抽样概述 等概率整群抽样的情形 不等概率整群抽样的情形 设计效应和样本容量的确定
第一节 整群抽样概述




一、整群抽样的概念 整群抽样是先将总体各单元划分成若干群(组),然后以 群为单位,从中随机抽取一部分群,对中选群内的所有单 元进行全面调查。确切地说,这种抽样组织形式应称为单 级整群抽样。 如果总体中的单元可以分成多级,则可以对前几级单元采 用多阶抽样(详见下章),而在最后一阶中对该阶抽样单 元所包含的全部个体(最基本单元)进行调查,这种抽样 称作多级整群抽样。本章只讨论单级整群抽样。 设总体被划分为N群,第i群含有Mi个次级单元,全部总 体次级抽样单元数记为M 0,即 M 0 M i 。当诸Mi都相等 时,称为等群;否则,称为不等群。
M n 1 n 2 (Yi y ) (Yi y ) 2 s n 1 i 1 n 1 i 1
2 b
为样本群间方差;

N M 1 S ( yij Yi ) 2 N ( M 1) i 1 j 1 2
为总体平均群内方差; 为样本平均群内方差;



二、分群的原则 尽量扩大群内差异,而缩小群间差异。 三、整群抽样的特点 1.在大规模抽样调查中,常常没有或很难编制出包括总 体所有次级单元在内的抽样框,而整群抽样则不需要编制 庞大的抽样框。 2.在样本单元数相同的条件下,整群抽样与简单随机抽 样相比,样本单元的分布相对较集中,虽然样本的代表性 较差,但调查组织实施过程更加便利,同时还可以大大地 节省调查费用。因此,实际工作中,在权衡费用和精度之 后,有时宁可适当增加一些样本单元数,也采用整群抽样 方法。 3.整群抽样的随机性体现在群与群间不重叠,也无遗漏, 群的抽选按概率确定。

第四章整群抽样

第四章整群抽样

1 (M 1)c
上面结果意味着:按同样的样本量(以次级单元计) 整群抽样的方差约为简单随机抽样的方差的 1 (M 1)c 倍。换句话说,为了获得同样的精度,整群抽样的样本 量必须是简单随机抽样的样本量的 1 (M 1)c 倍。
20
第21页/共49页
群内相关系数
NM
2
(Yij Y )(Yik Y )
• Def.1 一般地说,如果总体中所有较小的基本单元可 以以某种形式组成数量较少但规模较大的单元;或反 过来说,每个“大”单元都由若干“小”单元组成, 称这些 “大”单元为初级(抽样)单元(primary sampling unit),“小”单元为次级(抽样)单元 (secondary sampling unit).
Deff = (所考虑抽样设计估计量的方差)/(相同样 本量下简单随机抽样估计量的方差)
18
第19页/共49页
设计效应值愈大,表明它的效率愈低。若deff>1,表明
所考虑的抽样设计的效率不如简单随机抽样;若deff<1,
表明该抽样设计的效率比简单随机抽样高。
在整群抽样中,我们在前面已经指出:如何划分群以
27
第28页/共49页
(3) 若 令为简单随机抽样的样本量 则
nsrs
即可达到整群抽样96户样本量相同的估计精度
Mn nsrs deff
812 20(户) 4.7
28
第29页/共49页
群规模不相等的整群抽样
一、等概抽样,简单估计 二、等概抽样,加权估计 三、等概抽样,比率估计 四、例子
29
8 230,205,187,176,212,253,189,240 211.50 27.48
9 274,208,195,307,264,258,210,309 253.13 44.52

第六章 整群抽样

第六章  整群抽样

n
n 1
➢比估计
n
N
YˆR M 0Yˆ M 0
yi
i 1 n
mi
,V (YˆR )
N 2 (1
i
Y
)2
N 1
i 1
v(YˆR )
N 2 (1 n
f
)
1 n n 1 i1
yi2
2
Y R
n i 1
mi2
2Y
R
n i 1
mi
yi
例4:从共有790个单位的某系统中按简单 随机抽样抽取n=20个单位,这些单位的职
1
n
1
n i 1
ai2
p2
n i 1
mi2
2p
n i 1
ai mi
M
第四节 群大小不等的一般情形
若群大小Mi 相差不多,以平均群大小M 代替M, 仍可按群大小相等处理;若Mi 相差较大,有两 种处理方法。
一、记号
➢ 总体第i群第j个小单位指标值 Yij,i=1,2,…,N; j=1,2,…, Mi,Mi 是群的大小。
费额的户平均值 Y ,并给出其95%的置信区
间(P213)。
12个楼层96户居民人均月食品消费额资料
i
yij
1 240, 187, 162, 185, 206, 197, 154, 173
2 210, 192, 184, 148, 186, 175, 169, 180
3 149, 168, 145, 130, 170, 144, 125, 167
yi
yi M
➢总体平均群和 Y Yi N
➢样本平均群和 y yi n
➢总体均值
NM
Y Yij MN Y M i1 j1

(标准抽样检验)第七章整群抽样

(标准抽样检验)第七章整群抽样

(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。

确切地说,这种抽样组织形式应称为单级整群抽样。

如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。

当诸Mi都相等时,称为等群;否则,称为不等群。

采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。

整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。

如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。

群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。

同分层抽样一样,整群抽样的前提是先要对总体进行分群。

关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。

这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。

而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。

抽样调查方法与技术:整群抽样

抽样调查方法与技术:整群抽样

需要估计: Y(按小单元平均的总体均值)、 Y(总体总值)
二、估计量及其性质
由于 及YY仅相差一个常数NM,故仅需讨论
的估Y 计量及其性质即可,Y的估计量及其性质 很容易由 的结Y果得到。
(一)总体均值( 按Y小单元计算的总体均 值)
1、
E(y) Y
y是Y的无偏估计
即Y = y= y nM
1 nM
(按小单元计算的总体群间方差)(定义)
(13)
Si2
1 M 1
M
(Yi j
j 1
Yi )2
:第i个群的总体
群内方差。 (当然按小单元计)
一、简单随机抽样(等概率抽样)下记号
(13) Sw2
1 N
N
Si2
i 1
1 N (M 1)
ห้องสมุดไป่ตู้
N i 1
M
(Yi j Yi )2 :总体
j 1
群内方差(已经是个平均数了)。(定义)
则: (1)N:总体的群数为N i=1,2,3,…,N (2)M:每个群内含有M个调查单位(小单元)
j=1,2,3,…,M (3)NM:全部总体单位(小单元)总数 (4)n:从N群中随机抽n群
第二节 群大小相等的整群抽样
一、简单随机抽样(等概率抽样)下记号
(5)f=n/N
群抽样比
=nM/NM 调查单位抽样比
自己去证明以下三者之间的关系:
S(2 总方差)、S(b2 总体群间方差)、S(w2 总体群内方差)
对于n群样本的记号
①yij : 样本中第i群第j个单位的标志值 (i 1, 2,...,n; j 1, 2,..., M )
M
②yi yij j 1

抽样调查整群抽样培训课件

抽样调查整群抽样培训课件
E(y) Y
这样的结果是显然的,因为是按简单随机
方法抽取群,所以样本群均值 y 是总体群均
值 Y 的无偏估计,因而
E(y) Y Y M
返回
定理4.2 y 的方差为:
V (y) 1 f n
1
N
(Y i Y )2
N 1 i1
1 f nM
Sb2
证明:因为 y M y, V ( y) M 2V ( y),
n=8间宿舍。全部48个学生上周每人的零花钱 yij 及
相关计算数据如下表。试估计该学校学生平均每周
的零花钱 Y ,并给出其95%置信区间。
返回
8个宿舍48名学生每周零花钱支出额
i
yij
yi
si2
1 58 83 74 82 66 87 75.0 125.6
2 91 83 79 111 101 69 89.0 233.6
4、All that you do, do with your might; things done by halves are never done right. ----R.H. Stoddard, American poet做一切事都应尽力而为,半途而废永远不行6.17.20216.17.202110:5110:5110:51:1910:51:19
Y NM y
返回
总体总值 Y NM Y 的估计量的方差为:
V (Y ) V (NM y) N 2M 2V ( y)
v(Y )
N
2M
2v( y)
N
2M
(1 n
f
)Sb2
下面我们看一个整群抽样的例题
返回
【例4.11】 在一次对某中学在校生零花钱的调查
中,以宿舍作为群进行整群抽样,每个宿舍都有M=6 名学生。用简单随机抽样在全部N=315间宿舍中抽取

整群抽样

整群抽样

三、群的大小不等时 在许多情况下,总体各群的大小 M是不完全相 i 等,或完全不相等的。若各群的大小相差不大时, 总体参数的估计量可按简单估计或比估计来确定: (一)简单估计
如果群的抽取是简单随机的,则可将每个群的 总和 Yi 看作是第 i 群的指标,于是总体总和
Y
Y
i 1
N
i
的简单估计可依照简单随机抽样的情形来做。
五、整群抽样与分层抽样的比较 综合前面的分析,比较整群抽样和分层抽样 可以发现二者在分组(层或群)的条件、调查的 方式、分组(层或群)的目的、分组(层或群) 的原则、总体方差的分解等方面都存在着较为明 显的差别。
第二节
等概率整群抽样的情形
一、群的大小相等时 (一)估计量 整群抽样是以群为单位进行抽样,如果群的 抽取是简单随机的,则当群的大小都相等时,可 以将简单随机抽样理解为是一种特殊的整群抽样, 特别当总体分群后的每个群都只包括一个次级单 元时,整群抽样和简单随机抽样一致。因此,整 群抽样的估计量可以比照简单随机抽样方式来构 造。
4.如果把每一个群看作一个单位,则整群抽 样可以被理解为是一种特殊的简单随机抽样。 5.整群抽样也是多阶段抽样的前提和基础。
6.整群抽样有特殊的用途。有些现象的研究, 如果直接调查作为基本单元的个体,很难说明问 题,必须以一定范围所包括的基本单元为群体, 进行整群抽样,才能满足调查的目的。
7.整群抽样要求分群后各群所含次级单元数 目应该确知,否则会给抽样推断带来不便。
(二)比估计
当群的大小不等时,在对群进行简单随机抽
样的情况下,Y Yi M i ,我们注意到它同比率
R Yi
i 1 N
N
N
X 形式上完全相同,只不过在这里是

整群抽样[1]

整群抽样[1]

习题七一、 单选题1.整群抽样中的群的划分标准为( A )。

A.群的划分尽可能使群间的差异小,群内的差异大B.群的划分尽可能使群间的差异大,群内的差异小C.群的划分尽可能使群间的差异大,群内的差异大D.群的划分尽可能使群间的差异小,群内的差异小 2.整群抽样的一个主要特点是( C )。

A.方便B.经济C.可以使用简单的抽样框D.特定场合中具有较高的精度 3.群规模大小相等时,总体均值Y 的简单估计量为( A )。

A.∑∑===n i Mj ijynM Y 111ˆB.()∑∑==-=n i Mj ij y M n Y 1111ˆ C.∑∑===n i Mj ij y n Y 111ˆD.∑∑===n i Mj ijyNY 111ˆ4.下面关于群内相关系数的取值说法错误的是(D )。

A.若群内次级或基本单元变量值都相等则20S ω=,此时ρ取最大值1B.若群内方差与总体方差相等,则0≈ρ,此时表示分群是完全随机的C.若群内方差大于总体方差时,则ρ取负值D.若20b S =时,ρ达到极小值,此时11-=M ρ5.整群抽样中,对比例估计说法正确的是( B )。

A.群规模相等时,总体比例P 的估计可以为:11ni i p n A ==∑B.群规模不等时,总体比例P 的估计可以为:11()/()n niii i p A M===∑∑C.群规模相等时,总体比例P 的方差估计为:211()(1)()n i v p in n p P ==--∑D.群规模不等时,总体比例P 的方差估计为:2121()1()ni i i v p n n p A M M==•--∑二、多选题1.下面关于整群抽样的说法,有哪些是正确的?(ABC DE ) A.通常情况下抽样误差比较大B.整群抽样可以看作为多阶段抽样的特殊情形,即最后一阶抽样是100%的抽样C.调查相对比较集中,实施便利,节省费用D.整群抽样的方差约为简单随机抽样的方差的1(1)cM ρ+-倍E.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(1)cM ρ+-倍2.关于整群抽样(群规模相等)的设计效应,下面说法正确的有(ABCD ) A.()1(1)()c srsV y deff M y V ρ=≈+-B.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(1)cM ρ+-倍C.群内相关系数的估计值为2222(1)ˆb cbM s s ss ωωρ-=+-D.要提高整群抽样估计效率,可通过增大群内单元的差异实现E.整群抽样的精度取决于群内相关系数,群内相关系数越大,则估计量的精度越高 3.关于群规模不等时,可以采用的估计量形式有( B CD )。

第七章整群抽样

第七章整群抽样


S
2 b
与S
2 w
几乎相等,也就是说群间方差几乎与群内方差一样,实际上
指出了我们对群的划分完全是随机进行的。如果 c 0 ,那
么群间的方差远远大于群内方差,群内单元差异相对不显著
将引起样本的代表性差,从而精度一定会差!
c 0 ,表明群内单元的差异远比群间差异大。
由(8.11)可知, c 0 的情况最多只能到 1 (M 1) ,此时 群间毫无异,任意抽取几个群都可以作为总体的真实写照
因此,c的取值范围应当在 [1 (M 1) , 1] 之间。
1、估计量及其方差
总体平均数 Y
其方差为:
的无偏估计是
y 1 nM
n i 1
M
yij
j 1
Var( y)
1 f n

NM 1 M 2 ( N 1)
S
2[1

(
M
1)c ]
(8.12)
当N足够大时,近似有
相当程度上与这个c 有关。c 的定义为:
c

E(Yij Y )(Yik Y E(Yij Y )2
)
(8.5)
MM
具体计算得
2
(Yij Y )(Yik Y )
c
i 1 jk
(M 1)(NM 1)S 2
(8.6)
(a2 b2 ) 2ab (a2 b2 )
2、设计和组织抽样比较方便。例如,调查农村居民住 户,不必列出农村所有居民住户的抽样框,可以利用现成的 行政区域,如县、乡、村,将农村划分为若干群,这给抽样 设计方案带来很大方便。尤其是对那些无法事先掌握总体单 位情况的总体,采用整群抽样更为合适。

第六章 整群抽样

第六章 整群抽样



群既可以是自然形成的实体,如村庄、田块, 也可以是现有的机构、组织,如学校、街区, 还可以是人为划分的单位,比如对学生分班。 群组成:尽量提高精度,群内差异尽量大,群 间差异尽量小。 群规模:权衡精度与费用。
第二节 群大小相等的整群抽样

总体由A群组成,每群均含有M个调查单位, 总体调查单位总数为 AM ,对群进行简单随机 抽样,从A群中随机抽取a群,对抽中群的所 有调查单位全部调查,调查单位样本量为aM , 因而群抽样比及调查单位抽样比均为a/A.
2 w
a
a
M

2
样本群内方差
二、估计量及其性质
由简单随机抽样知 y 1 - 1 E(y)=E( )= E (y) Y Y M M M
= -
y 是 Y 的无偏估计量。其方差为
y 1 1 1 f 1 A 2 V ( y ) V ( ) 2 V (y) 2 (Yi Y ) M M M a A 1 i 1 1 f 2 Sb aM -
一、记号
Yij 表示总体中第i群第j调查单位的调查指标值 (i=1, , ,A;j=1,2,,M).则 2 Yi 1 Y Yij 和Y i i M M j 1
A M
Y 分别表示第i群总值
j 1 ij A M
M
Y 1 A 和调查单位均值,Y= Yi Yij 和 Y Yi A A i 1 i=1 i 1 j 1 分别表示总体总值和按群平均的总体均值。 Y 1 Y AM AM
总体方差与群内方差、群间方差的关系
A M 1 S2 (Yij Y ) 2 AM 1 i 1 j 1 A M 1 [(Yij Y i ) (Y i Y )]2 AM 1 i 1 j 1

整群抽样

整群抽样

技术部
行政部
销售部
ቤተ መጻሕፍቲ ባይዱ
制造部
THE END
谢 谢 观 看!
《社会调查与统计分析》
第四章 抽样
知识点8 整群抽样
学习导航
整群抽样
整群抽样的定义 整群抽样的优缺点 整群抽样和分层抽样的区别运用
1. 整群抽样( Cluster Sampling )的定义
又称为集体抽样或群体抽样 ,是从总体中随机抽取一些 小的群体,然后由所抽出的若干个小群体内的所有元素 构成调查的样本的方法。 整群抽样区别于其它抽样方法的最大特点在于它的抽样 单位不是单个元素,而是成群的元素 。
2. 整群抽样的优缺点
优点 „ (1)在于可以简化抽样的过程 „ (2)节省时间、人力和经费 缺点就是其样本的分布面不大、样本对总体的代表性相 对较差。
3. 整群抽样与分层抽样区别运用
不同子群相互之间差别不大、而每个子群内部的异质性 较大时,则适合于采用整群抽样的方法;
反之,当不同子群相互之间差别很大、而每个子群内部 的差异不大时,则特别适合于采用分层抽样的方法。

抽样调查-第6章整群抽样

抽样调查-第6章整群抽样

(1 n
f
)Sb2
下面我们看一个整群抽样的例题
返回
【例4.11】 在一次对某中学在校生零花钱的调查
中,以宿舍作为群进行整群抽样,每个宿舍都有M=6 名学生。用简单随机抽样在全部N=315间宿舍中抽取
n=8间宿舍。全部48个学生上周每人的零花钱 yij 及
相关计算数据如下表。试估计该学校学生平均每周
sb2
1 0.0254 86
926 .63 18.81
s( y) v( y ) 18.81 4.34
于是置信度为95%的置信区间为98.17±1.96×4.34, 也即[89.66元,106.68元】
返回
2、整群抽样效率分析
在整群抽样中,由于
V (y) 1 f nM
而样本群内方差为:
sw2
1 n(M 1)
n i 1
M
( yij yi )2
j 1

1 n
n i 1
1 M 1
M
( yij
j 1

yi )2

1 n
n i 1
si2

220.79
返回
由相关系数的估计式有



sb2
sb2 sw2 (M 1)sw2


y

1 n
n i 1
yi

75 89 93.33 8

98.17
sb2

M n 1
n i 1
(yi

y)
6 [(75 98.17)2 (93.33 98.17)2 926.63 8 1
返回

整群抽样的案例及实施步骤

整群抽样的案例及实施步骤

整群抽样的案例及实施步骤1. 简介整群抽样(cluster sampling)是一种常用的统计抽样方法,广泛应用于社会科学、市场调研等领域。

整群抽样通过将总体分成若干个群体(或称为簇),然后从中随机选择部分群体,进而在所选中的群体内进行样本抽取。

本文将介绍整群抽样的案例和实施步骤。

2. 整群抽样案例2.1 市调研在市场调研中,整群抽样常被用于获取特定市场群体的样本信息。

例如,一家食品公司希望了解中国大城市中不同消费族群对新产品的偏好。

为了节省调研成本,他们可以将各城市划分为若干个群体,然后随机选择其中的一部分城市进行调研。

通过在每个被抽取的城市里随机选择店铺或者家庭进行样本调查,最终可以得到一组代表性的样本数据,以满足研究需要。

2.2 教育评估在教育领域,整群抽样被广泛应用于评估教育政策或探究学生表现。

以某市小学为例,研究者想要了解小学生的学习状况。

为了获取代表性样本,他们可以将小学按区划分为若干个群体,再从中随机选择一部分小学进行调查。

在所选小学中,再随机选择一些班级或学生作为样本,通过对这些样本的数据收集和分析,可以得出有关整个小学群体的结论。

3. 实施步骤以下是整群抽样的一般性实施步骤:3.1 步骤一:确定总体和群体首先,需要明确需要研究的总体,并将其划分为群体。

群体可以按照地区、行业、组织等维度进行划分。

3.2 步骤二:确定群体尺寸和数量在确定群体后,需要决定每个群体的尺寸和数量。

群体的尺寸和数量应该根据研究目的和需求来确定,尽量保证样本的代表性。

3.3 步骤三:随机抽样群体使用随机抽样的方法,从群体中随机选择一部分群体。

随机抽样的过程要保证每个群体都有被选择的机会,从而确保样本的随机性和代表性。

3.4 步骤四:抽取群体内样本在所选中的群体内,再次进行抽样,以获取群体内样本。

可以使用简单随机抽样(simple random sampling)或其他合适的抽样方法来进行。

3.5 步骤五:数据收集和分析根据样本数据进行数据收集和分析,以得出有关总体的结论。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

习题七一、 单选题1.整群抽样中的群的划分标准为( A )。

A.群的划分尽可能使群间的差异小,群内的差异大B.群的划分尽可能使群间的差异大,群内的差异小C.群的划分尽可能使群间的差异大,群内的差异大D.群的划分尽可能使群间的差异小,群内的差异小 2.整群抽样的一个主要特点是( C )。

A.方便B.经济C.可以使用简单的抽样框D.特定场合中具有较高的精度 3.群规模大小相等时,总体均值Y 的简单估计量为( A )。

A.∑∑===n i Mj ijynM Y 111ˆB.()∑∑==-=n i Mj ij y M n Y 1111ˆ C.∑∑===n i Mj ij y n Y 111ˆD.∑∑===n i Mj ijyNY 111ˆ4.下面关于群内相关系数的取值说法错误的是(D )。

A.若群内次级或基本单元变量值都相等则20S ω=,此时ρ取最大值1B.若群内方差与总体方差相等,则0≈ρ,此时表示分群是完全随机的C.若群内方差大于总体方差时,则ρ取负值D.若20b S =时,ρ达到极小值,此时11-=M ρ5.整群抽样中,对比例估计说法正确的是( B )。

A.群规模相等时,总体比例P 的估计可以为:11ni i p n A ==∑B.群规模不等时,总体比例P 的估计可以为:11()/()n niii i p A M===∑∑C.群规模相等时,总体比例P 的方差估计为:211()(1)()n i v p in n p P ==--∑D.群规模不等时,总体比例P 的方差估计为:2121()1()ni i i v p n n p A M M==•--∑二、多选题1.下面关于整群抽样的说法,有哪些是正确的?(ABC DE ) A.通常情况下抽样误差比较大B.整群抽样可以看作为多阶段抽样的特殊情形,即最后一阶抽样是100%的抽样C.调查相对比较集中,实施便利,节省费用D.整群抽样的方差约为简单随机抽样的方差的1(1)cM ρ+-倍E.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(1)cM ρ+-倍2.关于整群抽样(群规模相等)的设计效应,下面说法正确的有(ABCD ) A.()1(1)()c srsV y deff M y V ρ=≈+-B.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(1)cM ρ+-倍C.群内相关系数的估计值为2222(1)ˆb cbM s s ss ωωρ-=+-D.要提高整群抽样估计效率,可通过增大群内单元的差异实现E.整群抽样的精度取决于群内相关系数,群内相关系数越大,则估计量的精度越高 3.关于群规模不等时,可以采用的估计量形式有( B CD )。

A.11111(/)in n i i ij i i j M y n n y y M =====∑∑∑B.0111nnii i i iiy n n y y M z M====∑∑C.11ˆnii n Rii yYM===∑∑D.10ˆˆ1nii Y Y Mn y M ===∑ E.11nii y n y ==∑三、名次解释群内相关系数 四、计算题1. 设某灯泡厂每天生产一批灯泡共200盒,每盒装灯泡6只,今随机抽取8盒,检验其点燃小时数的资料,如下表所列。

(1)计算样本平均点燃时数,并分别按整盒和按灯泡计算其抽样平均误差,比较其估计精度。

(2)如果点燃小时数不到1000的为不良品,计算其样本不良率,并分别按整盒和按灯泡计算其抽样方差,比较何者较优。

2. 某大学为了估计全校学生在1991年夏天对安徽、江苏灾区的捐款总数,从全校124个班随机的抽取10个班级进行调查,数据如下表所示,并假定这10个班的400名学生中分别捐4.5元,5.0元,5.5元,6.0元和6.5元的都各有80名。

10个班级的捐款情况 单位:元(1)求该校学生平均捐款数和捐款总数的估计值;(2)计算该校学生捐款总数估计值的抽样方差,以及捐款总数的95%的置信区间。

3. 在一次对某寄宿中学在校生零花钱的调查中,以宿舍作为群进行整群抽样。

每个宿舍有6名学生。

用简单随机抽样在全部315间宿舍中抽取n=8间宿舍、全部48个学生上周每人的零花钱ijy及相关计算数据如下表。

试估计该学校平均每个学生每周的零花钱Y ,并给出其95%的置信区间。

4. 估计上题中以宿舍为群的群内相关系数与设计效应。

5. 带锯厂负责对他的用户进行修理,其修理费用每季结算一次。

该厂共有96家用户,各拥有不同带锯数,现采用等概简单随机方法抽取20家为样本,资料如下:(2)根据上述资料估计96家用户的修理费用及置信区间(а=0.05)。

(3)若已知这96家用户有710条带锯,利用这一补充信息估计总的修理费用和置信区间。

(4)欲估计下一季度的每带锯平均管理费用,绝对误差Δ=2,试问应抽取多少户作样本。

6. 邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群试估计平均每户家庭的订报份数及总的订报份数及估计量的方差。

7. 汽车运输公司抽样调查在使用的车辆中不安全轮胎的比例,在175辆车中抽中了25 请估计该运输公司的汽车中不安全轮胎的比例及估计量的方差。

8. 某市建筑行业集团共有48个单元,有载货汽车186辆。

按每个单元的车辆拥有量成比例的概率进行放回的PPS 抽样,共抽取10次,对抽中单元的所有车辆调查季度运量(单位:吨)。

样本数如下(其中有一单元被抽中2次,即i=3,7)。

试估计全集团的季度总运量及95%的置信区间。

9. 对某居民小区居民进行电话拥有情况的调查,以每个楼层(相当于居民小组)为群进行整群抽样,每个楼层都有M=8个住户。

用简单随机抽样在全部N=510个楼层中抽取n=12个楼层。

下表是12个样本楼层装有电话的住户数i a 及在楼层8户中所占的比例i p 的资料,10. 若欲调查城市的猪肉人均消费量,讨论下列情况下采用街道作为群的整群抽样是否合适,如果不合适你认为采用什么抽样方式好。

(1)少数民族的居住比较集中;(2)少数民族比较均匀得分布在各街道;(3)少数民族分散在各街道但比重不同。

11. 某一社会研究机构,研究南方某一城镇的社会民俗等情况。

设该镇共有415个居民小组,现从中按简单随机抽样抽取25个居民小组作样本,取得了以下一些数据。

(1)估计该地区户平均收入及其标准差。

(2)估计三代人的户占总户数的比例,并计算其标准差;(3)若以上两项估计的相对标准差均控制在5%,应抽取多少居民小组(群)作样本。

12. 一带锯厂对它的用户负责进行维修,按季定期进行结算,但缺乏每一带锯的平均修理费用,该厂共有96家用户,各拥有不同的带锯数。

现用简单随机抽样抽取20家作样本,要求:(1)估计每一带锯的平均修理费用及其抽样标准误差;(2)在未知总体带锯数的条件下估计96家用户总的修理费用及估计标准误;(3) 若已知这96家用户共有740条带锯,利用这一补充信息估计总的修理费用和估计的标准误;(4) 若欲估计下一季度每一带锯饿平均修理费用,允许最大绝对误差为d=2,置信度为95%,应抽取多少家用作样本。

13. 汽车运输公司抽样检查在使用的车辆中不安全轮胎的比例,在175辆车中抽取了25辆,14. 某工业系统准备一项改革措施,对全系统的人进行一项民意测验,该系统共有87个单位,现采用整群抽样,用简单随机抽取15个单位作为样本,读抽中的单位作全面征求意见,其结果如下:要求:(1) 估计该系统同意这一改革人数的比例,并计算估计标准误;(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的绝对误差不超过4%,置信度为95%,则应抽多少个单位作样本。

15. 在一个估计总体比例问题的抽样设计中,首先作了试调查,研究群的大小与群间方假设费用函数M n n C 7.01.21000++=,确定估计P 时在固定费用为10000元的条件下最优的M 和n 。

16. 假设整群抽样的样本群数为n ,每个群有M 个单元,群间方差为2b S ,群内方差为2w S 试对整群抽样与相同样本量的简单随机抽样的效率的比较进行讨论(fpc 可忽略不计)。

17. 在一次农村调查中,抽样单元是包含M 个农场的群,当抽取n 个群作样本时,其费用是:n tMn C 604+=,其中t 是调查一个农场所花的时间(按小时计算)。

如果这一 样本均值的方差是[]c M MnS ρ)1(12-+,fpc 忽略不计。

如果M 在1—10之间,c ρ=0.1,试问(1)t=0.5,(2)t=2小时,单元多大能得到最精确的结果?你这样解释两个结果的差别。

五、简答题1. 什么是整群抽样,整群抽样有哪几个步骤?2. 整群抽样有哪些优点?3. 整群抽样与多阶段抽样及分层抽样的区别?4. 整群抽样与分层抽样的区别;5. 整群抽样群大小的计量方法;6. 整群抽样的设计效应。

六、设计题欲调查城市的猪肉人均消费量,讨论下列情况下采用街道作为群的整群抽样是否合适,如果不合适,你认为采用什么抽样方式好。

(1)少数民族的居住比较集中;(2)少数民族比较均匀地分布在各条街道;(3)少数民族分散在各街道,但比重不同。

相关文档
最新文档