整群抽样
第七章 整群抽样
y 1 yi i M M
y
j 1
M
总体总值及按群平均的总体均值:
Y Yi Yij
i 1 i 1 j 1 A A M
Y 1 A Y Yi A A i 1
样本总值及按群平均的样本均值:
y yi yij
i 1 i 1 j 1 a a M
• 总体均值 Y 的无偏估计: y y 1 aM aM
V ( y) 1 f 2 Sb aM
1 a y y y ij i a M i 1 j 1 i 1
a
M
• 方差:
2 • 方差的无偏估计: v ( y ) 1 f sb
aM
第二节
群大小相等的整群抽样
LOGO
第一节
抽样方式
LOGO
• 实施理由: ① 缺少调查单位的必要信息无法对其直接编制抽样框实施 概率抽样,而由调查单位组成的群是现成的或者群很容 易划分从而编制群抽样框非常容易时,常采用整群抽样。 ② 使调查实施便利、节省费用而采用整群抽样。 ③ 对某些由特殊结构的群组成的总体实施整群抽样能使精 度有较大提高。
第七章 整群抽样
本章要点
LOGO
对于整群抽样,本章给出了群大小相等和群大小不等 的整群抽样方法及与之匹配的估计量、估计量的方差及方差 的估计量。 • 具体要求: • 掌握群大小相等情形对群进行简单随机抽样简单估计量的 无偏性、方差及方差的无偏估计,掌握群的划分原则;了 解群内方差、群间方差概念及其对整群抽样精度的影响。 • 掌握群大小不等情形与简单随机抽样相匹配的简单估计量、 比率估计量及与抽样相匹配的汉森-赫维茨估计量及性质。 • 掌握估计总体比例的整群抽样方法及简单估计量、比率估 计量。
(抽样检验)第七章整群抽样最全版
(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。
如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。
群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样壹样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。
整群抽样
当各群所含次级单元数相等时,就称群
的大小相等;当各群所含次级单元数不 相等时,就称群的大小不相等。
第二节 群规模相等时的估计
一、符号说明 二、估计量 三、整群抽样效率分析
一、符号说明
设总体有N个群,每个群包含的单元数M相等 (或相近). 符号: 总体群数: N 样本群数:n 总体第 i 群中第 j 个单元的指标值: Yij 样本第 i 群中第 j 个单元的指标值: yij 第 i 群中的单元数: M i
注意: 整群抽样的随机性体现在群与群间不重 叠,也无遗漏,群的抽选按概率确定。 如果把每一个群看作一个单位,则整群 抽样可以被理解为是一种特殊的简单随 机抽样。 整群抽样是由一阶抽样向多阶段抽样过 渡的桥梁.此章介绍的是单阶段整群抽样.
(二)特点 优点: 1. 抽样框编制得以简化。
M1 M 2 ... M N M
它们之间的关系为:
1 2 2 S [( N 1) Sb N ( M 1) S w ] NM 1
2
M 仍为M ,不难 将 Y 改为 y ,n 代替 N ,由于是整群抽样, 得到样本方差平方和的关系式:
1 2 2 s [( n 1) sb n( M 1) sw ] nM 1
二、估计量
(一)均值估计量的定义
若群的抽取是简单随机的,且群的大小(M)相等, 则总体均值的估计为:
1 n y yi n i 1 i 1 j 1 nM
n
M
yij
(二)估计量 y 的性质
性质1
y 是 Y 的无偏估计
Y E( y) Y M
性质2
y 的方差为:
(抽样检验)第七章整群抽样
第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。
整群抽样
上式中的分子为:
பைடு நூலகம்
(Y
N
ij
Y )(Yik Y )
NM ( M 1) 2
第二节 群规模大小相等时的估计
上式中的分母为:
2 ( Y Y ) ij N M
NM
故 又可写为:
NM 1 2 S MN
2 (Yij Y )(Yik Y ) ( NM 1)(M 1) S 2
(1)
第二节 群规模大小相等时的估计
2.
估计量
性质1:
y 的性质
y 是 Y 的无偏估计,即
E y Y
因为是按简单随机方法抽取群,所以样本群均值 总体群均值 Y 的无偏估计,因而
y是
Ey Y
M
Y
第二节 群规模大小相等时的估计
性质2
y 的方差为
1 f V ( y) n N 1 1 f 2 Sb nM
从方法上看,整群抽样可以看成单阶段抽样向多阶段抽样 过渡的桥梁。如果抽出群后,对其中所有的次级单元进 行调查,称为单阶段整群抽样;如果抽出群后,在次级 单元中进一步抽取子样本,称为两阶段抽样;如果进一 步在两阶段抽样的子样本中按更低一级的单元再抽子样 本,称为三阶段抽样;如此类推,等等。如果最后一个 阶段所抽出的单元是组成总体的基本单元,一般称为多 阶段抽样,将在后面章节讨论;如果最后一个阶段所抽 出的单元是群(基本单元的集合),可将其称为多阶段 整群抽样,也即是多阶段抽样中的一种情形。本章仅介 绍单阶段整群抽样。
Y Yi N y yi n
n
N
第二节 群规模大小相等时的估计
Y
: 总体中的个体均值
(各群 M i M)
抽样技术 5 整群抽样
2.群内相关系数:是表达总体中群内小单元间相关程度 的一个指标。 定义:
(Y
E (Yij Y )(Yik Y ) E (Yij Y )
2 i 1 j k
N
M
ij
Y )(Yik Y )
2 NCM 2 ( Y Y ) ij i 1 j 1 N M
NM 2 (Yij Y )(Yik Y )
学生2
学生3 学生4 学生5 学生6
83
74 82 66 87
83
79 111 101 69
89
94 109 79 80
105
98 107 129 90
99
132 87 99 124
100
116 99 107 105
115
117 99 106 120
80
63 130 105 86
试估计该学校平均每个学生每周的零花钱,并给出置信 度为95%的置信区间。
11 22 17 26 16 27
12 33 17 40 24 17
13 15 10 4 6 8
14 17 18 12 11 10
15 13 9 5 7 9
16 18 23 13 15 8
17 33 5 26 30 11
18 26 15 13 17 3
19 7 32 4 6 9
20 15 1 1 6 5
2 ( Y Y ) i N
Y
N 1
i
Y
2
N 1
5.2 群规模大小相等时的估计
3、 V ( y ) 的样本估计为
1 f 2 1 f v( y ) sb nM n
M n s ( yi y)2 n 1 i 1
抽样方案的类型包括
抽样方案的类型包括抽样方案的类型包括:简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样和方便抽样。
抽样方案的选择对于研究的结果和可信度具有重要影响,因此需要根据研究目的和样本特点合理选取合适的抽样方案。
一、简单随机抽样简单随机抽样是指每个个体被选中的概率相等,且相互独立的抽样方法。
它的特点是简单易行,适用于总体中各个个体相对均匀分布的情况。
简单随机抽样可以通过随机数表、随机数发生器等方式实现,确保抽样的公正性和代表性。
二、分层抽样分层抽样是将总体按照某种特征划分为若干层次,然后从每个层次中抽取样本。
这种抽样方法能够保证各个层次的代表性,同时减小样本误差。
分层抽样需要根据总体的特征确定层次划分的依据,并合理确定每个层次的抽样比例。
三、整群抽样整群抽样是将总体按照某种特征划分为若干群体,然后从每个群体中抽取样本。
与分层抽样类似,整群抽样也能够保证各个群体的代表性,减小样本误差。
整群抽样需要根据总体的特征确定群体划分的依据,并合理确定每个群体的抽样比例。
四、系统抽样系统抽样是在总体中按照某个固定的间隔选取样本。
系统抽样适用于总体具有明显的规律性分布的情况,能够保证样本的代表性。
系统抽样需要根据总体的规律性分布确定抽样的间隔,并保证抽样起点的随机性。
五、多阶段抽样多阶段抽样是将总体按照某种特征划分为若干阶段,然后在每个阶段中抽取样本。
多阶段抽样能够在样本数量有限的情况下尽可能覆盖总体的各个特征,减小样本误差。
多阶段抽样需要根据总体的特征确定阶段划分的依据,并合理确定每个阶段的抽样比例。
六、方便抽样方便抽样是一种不依据严格随机原则的抽样方法,根据研究者的方便和选择性抽取样本。
方便抽样的优点是节省时间和成本,缺点是样本的代表性和可信度较低,容易引入偏差。
方便抽样适用于一些初步研究或调查,但在正式的科学研究中应尽量避免使用。
综上所述,抽样方案的类型包括简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样和方便抽样。
整群抽样
(Yij Y )(Yik Y )
i 1 j k
NM ( M 1) / 2 2 (Yij Y )(Yik Y )
i 1 j k N M
MN
( M 1)( NM 1) S 2
M ( N 1) Sb2 ( NM 1) S 2 c ( M 1)( NM 1) S 2
ˆ) 1 f ˆ V (Y V (Y ) 2 M0 nM 2
(Y Y )
i 1 i
N
2
N 1
ˆ) 1 f ˆ v(Y v(Y ) 2 M0 nM 2
(y
i 1
n
i
y )2
n 1
按简单随机抽样抽群,采用比率估计量
对群进行简单随机抽样,总体均值的比估计量为
ˆ YR
1 Y N
Y
j 1
N
i
为总体的“群和平均”。 为样本的“群和平均”。
1 y y yi n j 1
Y 1 N M Y Yij 为总体均值。 M NM i 1 j 1 y 1 n M y yij 为样本均值。 M nM i 1 j 1
N M 1 S (Yij Y )2 NM 1 i 1 j 1 2
ˆ 是无偏估计,其方差为 Y HH
N N Y M 1 2 2 i 0 ˆ ) Z ( Y ) V (Y M ( Y Y ) i i HH i n i 1 Zi n i 1 V (Yˆ ) 的一个无偏估计为
HH
v(YHH )
ˆ
n yi ˆ 2 M 02 n 1 2 ( Y ) ( y y ) i HH n(n 1) i 1 zi n(n 1) i 1
抽样的方案有哪几种方法
抽样的方案有哪几种方法抽样的方案有哪几种方法摘要:抽样是研究中常用的一种方法,通过从总体中选取一部分样本进行研究,可以得到总体的一些特征或者结论。
本文将介绍抽样的概念以及常见的抽样方法,包括简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样和方便抽样。
通过深入了解这些抽样方法,可以帮助策划师在实践中更好地进行调研和分析。
一、简单随机抽样简单随机抽样是最常用的一种抽样方法,其原理是从总体中随机地选取样本,使得每个样本被选中的概率相等。
简单随机抽样通常需要使用随机数表或者随机数发生器来进行样本的选择。
这种方法适用于总体分布均匀的情况,且样本数量较少的场景。
二、分层抽样分层抽样是将总体分为若干个层次,然后从每个层次中随机选择一定数量的样本。
这种方法的优势在于可以对不同层次的样本进行比较,从而获得更准确的结果。
分层抽样通常需要先对总体进行分层,然后在每个层次中进行简单随机抽样。
三、整群抽样整群抽样是将总体分为若干个群组,然后随机选择其中一部分群组作为样本。
与分层抽样类似,整群抽样也可以提高样本的代表性和可比性。
这种方法适用于总体中的群组内部存在相似性的情况,例如在研究不同地区的消费行为时,可以将地区作为群组进行抽样。
四、系统抽样系统抽样是按照一定的规则从总体中选取样本,规则可以是等间隔、等概率等。
系统抽样通常比简单随机抽样更加方便,因为不需要使用随机数表或者随机数发生器。
然而,系统抽样可能存在周期性的问题,如果总体中存在某种规律性的分布,可能导致抽样结果的偏差。
五、多阶段抽样多阶段抽样是将总体按照一定的层次结构进行分层,然后在每个层次中进行抽样。
这种方法通常用于总体较大、难以直接抽样的情况。
多阶段抽样可以减少调查的难度和成本,但同时也会增加误差。
六、方便抽样方便抽样是最不科学的一种抽样方法,通常是根据调查者的方便程度选择样本。
这种方法的优势在于操作简单、成本低,但是样本的代表性和可比性往往较差。
方便抽样适用于初步了解问题或者进行探索性研究,但在科学研究中应尽量避免使用。
第六章 整群抽样
n
n 1
➢比估计
n
N
YˆR M 0Yˆ M 0
yi
i 1 n
mi
,V (YˆR )
N 2 (1
i
Y
)2
N 1
i 1
v(YˆR )
N 2 (1 n
f
)
1 n n 1 i1
yi2
2
Y R
n i 1
mi2
2Y
R
n i 1
mi
yi
例4:从共有790个单位的某系统中按简单 随机抽样抽取n=20个单位,这些单位的职
1
n
1
n i 1
ai2
p2
n i 1
mi2
2p
n i 1
ai mi
M
第四节 群大小不等的一般情形
若群大小Mi 相差不多,以平均群大小M 代替M, 仍可按群大小相等处理;若Mi 相差较大,有两 种处理方法。
一、记号
➢ 总体第i群第j个小单位指标值 Yij,i=1,2,…,N; j=1,2,…, Mi,Mi 是群的大小。
费额的户平均值 Y ,并给出其95%的置信区
间(P213)。
12个楼层96户居民人均月食品消费额资料
i
yij
1 240, 187, 162, 185, 206, 197, 154, 173
2 210, 192, 184, 148, 186, 175, 169, 180
3 149, 168, 145, 130, 170, 144, 125, 167
yi
yi M
➢总体平均群和 Y Yi N
➢样本平均群和 y yi n
➢总体均值
NM
Y Yij MN Y M i1 j1
(标准抽样检验)第七章整群抽样
(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
整群抽样
三、群的大小不等时 在许多情况下,总体各群的大小 M是不完全相 i 等,或完全不相等的。若各群的大小相差不大时, 总体参数的估计量可按简单估计或比估计来确定: (一)简单估计
如果群的抽取是简单随机的,则可将每个群的 总和 Yi 看作是第 i 群的指标,于是总体总和
Y
Y
i 1
N
i
的简单估计可依照简单随机抽样的情形来做。
五、整群抽样与分层抽样的比较 综合前面的分析,比较整群抽样和分层抽样 可以发现二者在分组(层或群)的条件、调查的 方式、分组(层或群)的目的、分组(层或群) 的原则、总体方差的分解等方面都存在着较为明 显的差别。
第二节
等概率整群抽样的情形
一、群的大小相等时 (一)估计量 整群抽样是以群为单位进行抽样,如果群的 抽取是简单随机的,则当群的大小都相等时,可 以将简单随机抽样理解为是一种特殊的整群抽样, 特别当总体分群后的每个群都只包括一个次级单 元时,整群抽样和简单随机抽样一致。因此,整 群抽样的估计量可以比照简单随机抽样方式来构 造。
4.如果把每一个群看作一个单位,则整群抽 样可以被理解为是一种特殊的简单随机抽样。 5.整群抽样也是多阶段抽样的前提和基础。
6.整群抽样有特殊的用途。有些现象的研究, 如果直接调查作为基本单元的个体,很难说明问 题,必须以一定范围所包括的基本单元为群体, 进行整群抽样,才能满足调查的目的。
7.整群抽样要求分群后各群所含次级单元数 目应该确知,否则会给抽样推断带来不便。
(二)比估计
当群的大小不等时,在对群进行简单随机抽
样的情况下,Y Yi M i ,我们注意到它同比率
R Yi
i 1 N
N
N
X 形式上完全相同,只不过在这里是
整群抽样
第七章 整群抽样第一节 整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
采用整群抽样的两个理由:抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
二、群的划分问题关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
群的划分应该是:尽量扩大群内差异,而缩小群间差异。
这样,每个群都具有足够好的代表性。
如果所有的群都相似,那么抽少数群就可获得相当好的精度;反之,若群内的单元比较相似,而群与群之间的差别较大,则整群抽样的效率就低。
所以分群的原则使“群内差异大、群间差异小”与分层的原则使“层内差异小,层间差异大”是恰好相反的。
至于群的规模的选择,一是取决于精度与费用之间的平衡,二是从抽样实施的组织管理等因素来考虑。
三、整群抽样的特点同其他抽样组织形式相比较,整群抽样具有如下特点:整群抽样则不需要编制庞大的抽样框;在样本单元数相同的条件下,整群抽样与简单随机抽样相比,样本单元的分布相对较集中,组织实施过程更加便利,同时还可以大大地节省调查费用;整群抽样的随机性体现在群与群间不重叠,也无遗漏,群的抽选按概率确定;如果把每一个群看作一个单位,则整群抽样可以被理解为是一种特殊的简单随机抽样;整群抽样也是多阶段抽样的前提和基础;整群抽样有特殊的用途;整群抽样要求分群后各群所含次级单元数目应该确知,否则会给抽样推断带来不便。
第二节 等概率整群抽样的情形一、群的大小相等时(一)估计量1、总体均值Y 的估计∑===ni i Y n y Y 11ˆ2、总体总和Y 的估计y nN Y nN y NM Yni i ∑===•=1ˆ 3、总体比例P的估计∑∑=====ni in i i nMP n p P 1111ˆα(二)估计量的方差及其估计由于群是按简单随机方法抽取的,因此,估计量Y Y ˆ,ˆ与P ˆ的方差及方差的无偏估计量可直接按第三章的方法构造:1)(1)(122---=∑=N Y YnM f y V Ni i22221])1(1[1)1,1(1)1(1[)1(1bC C S nMf M S nM f NM NM N N N M S NM nM f -=-+-≈-≈-≈--+•-•-=ρρ 21211)(1)(ˆb ni is nMf n y Ynf y V-=--•-=∑= 1)()1()()ˆ(ˆ12222---=•=∑=N Y Yn f N y V M N Y VNi i≈22)1(b S nf M N - 1)()1()(ˆ)ˆ(ˆ21222--•-=•=∑=n y Ynf N y V M N Y Vni i≈22)1(b s nf M N -1N )P (P nf 1)Pˆ(V N1i 2i---=∑=1n )PˆP(n f1)P ˆ(Vˆn1---=∑=i i三、群的大小不等时(一)简单估计如果群的抽取是简单随机的,则可将每个群的总和i Y 看作是第i 群的指标,于是总体总和∑==N1i i Y Y 的简单估计可依照简单随机抽样的情形来做,即:y N Y n N Y ˆn 1i i ==∑=可以证明,Yˆ是Y 的无偏估计,其方差为: 1N )Y Y(n)f 1(N )Yˆ(V N1i 2i2--•-=∑=方差估计量为:11N Y ˆ(Vˆ122---=∑=n y Y n f ni i)()())Y ˆ(Vˆ为)Y ˆ(V 无偏估计。
第六章 整群抽样
群既可以是自然形成的实体,如村庄、田块, 也可以是现有的机构、组织,如学校、街区, 还可以是人为划分的单位,比如对学生分班。 群组成:尽量提高精度,群内差异尽量大,群 间差异尽量小。 群规模:权衡精度与费用。
第二节 群大小相等的整群抽样
总体由A群组成,每群均含有M个调查单位, 总体调查单位总数为 AM ,对群进行简单随机 抽样,从A群中随机抽取a群,对抽中群的所 有调查单位全部调查,调查单位样本量为aM , 因而群抽样比及调查单位抽样比均为a/A.
2 w
a
a
M
2
样本群内方差
二、估计量及其性质
由简单随机抽样知 y 1 - 1 E(y)=E( )= E (y) Y Y M M M
= -
y 是 Y 的无偏估计量。其方差为
y 1 1 1 f 1 A 2 V ( y ) V ( ) 2 V (y) 2 (Yi Y ) M M M a A 1 i 1 1 f 2 Sb aM -
一、记号
Yij 表示总体中第i群第j调查单位的调查指标值 (i=1, , ,A;j=1,2,,M).则 2 Yi 1 Y Yij 和Y i i M M j 1
A M
Y 分别表示第i群总值
j 1 ij A M
M
Y 1 A 和调查单位均值,Y= Yi Yij 和 Y Yi A A i 1 i=1 i 1 j 1 分别表示总体总值和按群平均的总体均值。 Y 1 Y AM AM
总体方差与群内方差、群间方差的关系
A M 1 S2 (Yij Y ) 2 AM 1 i 1 j 1 A M 1 [(Yij Y i ) (Y i Y )]2 AM 1 i 1 j 1
整群抽样
技术部
行政部
销售部
ቤተ መጻሕፍቲ ባይዱ
制造部
THE END
谢 谢 观 看!
《社会调查与统计分析》
第四章 抽样
知识点8 整群抽样
学习导航
整群抽样
整群抽样的定义 整群抽样的优缺点 整群抽样和分层抽样的区别运用
1. 整群抽样( Cluster Sampling )的定义
又称为集体抽样或群体抽样 ,是从总体中随机抽取一些 小的群体,然后由所抽出的若干个小群体内的所有元素 构成调查的样本的方法。 整群抽样区别于其它抽样方法的最大特点在于它的抽样 单位不是单个元素,而是成群的元素 。
2. 整群抽样的优缺点
优点 „ (1)在于可以简化抽样的过程 „ (2)节省时间、人力和经费 缺点就是其样本的分布面不大、样本对总体的代表性相 对较差。
3. 整群抽样与分层抽样区别运用
不同子群相互之间差别不大、而每个子群内部的异质性 较大时,则适合于采用整群抽样的方法;
反之,当不同子群相互之间差别很大、而每个子群内部 的差异不大时,则特别适合于采用分层抽样的方法。
抽样调查-第6章整群抽样
(1 n
f
)Sb2
下面我们看一个整群抽样的例题
返回
【例4.11】 在一次对某中学在校生零花钱的调查
中,以宿舍作为群进行整群抽样,每个宿舍都有M=6 名学生。用简单随机抽样在全部N=315间宿舍中抽取
n=8间宿舍。全部48个学生上周每人的零花钱 yij 及
相关计算数据如下表。试估计该学校学生平均每周
sb2
1 0.0254 86
926 .63 18.81
s( y) v( y ) 18.81 4.34
于是置信度为95%的置信区间为98.17±1.96×4.34, 也即[89.66元,106.68元】
返回
2、整群抽样效率分析
在整群抽样中,由于
V (y) 1 f nM
而样本群内方差为:
sw2
1 n(M 1)
n i 1
M
( yij yi )2
j 1
1 n
n i 1
1 M 1
M
( yij
j 1
yi )2
1 n
n i 1
si2
220.79
返回
由相关系数的估计式有
sb2
sb2 sw2 (M 1)sw2
故
y
1 n
n i 1
yi
75 89 93.33 8
98.17
sb2
M n 1
n i 1
(yi
y)
6 [(75 98.17)2 (93.33 98.17)2 926.63 8 1
返回
08-第八章_整群抽样
i = 1,2, , N ; j = 1,2,, M 。记 y ij 为样本第 i 群中第 j 的小单元(次级
单元)的指标值, i = 1,2, , n ; j = 1,2, , M ,又 f =
n 是抽样比。 N
Yi = å Yij , y i = å y ij
j =1 j =1
M
M
分别是总体和样本中第 i 群的指标和,简称为群和。
过程完毕。 在求出了总体均值 Y 的无偏估计量 y 及其方差 V ( y ) 后,我们现在求估 计量方差的估计量 v( y ) 。 容易知道, v( y ) = 过程如下: 因为对群的抽样是简单随机的, 若将 Y i =
1- f 2 sb nM Yi 看作是单元指标值, 则Y i M
的样本方差
2 sb S2 2 2 是总体方差 b 的无偏估计,从而 sb 是 Sb 的无偏估计。也 M M
N
N
M
因为中间项等于零
N é M ù ( Y Y )( Y Y ) = ( Y Y ) (Yij - Y i )ú i i i ê åå å å ij i =1 j =1 i =1 ë j =1 û N M
= å (Y i - Y ) × 0
i =1
N
=0
所以平方和的分解式变为
åå (Yij - Y ) 2 = åå (Yij - Y i ) 2 + åå (Y i - Y ) 2
过程如下: 如果将 Z i =
1 M (Yij - Y i ) 2 作为单元的指标值,则它的样本均值 å M - 1 j =1
n M 1 n é 1 M 1 2ù 2 y y = ( ) ( yij - y i )2 = sw åê å ij i ú n( M - 1) åå n i =1 ë M - 1 j =1 i =1 j =1 û
常见的抽样方案包括
常见的抽样方案包括常见的抽样方案包括:简单随机抽样、系统抽样、整群抽样、分层抽样、多阶段抽样和方便抽样。
本文将对这些抽样方案进行详细介绍,并探讨其适用范围和优缺点。
一、简单随机抽样简单随机抽样是最常见、最简单的抽样方法之一。
该方法要求从总体中随机选择一定数量的个体,以保证每个个体被选中的概率相等。
简单随机抽样适用于总体中各个个体相互独立、同质性较高的情况。
这种抽样方法的优点是容易实施、结果具有较好的代表性,但其缺点是可能存在抽样误差,且不适用于总体中个体之间存在明显差异的情况。
二、系统抽样系统抽样是一种按照一定规律从总体中选择样本的抽样方法。
该方法要求根据某种规则选择一个起始个体,然后按照固定间隔依次选择其他个体作为样本。
系统抽样适用于总体中个体之间存在一定规律的情况,例如时间序列中的数据。
这种抽样方法的优点是相对简单,且结果具有代表性。
然而,如果总体中的个体呈现出某种周期性或规律性,那么系统抽样可能导致样本的偏倚。
三、整群抽样整群抽样是一种将总体划分为若干个互不相交的群体,然后选择部分群体进行抽样的方法。
在选定的群体中,可以使用简单随机抽样或其他抽样方法选择个体作为样本。
整群抽样适用于总体中个体存在一定的聚类现象,且群体间差异较大的情况。
这种抽样方法的优点是节省时间和成本,且结果具有较好的代表性。
但是,如果群体内部存在较大的差异,那么整群抽样可能导致样本的偏倚。
四、分层抽样分层抽样是一种将总体划分为若干个层级,然后从每个层级中选择样本的方法。
不同层级的选择可以使用简单随机抽样或其他抽样方法。
分层抽样适用于总体中个体存在不同特征或差异较大的情况。
这种抽样方法的优点是结果具有较好的代表性,并且可以对不同特征的样本进行比较分析。
然而,分层抽样需要事先确定好各个层级的划分标准,如果划分不准确,可能导致样本的偏倚。
五、多阶段抽样多阶段抽样是一种将总体划分为多个阶段,逐步进行抽样的方法。
在每个阶段中,可以使用不同的抽样方法选择样本。