第七章整群抽样
第七章 整群抽样
y 1 yi i M M
y
j 1
M
总体总值及按群平均的总体均值:
Y Yi Yij
i 1 i 1 j 1 A A M
Y 1 A Y Yi A A i 1
样本总值及按群平均的样本均值:
y yi yij
i 1 i 1 j 1 a a M
• 总体均值 Y 的无偏估计: y y 1 aM aM
V ( y) 1 f 2 Sb aM
1 a y y y ij i a M i 1 j 1 i 1
a
M
• 方差:
2 • 方差的无偏估计: v ( y ) 1 f sb
aM
第二节
群大小相等的整群抽样
LOGO
第一节
抽样方式
LOGO
• 实施理由: ① 缺少调查单位的必要信息无法对其直接编制抽样框实施 概率抽样,而由调查单位组成的群是现成的或者群很容 易划分从而编制群抽样框非常容易时,常采用整群抽样。 ② 使调查实施便利、节省费用而采用整群抽样。 ③ 对某些由特殊结构的群组成的总体实施整群抽样能使精 度有较大提高。
第七章 整群抽样
本章要点
LOGO
对于整群抽样,本章给出了群大小相等和群大小不等 的整群抽样方法及与之匹配的估计量、估计量的方差及方差 的估计量。 • 具体要求: • 掌握群大小相等情形对群进行简单随机抽样简单估计量的 无偏性、方差及方差的无偏估计,掌握群的划分原则;了 解群内方差、群间方差概念及其对整群抽样精度的影响。 • 掌握群大小不等情形与简单随机抽样相匹配的简单估计量、 比率估计量及与抽样相匹配的汉森-赫维茨估计量及性质。 • 掌握估计总体比例的整群抽样方法及简单估计量、比率估 计量。
(抽样检验)第七章整群抽样最全版
(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。
如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。
群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样壹样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。
整群抽样
当各群所含次级单元数相等时,就称群
的大小相等;当各群所含次级单元数不 相等时,就称群的大小不相等。
第二节 群规模相等时的估计
一、符号说明 二、估计量 三、整群抽样效率分析
一、符号说明
设总体有N个群,每个群包含的单元数M相等 (或相近). 符号: 总体群数: N 样本群数:n 总体第 i 群中第 j 个单元的指标值: Yij 样本第 i 群中第 j 个单元的指标值: yij 第 i 群中的单元数: M i
注意: 整群抽样的随机性体现在群与群间不重 叠,也无遗漏,群的抽选按概率确定。 如果把每一个群看作一个单位,则整群 抽样可以被理解为是一种特殊的简单随 机抽样。 整群抽样是由一阶抽样向多阶段抽样过 渡的桥梁.此章介绍的是单阶段整群抽样.
(二)特点 优点: 1. 抽样框编制得以简化。
M1 M 2 ... M N M
它们之间的关系为:
1 2 2 S [( N 1) Sb N ( M 1) S w ] NM 1
2
M 仍为M ,不难 将 Y 改为 y ,n 代替 N ,由于是整群抽样, 得到样本方差平方和的关系式:
1 2 2 s [( n 1) sb n( M 1) sw ] nM 1
二、估计量
(一)均值估计量的定义
若群的抽取是简单随机的,且群的大小(M)相等, 则总体均值的估计为:
1 n y yi n i 1 i 1 j 1 nM
n
M
yij
(二)估计量 y 的性质
性质1
y 是 Y 的无偏估计
Y E( y) Y M
性质2
y 的方差为:
抽样技术第七章整群抽样ppt课件
NM
NM
故有 可推得
NM
2
(Yij Y )(Yik Y )
c
i1 jk
(M 1)(NM 1)S 2
c
1
NMSw2 (NM 1)S 2
1
Sw2 S2
13
ρc可估计为
ˆc
sb2
sb2 (M
sw2 1) sw2
y 的方差可写成如下形式:
《抽样技术》第七章
1
第七章 整群抽样
§7.1 概述 §7.2 群大小相等的情形 §7.3 群大小不相等的情形 §7.4 按与群大小成比例的不等概率抽样抽群
2
§7.1 概述
设总体由N个大单元,即初级单元组成,每个初级 单元又由若干个较小的次级单元或二级单元组成。 从总体中按某种方式抽取n个初级单元,观测其中所 包含的所有次级单元。这种抽样称为整群抽样。确 切地说,应称为单阶整群抽样。
1N N 1 i1
Yi Y
2 1 f nM
Sb2
s2 y 1 f
n
1 n
n 1 i1
yi y 2
1 f nM
sb2
其中f=n/N为抽样比。可见,sb2 是Sb2的无偏估计。
8
当n足够大时,总体均值Y 的置信度为1−α的置信区 间为:
y u 2s y
例7.1 在一次某城市居民小区居民食品消费量调查 中,以每个楼层(相当于居民小组)为群进行整群抽 样。每个楼层都有M=8个住户。用简单随机抽样在 全部N=510个楼层中抽取n=12个楼层。全部96个 样本户人均月食品消费额yij及按楼层的平均数yi 与 标准差si ,如下表所示。试估计该居民小区人均食 品消费额的户平均值 ,并给出其0.95的置信区间。
(抽样检验)第七章整群抽样
第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。
第七章抽样
第七章抽样一、抽样与抽样调查抽样:是一种选择调查对象的程序和方法。
抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。
优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。
二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。
与整体调查(普查)比,抽样调查具有下列优越性。
第一、调查费用低。
抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。
例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。
第二、速度快。
时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。
第三、范围广。
由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。
第四、可获得内容丰富的资料。
普查通常只了解少量项目,无法进行深入分析。
例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。
第五、准确性高。
整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。
4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。
在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。
这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。
对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。
有两个因素可以减少抽样误差。
首先,大样本比小样本产生的误差小。
其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。
抽样技术 5 整群抽样
2.群内相关系数:是表达总体中群内小单元间相关程度 的一个指标。 定义:
(Y
E (Yij Y )(Yik Y ) E (Yij Y )
2 i 1 j k
N
M
ij
Y )(Yik Y )
2 NCM 2 ( Y Y ) ij i 1 j 1 N M
NM 2 (Yij Y )(Yik Y )
学生2
学生3 学生4 学生5 学生6
83
74 82 66 87
83
79 111 101 69
89
94 109 79 80
105
98 107 129 90
99
132 87 99 124
100
116 99 107 105
115
117 99 106 120
80
63 130 105 86
试估计该学校平均每个学生每周的零花钱,并给出置信 度为95%的置信区间。
11 22 17 26 16 27
12 33 17 40 24 17
13 15 10 4 6 8
14 17 18 12 11 10
15 13 9 5 7 9
16 18 23 13 15 8
17 33 5 26 30 11
18 26 15 13 17 3
19 7 32 4 6 9
20 15 1 1 6 5
2 ( Y Y ) i N
Y
N 1
i
Y
2
N 1
5.2 群规模大小相等时的估计
3、 V ( y ) 的样本估计为
1 f 2 1 f v( y ) sb nM n
M n s ( yi y)2 n 1 i 1
第七章抽样调查
总体中有N个个体
将总体所有个 以群为单以元选在中总群中体的分所成若干群 体中抽取有若个干体群组成样本
整群抽样图示
第三节 抽样误差
一、抽样误差的含义
由于随机抽样的偶然因素使样本各单位的结构不足以 代表总体各单位的结构,而引起抽样指标和全及指标 之间的绝对离差。
例如,估计粮食平均亩产500公斤,允许误差范围 为10公斤,这就意味着亩产在490-510之间都是有效的 。490-510又称估计区间。允许误差范围与估计值之比 称为误差率,(1-误差率)称为估计精度。如本例误 差率=2%,估计精度=98%。
总体中有N个个体 将总体中个体按某一标志排 序,并均分成n个部分。
在第一部分中随机地抽取一个, 然后每隔相同的距离抽取一个, 直到抽完n个为止。
等距抽样图示
四、整群抽样
将总体各单位划分成许多群,然后从其中随机抽 取部分群,对中选群的所有单位进行全面调查的
抽样组织形式。又称区域抽样或分群抽样。
整群抽样对被抽中群体的所有单位都作调查,因此 抽样平均误差不再受群内方差的影响,而受群间方 差和抽样数目的影响。整群抽样采用不重复抽样方 法抽取样本。
将总体中每个单位编上号码,然后
⑶随机数码表法 使用随机数表,查出所要抽取的调
查单位。
二、类型抽样
先对总体各单位按主要标志加以分组,然后再从各
组中按随机原则抽选一定单位构成样本。或称分 类抽样、分层抽样
样本抽取方法
(1)等比例类型抽样法(类型比例抽样法)
(2)不等比例类型抽样法(类型适宜抽样法) 在类型比例抽样中,首先要对总体作分类(组)。再 从每类(组)中随机抽取样本。所以不存在组间误差, 抽样平均误差取决于各组内方差的平均水平。
经济统计学第7章抽样调查
参数的假设检验是根据样本,对总体参数某种假设的正确性作出判断。 可以分别提出两种假设: 前一种不能轻易拒绝的假设为原假 设,后一种为备选假设。假设检验就是根据样本,检验 是否成立, 不成立就接受备选假设 。
一、基本思想: 小概率原则:认为在一次实验中 小概率事件几乎是不可能发生的,小概率事件的概率为显著性水平 。
一个总体的检验
Z 检验 (单尾和双尾)
t 检验 (单尾和双尾)
Z 检验 (单尾和双尾)
2检验 (单尾和双尾)
均值
一个总体
比例
方差
总体方差已知时的均值检验 (双尾 Z 检验)
均值的双尾 Z 检验 (2 已知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 原假设为:H0: =0;备择假设为:H1: 0
单侧检验 (原假设与备择假设的确定) 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上
除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为
H0: 1000 H1: < 1000
第二节
一个正态总体参数的假设检验
-10
100
20
25
-5
25
30
30
0
0
离差
40
35
5
25
50
40
10
100
10
25
-5
25
20
30
0
0
30
35
5
25
40
40
10
100
50
45
15
(标准抽样检验)第七章整群抽样
(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
07章抽样调查基础知识
总 体 指 标 是 指 根 据 总 体 各 单 位 标 志 值 计 算 的 综 合 指 标 , 又 称 为 总 体 参 数 。 常 用 的 总 体 指 标 有 总 体 平 均 数 X, 总
体 成 数 P, 总 体 方 差 ( x2或 p2) 和 标 准 差 ( x或 p) .
样本指标是根据样本各单位标志值计算的综合指标。常 用的样本指标有样本平均数,样本成数p,样本方差(sx2 或sp2)和标准差(sx或sp),其计算方法与总体指标计算 方法相同,只是公式中所用的符号不同。
随机原则是在抽取调查单位时,完全排除人 为的主观因素影响,保证每一个调查单位都 有相等的中选可能的原则。就概率意义而言, 又称为等可能性原则。
抽样调查遵守随机原则的原因:
抽样调查的目的是用样本来推断总体的数 量特征,这就要求抽样的部分单位能够充 分的代表总体。遵守随机原则,可以使样 本结构与总体结构相同,进而可以按概率 理论计算误差,并进行统计推断。
(2)系统随机抽样
系统随机抽样也称为机械随机抽样或等距随 机抽样。它是先将总体中各单位按一定的标 志排队,然后每隔一定的距离抽取一定单位 构成样本。
(3)分层随机抽样
分层随机抽样又称为类型随机抽样、分类随机抽 样。它是按照某一标志,先将总体分成若干组 (类),其中每一组(类)称为一层,再在层内 按简单随机抽样方法进行抽样。
△=tu=2*2=4小时
某玻璃器皿厂某日生产15000只印花 玻璃杯,现从中抽取150只进行质量检 验,结果有147只合格,其余3只为不 合格品,以68.27%的可靠程度,求这 批印花玻璃杯合格率(成数)的极限误 差。按重复抽样
△=tu=1*1.14%=1.14%
参数估计
一、点估计 点估计是直接用一个样本指标估计总体指标的 推断方法。如用样本指标和p直接代替总体指标和 P。特点:方法简便,但可靠程度不高。 二、区间估计 区间估计是在一定的概率保证下,根据点估计 值,联系一定的误差范围估计总体指标值的一种 推断方法。
抽样调查方法与技术:整群抽样
需要估计: Y(按小单元平均的总体均值)、 Y(总体总值)
二、估计量及其性质
由于 及YY仅相差一个常数NM,故仅需讨论
的估Y 计量及其性质即可,Y的估计量及其性质 很容易由 的结Y果得到。
(一)总体均值( 按Y小单元计算的总体均 值)
1、
E(y) Y
y是Y的无偏估计
即Y = y= y nM
1 nM
(按小单元计算的总体群间方差)(定义)
(13)
Si2
1 M 1
M
(Yi j
j 1
Yi )2
:第i个群的总体
群内方差。 (当然按小单元计)
一、简单随机抽样(等概率抽样)下记号
(13) Sw2
1 N
N
Si2
i 1
1 N (M 1)
ห้องสมุดไป่ตู้
N i 1
M
(Yi j Yi )2 :总体
j 1
群内方差(已经是个平均数了)。(定义)
则: (1)N:总体的群数为N i=1,2,3,…,N (2)M:每个群内含有M个调查单位(小单元)
j=1,2,3,…,M (3)NM:全部总体单位(小单元)总数 (4)n:从N群中随机抽n群
第二节 群大小相等的整群抽样
一、简单随机抽样(等概率抽样)下记号
(5)f=n/N
群抽样比
=nM/NM 调查单位抽样比
自己去证明以下三者之间的关系:
S(2 总方差)、S(b2 总体群间方差)、S(w2 总体群内方差)
对于n群样本的记号
①yij : 样本中第i群第j个单位的标志值 (i 1, 2,...,n; j 1, 2,..., M )
M
②yi yij j 1
初中数学 什么是整群抽样 如何进行整群抽样
初中数学什么是整群抽样如何进行整群抽样整群抽样(cluster sampling)是一种抽样方法,它将人口或样本分为若干个群体或簇,并从中随机选择一部分群体作为样本。
在学习初中数学时,了解整群抽样的概念和方法可以帮助我们更好地理解统计学和概率论的应用。
一、整群抽样的定义和原理整群抽样是一种分层抽样方法,它将人口或样本按一定的特征分为不同的群体。
这些群体应该具有一定的内部相似性,而不同群体之间应有一定的差异性。
整群抽样的目的是通过从不同群体中选择样本来代表整体人口或样本,以便进行统计推断。
整群抽样的原理基于两个假设:1. 群体内的个体之间具有较高的相似性;2. 不同群体之间的差异性相对较大。
通过选择代表性群体作为样本,我们可以在减小样本规模的同时保留整体人口或样本的特征。
二、整群抽样的步骤进行整群抽样需要以下步骤:1. 群体的划分:确定将人口或样本划分为不同的群体。
群体应具有内部相似性和外部差异性。
例如,如果我们要研究某个城市的学生,可以将学生按学校划分为不同的群体。
2. 群体的选择:从划分的群体中随机选择一部分作为样本。
确保选择的样本能够代表整体群体的特征。
3. 样本内部的随机选择:在选择的群体内,需要进行进一步的随机抽样,以确保从每个群体中选择的个体具有代表性。
可以使用简单随机抽样或其他抽样方法。
4. 数据收集:对选定的样本进行数据收集。
这可以是通过调查问卷、观察或其他数据收集方法完成的。
5. 数据分析:对收集到的数据进行统计分析,并根据样本结果推断整体人口或样本的特征。
三、整群抽样的优缺点整群抽样有以下优点:1. 减少样本规模:相对于简单随机抽样,整群抽样可以减小样本规模,节省时间和成本。
2. 保留群体特征:通过选择代表性的群体作为样本,整群抽样可以更好地保留整体人口或样本的特征。
然而,整群抽样也有一些缺点:1. 群体内的个体差异:群体内的个体可能存在一定的差异,这可能导致样本的代表性有所降低。
第七章 抽样
第七章抽样一、抽样与抽样调查1、抽样:是一种选择调查对象的程序和方法。
2、抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。
3、优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。
二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。
与整体调查(普查)比,抽样调查具有下列优越性。
第一、调查费用低。
抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。
例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。
第二、速度快。
时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。
第三、范围广。
由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。
第四、可获得内容丰富的资料。
普查通常只了解少量项目,无法进行深入分析。
例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。
第五、准确性高。
整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。
4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。
在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。
这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。
对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。
有两个因素可以减少抽样误差。
首先,大样本比小样本产生的误差小。
其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(8.8)
又
Sw2
( NM
1)(1 MN
采用整群抽样调查的原因有二。其一是在某些情况下, 往往由于不适合采用一个个地抽取样本单位,不得不采用整 群抽样。例如,某些工业产品的质量检验,事实上不能逐个 抽取样本单位来进行,只能在某一时间内,成批地抽取产品 来检验。
其二,即使抽样调查能够一个个地取样,但由于经济的 考虑也会选择整群抽样。例如,职工家庭生活水平调查中, 如果不是以居委会为群进行整群抽样调查,而是以居民户为 单位抽样,这些被抽到的居民户一般分散地居住,必然增加 交通费、延长调查时间等。所以出于对工作时间、经费等客 观条件的考虑,也得采用整群抽样调查。
计算可得 1 c 1 ,c 在一定程度上反映了群内单元的
差异,当然这种差异一般是相对于群间差异而言的。它可以
用群内方差
S
2 w
与群间方差
Sb2
来表示:
1 (M
1)c
M ( N 1)Sb2 ( NM 1)S 2
(8.7)
当N足够大时,近似有
c ( Sb2 S 2 ) ( M 1)S 2
第七章 整群抽样
若总体可分为 N个初级单元(称为群),每个初级单 元包含若干次级单元。按照某种方式从总体中抽取 n个初级 单元,对这些单元中的所有次级单元全部进行调查。这种抽 样方法称为整群抽样。
在实际工作中,整群抽样方法被广泛采用。例如,在社 会经济调查中的人口调查、家计调查、农林牧业调查以及工 业产品质量检验等等都经常采用整群抽样调查。
随机抽样来要低一些。
例如,在一个有500个村庄、100000个农户的县,抽取
1%的农户就是1000户,而抽1%的村庄则只有5个村庄,也
许抽到的5个村庄农户多于1000,但由于样本单位只集中在
5个村庄,显然不如在全县范围内简单随机抽取1000户分布
均匀,代表性一般要差一些,抽样误差较大。
当然我们可以通过多抽几个群来弥补这一缺陷,但最关 键的一条还是在于总体内群的划分。为了使整群抽样的样本 具有一定的代表性,应当使群与群之间尽可能地差异小,而 群内单元之间的差异应当大(注意:这一点与分层抽样中总 体内层的划分有着极大的差别),这意味着每个群均具有足 够的代表性。如果划分的群相互之间颇多相似之处,那么少 量群的抽取足以提供良好的精度。一个总体划分成多少个群 ,每个群的规模大小如何又是一个新问题,通常我们面临的 总体会有自然的初级单元,例如本章开头所说的各所中学它 们互相之间关于学生的体质很相似,但在一个学校里每个学 生之间有一定的差异。
整群抽样作为一种抽样组织形式,具有以下的优点:
1、调查单位比较集中,进行调查比较方便,可以减少 调查人员来往于调查单位之间的时间和费用。例如,在进行 农村居民户收入情况调查时,在一个县抽千分之五的村庄, 对其所有居民户进行调查,明显地比从全县直接抽千分之五 的农户进行调查,更便于组织,节省人力、旅途往返时间及 费用。
在抽到的群内普查,此时样本不是简单随机的。
由于群的选取是简单随机的,因此
sb2
与
sw2
分别是
S
2 b
与
S
2 w
的
无偏估计,于是得到 S 2的无偏估计为:
Sˆ 2
1 [(N NM 1
1)sb2
N(M
1)sw2 ]
(8.3)
当 N 相当大时,该估计可近似写为:
Sˆ 2 sb2 (M 1)sw2 M
它们之间的关系为:
S2
1 [(N NM 1
1)Sb2
N(M
1)Sw2 ]
(8.1)
将Y 改为 y ,n 代替N ,由于是整群抽样,M仍为M ,不难
得到样本方差平方和的关系式:
s2
1 [(n nM 1
1)sb2
n( M
2的估计,但不是无偏估计。这是因为次级单元是
倘若需要我们自行划分群,一般还要考虑到组织管理上 的方便、精度上的要求以及费用的多少等等因素。
§1 群大小相等的整群抽样
首先讨论群大小相等时的简单情况。所谓群的大小相等 主要指群内次级单元的个数相等,假定关于群的抽取是随机 无放回的。
首先引进一些必要的记号:
Yij ——表示第 i 群中第 j 个次级单元
j 1
—总体平均值
S2
1 NM 1
N i 1
M
(Yij
j 1
Y )2
—总体差异平方和
Sb2
M N 1
N
(Yi
i 1
Y )2
—群间差异平方和
S
2 w
1 N(M
1)
N i 1
M j 1
(Yij Yi )2 —群内差异平方和
将Y 改为 y ,则为相应的样本指标值
i 1, 2, , N; j 1, 2, , M
yij ——表示样本中第 i 群中第 j 个次级单元的观测值
i 1, 2, , n; j 1, 2, , M
M
Yi Yij —第 i 群总和 j 1
Yi Yi M —第 i 群平均值
1 N M
Y
NM
i 1
Yij
2、设计和组织抽样比较方便。例如,调查农村居民住 户,不必列出农村所有居民住户的抽样框,可以利用现成的 行政区域,如县、乡、村,将农村划分为若干群,这给抽样 设计方案带来很大方便。尤其是对那些无法事先掌握总体单 位情况的总体,采用整群抽样更为合适。
然而,整群抽样由于调查单位只能集中在若干群上,而
不能均匀分布在总体的各个部分,因此,它的精度比起简单
(8.4)
从(8.2)式可知,若 n 也足够大的话, s2也可写成(8.4)形式,
此时,s2就可以看作是S 2的近似无偏估计了。
再引进一个群内相关的记号c ,这个概念的重要性在于
它可以度量群内次级单元的差异程度,因为我们已经知道群 内单元的差异大就可能保证样本的代表性,如何划分群实质 上是一个抽样方案的设计问题。易见设计的效应好还是差在
相当程度上与这个c 有关。c 的定义为:
c
E(Yij Y )(Yik Y E(Yij Y )2
)
(8.5)
MM
具体计算得
2
(Yij Y )(Yik Y )
c
i 1 jk
(M 1)(NM 1)S 2
(8.6)
(a2 b2 ) 2ab (a2 b2 )