第七章抽样技术

合集下载

第七章 抽样调查技术

第七章 抽样调查技术

13
一、简单随机抽样

(一)具体操作步骤:
第一,对总体的每个单位进行编号,总体单位数 为10,000的总体可编为00 001到期10,000号;

第二,在随机数码表(一般的数理统计书中都有 此表)中从任意一个编号数开始,向上、向下或 跳跃选取编号,在00 001和10,000之间选出200个 (样本单位数);
5
2015/12/22
(二)样本总体


概念: 也称抽样总体(sampled population)或者“子 样”、“样本”,是指从全及总体中抽取出来的 单位集合。 大样本与小样本: 样本总体通常是有限总体,它所包含的的总 体单位数目称为样本容量(通常用英文字母n来表 示)。一般来说,样本单位数达到或者超过30个 称为大样本,而在30个以下的称为小样本。
第二,等距抽样的效率取决于对总体进行 排列时所使用的标志值。在等距抽样中, 调研人员假设总体是有序的。

2015/12/22
23
三、分层抽样

(一)分层抽样的具体步骤 (二)分层抽样的方法 (三)分层指标的选择 (四)分层抽样的优缺点 (五)分层抽样适用的范围
2015/12/22
24

假如我们要进行北京市居民家用电器的拥 有状况调查,采用整群抽样方法,那么, 我们在北京市3,600个居民委员会中随机抽 取20个居委会,这20个居委会中的所有户都 成为我们的调查样本。
2015/12/22
32
(二)采用整群抽样的原因


原因一:当缺少基本单位的名单而难以 直接从总体中抽取所要调查的基本单位。 原因二:即使容易获得个体的抽样框, 但从费用上考虑,直接从个体抽样获得 的样本可能比较分散。 原因三:采用整群抽样是抽样调查本身 目的的需要。 原因四:如果某些总体的各个子总体之 间的差异不大。

(抽样检验)第七章整群抽样最全版

(抽样检验)第七章整群抽样最全版

(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。

确切地说,这种抽样组织形式应称为单级整群抽样。

如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。

当诸Mi都相等时,称为等群;否则,称为不等群。

采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。

整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。

如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。

群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。

同分层抽样壹样,整群抽样的前提是先要对总体进行分群。

关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。

这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。

而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。

抽样技术第七章整群抽样ppt课件

抽样技术第七章整群抽样ppt课件

NM
NM
故有 可推得
NM
2
(Yij Y )(Yik Y )
c
i1 jk
(M 1)(NM 1)S 2
c
1
NMSw2 (NM 1)S 2
1
Sw2 S2
13
ρc可估计为
ˆc

sb2
sb2 (M
sw2 1) sw2
y 的方差可写成如下形式:
《抽样技术》第七章
1
第七章 整群抽样
§7.1 概述 §7.2 群大小相等的情形 §7.3 群大小不相等的情形 §7.4 按与群大小成比例的不等概率抽样抽群
2
§7.1 概述
设总体由N个大单元,即初级单元组成,每个初级 单元又由若干个较小的次级单元或二级单元组成。 从总体中按某种方式抽取n个初级单元,观测其中所 包含的所有次级单元。这种抽样称为整群抽样。确 切地说,应称为单阶整群抽样。
1N N 1 i1
Yi Y
2 1 f nM
Sb2
s2 y 1 f
n
1 n
n 1 i1
yi y 2
1 f nM
sb2
其中f=n/N为抽样比。可见,sb2 是Sb2的无偏估计。
8
当n足够大时,总体均值Y 的置信度为1−α的置信区 间为:
y u 2s y
例7.1 在一次某城市居民小区居民食品消费量调查 中,以每个楼层(相当于居民小组)为群进行整群抽 样。每个楼层都有M=8个住户。用简单随机抽样在 全部N=510个楼层中抽取n=12个楼层。全部96个 样本户人均月食品消费额yij及按楼层的平均数yi 与 标准差si ,如下表所示。试估计该居民小区人均食 品消费额的户平均值 ,并给出其0.95的置信区间。

(抽样检验)第七章整群抽样

(抽样检验)第七章整群抽样

第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。

确切地说,这种抽样组织形式应称为单级整群抽样。

如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。

当诸Mi都相等时,称为等群;否则,称为不等群。

采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。

整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。

如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。

群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。

同分层抽样一样,整群抽样的前提是先要对总体进行分群。

关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。

这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。

而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。

因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。

第7章 抽样方法

第7章 抽样方法

分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。

第七章抽样

第七章抽样

第七章抽样一、抽样与抽样调查抽样:是一种选择调查对象的程序和方法。

抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。

优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。

二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。

与整体调查(普查)比,抽样调查具有下列优越性。

第一、调查费用低。

抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。

例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。

第二、速度快。

时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。

第三、范围广。

由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。

第四、可获得内容丰富的资料。

普查通常只了解少量项目,无法进行深入分析。

例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。

第五、准确性高。

整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。

4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。

在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。

这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。

对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。

有两个因素可以减少抽样误差。

首先,大样本比小样本产生的误差小。

其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。

第7章抽样

第7章抽样
29
随机抽样技术的优缺点
(1) 优点 ①随机抽样是从总体中按照随机原则抽取一部分单位进行的 调查。 ②随机抽样技术能够计算调查结果的可靠程度。 (2) 不足 ① 对所有调查样本都给予平等看待,难以体现重点。 ② 抽样范围比较广,所需时间长,参加调查的人员和费用多。 ③ 需要具有一定专业技术的专业人员进行抽样和资料分析。 一般调查人员难以胜任。 ④抽样框难以构建。 ⑤比其他概率抽样精确度低,标准差较大。 30
24
1.简单随机抽样 • 又称纯随机抽样,即对总体单位不进行任何分组 排列,仅按随机原则直接从总体中抽取样本,以 使总体中的每一个单位均有同等的被抽取的机会。
• 这是最基本,最简单的的机率抽样方法。它易于 理解,样本结果可以推断总体,大多数统计推论 方法都假定数据是由简单随机抽样法法获得的。
25
1.简单随机抽样 • 每个单位被选取的机会是相同的。就好像把各个 单位的名字写在大小相同的纸上,放到一个箱子 中,由我们抽取,每个个案都有被抽到的可能, 而且机会相同。如平日常见的摸彩或摇奖,在数 学上则会利用随机数表来抽取样本。
第七章
抽样
1
本章的学习目标 一、抽样的概念
二、抽样的基本过程
三、概率抽样
四、非概率抽样
五、样本量的确定
六、 PPS抽样简介
七、 KISH表的运用
2
一、抽样的概念
3
(一)什么是抽样?
• 抽样就在我们的日常生活中。抽血化验,尝试水 温,窥一斑而知全豹。
• 抽样,就是从研究总体中抽取一部分的过程。 • 抽样调查,就是从研究总体中抽取一部分代表加 以调查研究,然后用所得结果推论和说明总体的 特性。这也称为推论统计。
2.等距抽样
• 又称系统抽样或机械抽样。 • 具体做法: • 1)将总体的所有单位按一定顺序排列起来; • 2)计算抽样间隔R=N/n;

经济统计学第7章抽样调查

经济统计学第7章抽样调查
CHAPTER ONE
参数的假设检验是根据样本,对总体参数某种假设的正确性作出判断。 可以分别提出两种假设: 前一种不能轻易拒绝的假设为原假 设,后一种为备选假设。假设检验就是根据样本,检验 是否成立, 不成立就接受备选假设 。
一、基本思想: 小概率原则:认为在一次实验中 小概率事件几乎是不可能发生的,小概率事件的概率为显著性水平 。
一个总体的检验
Z 检验 (单尾和双尾)
t 检验 (单尾和双尾)
Z 检验 (单尾和双尾)
2检验 (单尾和双尾)
均值
一个总体
比例
方差
总体方差已知时的均值检验 (双尾 Z 检验)
均值的双尾 Z 检验 (2 已知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 原假设为:H0: =0;备择假设为:H1: 0
单侧检验 (原假设与备择假设的确定) 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上
除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为
H0: 1000 H1: < 1000
第二节
一个正态总体参数的假设检验
-10
100
20
25
-5
25
30
30
0
0
离差
40
35
5
25
50
40
10
100
10
25
-5
25
20
30
0
0
30
35
5
25
40
40
10
100
50
45
15

(标准抽样检验)第七章整群抽样

(标准抽样检验)第七章整群抽样

(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。

确切地说,这种抽样组织形式应称为单级整群抽样。

如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。

当诸Mi都相等时,称为等群;否则,称为不等群。

采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。

整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。

如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。

群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。

同分层抽样一样,整群抽样的前提是先要对总体进行分群。

关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。

这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。

而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。

第七章市场调查方式(抽样技术)

第七章市场调查方式(抽样技术)

具体做法: A、抽签法(有重复和不重复抽样两种选择)
先给调查总体的每个单位编号,然后将号码写在卡片上搅拌均匀, 任意从中抽选,抽到一个号码,就对上一个单位,直到抽足预先 规定的项目为止。适用于总体单位较少的情况。
B、乱数表(随机数表)法 优点:完全排除了抽样中主观因素的干扰、简单易行 缺点:在调查总体单位差异小(同质总体)情况下,调查结果 具有代表性,否则会产生较大误差 适用范围:总体单位明确、总体单位数较少、总体各单位间差 异程度较小
14
1
合 计
1 30
50
20
100
第四步:具体抽样 优点:较简单易行、准确度较高;节省费用, 能较快地获得市场信息 缺点:若调查者对调查总体不了解,会产生较 大误差 适用范围:调查者对调查总体了解
(二)随机抽样
严格按随机原则从调查总体中 抽取样本单位的调查方式。
1、简单随机抽样(纯随机抽样)
含义:在总体单位中,不进行任何有目的 的选择,完全按随机原则抽取样本单位 的方式。
具体做法:
第一步:对样本总体进行分类; 第二步:确定每类样本的分配数额; 第三步:编制样本交叉配额分配表; 第四步:具体抽样 仍以上例为例,采用相互控制配额抽样 第一步、第二步(略) 第三步:编制样本交叉配额分配表
高收入 民族 汉 族 回 族 其他民族
中收入
低收入
合计
21 8
35
14 6 0
70 28 2
2、分层随机抽样(类型随机抽样、分类 随机抽样)
( 1 )含义:将总体单位按某一标准(有关标 志)分组,然后在各个类型组中,按随机原 则抽取样本单位的方式。 (2)具体做法: 第一步:选择有关标志对总体进行划分; 第二步:确定各组的样本分配数额 方法:等比例和不等比例 等比例:ni = n× (Ni / N) 不等比例: ni = n×(Ni· Si /∑Ni· S i)

抽样技术-第7章

抽样技术-第7章

h 层方差。

'
当二重抽样比 ' 和 都可以忽略不计时,式(7.4)可简化为:




− −
'
v( )≈ ∑ +' ∑ w'h( - )2

=
=
(7.5)
【例7.1】
某银行要调查其客户的资产情况。已知该银ห้องสมุดไป่ตู้的客户数为
8000,针对客户规模差异较大的特点,拟采用分层抽样。但由
c2h(h=1,2,…,L)。忽略其他费用,则费用函数可以表示为:
L
CT=c1n'+ ∑ c2hnh
h=1
(7.6)
由于 nh 是随机变量,所以选择 n'和 fhD 的期望费用 CT* 为:
CT* =
L
E(CT)=c1n'+n' ∑ c2hfhDWh
(7.7)
h=1
根据式(7.3),总体均值估计量的方差为:

E( )=


是 的无偏估计,即
(7.2)
定理 7.3

V( )的样本估计量为:



− −




v( )= ∑ - ' w' + ' - ∑ w'h( - )2 (7.4)


=
=


v( )是 V( )的近似无偏估计。式中, 是第二重样本第
二重抽样比估计方差的样本估计:

v(yRD )
1 2
1 1
=n sy + n - n'

抽样技术7不等概率抽样

抽样技术7不等概率抽样

M0
M2 0
例 某企业欲估计上季度每位职工的平均病假天数。该 企业共8个分厂,现用不等概整群抽样拟抽取3个分厂, 并以置信度95%计算其置信区间。
分厂编号
职工人数 Mi
累积区间
1
1200
1-1200
2
450
1201-1650
3
2100
1651-3750
4
860
3751-4610
5
2840
4611-7450
17 21
15.00 1045 22*
12.30 220 23
3.86 4600 24 15.80 2370 25
9.00 21.00
940 26 640 27
mi
yi
1.50
10
8.00
80
28.42 13672
9.01 3845
0.75
480
5.00 28.43
311 9284
9.97
842
5.20
放回不等概率抽样对总体特征的估计
三、Hansen-Hurwitz(汉森-郝维茨)估计量及其性质:
样本单元被抽中的概率z1, ,zn ,则对总体总量Y的估计是
YˆHH
1 n
n i 1
yi zi
(1)E(YˆHH ) Y
(2)V (YˆHH )
1 n
N i 1
Zi
(
Yi Zi
Y )2
(3)v(YˆHH )
其中第2、19号被抽中两次
解:根据题中所给资料,n=30,M0=9542, 利用汉森-郝维茨估计量,则有:
YHH
1 n
n 1
yi M 0 zi n

《统计学》第七章(抽样调查)

《统计学》第七章(抽样调查)

20
(1)以99.73%的概率保证程度估计这批茶叶平均每包重量的 范围,以便确定平均重量是否达到规格要求。
第七章 抽样调查
第一节 抽样调查概述 第二节 抽样估计 第三节 抽样的组织形式
1
第一节 抽样调查概述 一、抽样调查的含义
(一)抽样推断的含义 抽样调查是按随机原则,从全部研究对象中抽取一
部分单位进行观察,并根据样本的实际数据,对总体的 数量特征做出具有一定可靠程度的估计和判断,从而达 到对全部研究对象的认识的一种统计方法。其中心问题 是如何根据已知的部分资料来推断未知的总体情况。
(3)抽样总体标准差和抽样总体方差。
说明抽样总体之间标志值变异程度的指标,叫做抽样
总体标准差。抽样总体标准差的平方称为抽样总体方
差(简称样本方差)。其计算公式为:
s
2
xx n
2
s2 x x n
20
一个总体可以抽取许多个样本,而样本不同, 抽样指标的数值也各不相同。可见,抽样指标的数 值不是惟一确定的。因为抽样指标是样本变量的函数, 是随机可变的变量。也就是说,由 样本观测值所决定的 统计量是随机变量。
x=2*60=120
8480~8720
(2) up=3.1%
p=6.2%
68.8%~81.2%
50
例4,某外贸公司出口一种茶叶,规定每包规格不低于150克。 现在用不重复抽样的方法抽取其中1%进行检验,其结果如下:
每包重量 (克)
包数
148~149
10
149~150
20
150~151
50
151~152
21
(三)重复抽样和不重复抽样 1.重复抽样(重置抽样) 采用这种方法抽取样本单位的特点是:同一单位 有多次重复被抽中的机会,并且总体单位数目始 终不变,每个单位抽中或抽不中的机会在各次都 是相同的。

第七章 抽样

第七章 抽样

第七章抽样一、抽样与抽样调查1、抽样:是一种选择调查对象的程序和方法。

2、抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。

3、优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。

二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。

与整体调查(普查)比,抽样调查具有下列优越性。

第一、调查费用低。

抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。

例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。

第二、速度快。

时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。

第三、范围广。

由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。

第四、可获得内容丰富的资料。

普查通常只了解少量项目,无法进行深入分析。

例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。

第五、准确性高。

整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。

4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。

在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。

这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。

对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。

有两个因素可以减少抽样误差。

首先,大样本比小样本产生的误差小。

其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。

抽样方法

  抽样方法

5. 修正的概率抽样
修正的概率抽样是概率抽样与非概 率抽样的结合。主要用于多阶段抽 样,前几个阶段用概率抽样,最后 用非概率抽样,一般是配额抽样。
实用文档
21
二、概率抽样
在需要根据样本的结果对总体进行推断时 应使用概率抽样。
最简单的概率抽样设计是等概率抽样,包 括简单随机抽样和系统抽样。
不等概率抽样比较复杂且大多需要辅助抽 样框信息。不等概率抽样有:概率与大小 成比例的抽样,整群抽样,分层抽样,多 阶段抽样和多相抽样。不等概率抽样通常 用来提高抽样设计方案的效率,或降低抽 样费用。
简单随机抽样的缺点是:
抽样框中即使有现成的辅助信息也不 加利用,使得估计的统计效率较其他 利用辅助信息的样本设计低;
由于样本在总体中的地理分布范围比 较广,如果采用面访,费用较高;有 可能抽到一个“差的”样本;
如果不用计算机,而用随机数表抽一 个大样本将十分单调劳神。
实用文档
31
系统抽样(SYS)
能计算出各个单元的入样概率。从而
无法得到总体目标量的可靠估计值及
其抽样误差估计值。
实用文档
4
非概率抽样能用在下面几个方面的研 究中:
用来形成一种想法; 作为设计开发概率抽样调查的初始步骤; 在后续步骤中帮助理解概率抽样调查结
果。 有时,非概率抽样是唯一可行的选择。
例如,在医学实验中,采用志愿者抽样 可能是取得数据的唯一途径。
其抽样单元是从总体中等距抽出的。 它需要一个抽样间距和一个随机起点。
抽样间距是k=N/n,随机起点r是介 于1到k之间的一个随机数。 被抽中的单元是:r,r十k,r+2k, r+3k,…,r+(n-1)k。
实用文档

第七章 审计抽样

第七章 审计抽样

信赖不足风险和误拒风险可能导致两个结果:一是 信赖不足风险和误拒风险可能导致两个结果: 发表保留的审计意见;二是扩大审计程序, 发表保留的审计意见;二是扩大审计程序,增加审 计工作量。 计工作量。 信赖过度风险和误受风险会导致注册会计师形成错 误的审计结论,提出错误的审计意见, 误的审计结论,提出错误的审计意见,影响审计效 果。 3.抽样风险的控制 3.抽样风险的控制:运用职业判断 抽样风险的控制: 注册会计师在使用统计抽样时可以准确的计量抽样 风险,从而进行控制。 风险,从而进行控制。无论是控制测试还是细节测 试,注册会计师都可以通过扩大样本规模降低抽样 风险。 风险。
第二节 审计抽样的基本步骤
一、样本设计的含义和基本要求
注册会计师运用审计抽样方法时, 注册会计师运用审计抽样方法时,根据测试目标的 需要,围绕样本的性质、样本量、抽样组织方式、 需要,围绕样本的性质、样本量、抽样组织方式、 抽样工作质量等要求所进行的计划工作即样本设计 基本要求: 在设计样本时, 基本要求:①在设计样本时,应当考虑审计程序的 目标和抽样总体的属性; 目标和抽样总体的属性;②应当根据所获取的审计 证据的性质,以及与该审计证据相关的可能的误差 证据的性质, 情况或其它特征,界定误差构成条件和抽样总体; 情况或其它特征,界定误差构成条件和抽样总体; 对总体的预计误差额的评估, ③对总体的预计误差额的评估,有助于设计审计样 本和确定样本规模。 本和确定样本规模。
(三)统计抽样与非统计抽样的选择
注册会计师执行审计测试,既可用统计抽样技术, 注册会计师执行审计测试,既可用统计抽样技术, 也可用非统计抽样技术, 也可用非统计抽样技术,还可结合使用这两种抽样 技术。其选择取决于注册会计师对成本效果的考虑。 技术。其选择取决于注册会计师对成本效果的考虑。 非统计抽样可能比统计抽样花费的成本要小, 非统计抽样可能比统计抽样花费的成本要小,但统 计抽样的效果则可能比非统计抽样要好得多。 计抽样的效果则可能比非统计抽样要好得多。 非统计抽样中,注册会计师凭主观标准和个人经验 非统计抽样中, 来确定样本规模和评价样本结果。 来确定样本规模和评价样本结果。但主要设计得当 也可达到同统计抽样一样的效果。 也可达到同统计抽样一样的效果。 统计抽样和非统计抽样之间的根本区别在于统计抽 样是利用概率法则来控制量化抽样风险。 样是利用概率法则来控制量化抽样风险。

第七章 抽样

第七章 抽样

第七章抽样本章讨论抽样。

对抽样的统计学原理我们不作详细介绍,重点讨论抽样的过程和具体的操作。

抽样是一项非常重要的技术,在自然科学和社会科学的各个领域广泛运用。

自然科学方面包括化学、天文学、机械工程学和动物学等。

在社会科学研究中,抽样技术可用于实验、调查、内容分析等研究。

7.1 抽样原理7.1.1 为什么要抽样抽样是从一大批研究对象中选出一小群作为研究对象,如从20000人中选出150人。

用抽样方法获得的研究对象称为样本(sample)。

研究中用样本作为具体操作对象比用所有对象要经济得多。

然而研究者感兴趣的不仅仅是样本,他的目的是以小见大,希望把从样本得出的结论推广至全体研究对象。

“管中窥豹,可见一斑”。

数学理论和科学研究的实践业已表明,抽样是非常有效的技术。

如果使用正确,两千多个个体的样本,可有效地代表有两亿个成员的研究对象总体,出错的概率不超过百分之二到四。

这种以小见大,以少胜多并非无稽之谈,而是有缜密的统计学原理为依据,并已一再被经验证据所证实。

并非所有样本都可使结论推而广之,抽取样本必须遵守严密的程序,而且从任何样本得出的结论都必须附带说明,表明其局限性。

7.1.2 总体、个体和抽样框架研究者从一大批研究对象中抽取样本。

这些研究对象是一个个的个体(elements),有时称作个案(cases),可以是个人、群体或组织,也可以是信息、文档,甚至是社会行为(如离婚、吸毒、乱扔垃圾)。

这些都是研究者拟测量或可以测量的事物。

拟定研究对象的全体叫做总体(population)或全域(universe)。

总体是抽样的基础,必须严格界定,没有定义清晰的总体就谈不上抽样。

总体有三个要素:内容、范围和时间。

内容即组成总体的个体单位是什么:人、物还是机构等;范围即总体所处的空间界限,包括地理位置;时间即总体存在的时间界限。

表7.1举例说明了抽样的个体单位(人、企业、医院住院人次、商业广告),地理位置和时间界限。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

随机数表法

随机数表法:又称乱数表法,其操作过程如下:先将 总体中的每个个体随机编号,然后从随机数表的任一 位置开始,或向左,或向右,或向上,或向下,或一 定间隔向一个固定方向顺序取数,选定的数字所对应 的单元即入样,重复的数字和没有对应单元的数字去 掉,直至抽足所需样本量为止。要注意的是,所有号 码的位数均应相同。
户转人表(KISH表)

1、确定户编号; 2、确定该户中符合调查对象条件的人数; 3、将符合条件的人按年龄大小的顺序排列; 4、查户转人随机抽样程序表,确定何人为被 调查的对象。
选择 户编号
尾数
1
2
3
4
5
6
7
8
9
0
符合条件数
1
2 3 4 5 6 7 8 9
1
2 1 3 4 5 6 7 8
抽样技术的类型 ★随机抽样与非随机抽样的涵义 ★随机抽样与非随机抽样的适用条件
抽样技术
随机抽样技术 非随机抽样技术 误差的来源
随机抽样技术 ★简单随机抽样 ★分层抽样 ★分群抽样 ★系统抽样 非随机抽样技术 ★便利抽样 ★判断抽样 ★配额抽样 ★滚雪球抽样
误差的来源 ★抽样误差
误差来源 与计算
抽样误差的计算 非抽样误差的计算
抽样技术的类型
抽样技术
随机抽样
简 单 随 机 抽 样 分 层 随 机 抽 样 分 群 随 机 抽 样
非随机抽样
系 统 抽 样
任 意 抽 样
判 断 抽 样ቤተ መጻሕፍቲ ባይዱ
配 额 抽 样
滚 雪 球 抽 样
随机抽样与非随机抽样的含义

随机抽样(probability sampling):也称概 率抽样,就是总体中的每一个体都具有相等的 机会被抽取为样本单位的抽样技术。 非随机抽样(non-probability sampling): 也称非概率抽样,指调研总体中的每一个体被 抽取的机会不平等。
多阶段抽样

对北京市低度白酒市场调查分了三阶段抽样: 第一阶段,在3664个居委会中采用简单随机抽 样法抽取了25个居委会; 第二阶段,在25个居委会中,以11为抽样间距, 采用系统抽样法,抽取1024个居民户; 第三阶段,在每一个居民户中,采用KISH表 (简单随机抽样的一种简便方法)抽取了一名 18周岁以上居民作为调查对象。
抽签法



抽签法的操作:即先把调查总体的每个个体依次编号, 并将这些号码分别标记在相互独立的、完全相同、匀质 物体上,然后将这些物体放入某一容器(如纸盒)搅拌 均匀,然后由调研人员从中任意抽取,将与抽到的号码 相对应的个体作为样本单位,如此重复数次,直到抽足 预定的样本数目为止。由抽中的号码所代表的个体组成 的就是一个简单随机样本。 抽签法的优点:操作简便,但当调查总体单位很多时, 编号的工作量很大,搅拌均匀也比较难以做到。 抽签法往往只适用于总体规模较小的市场调研。
分层随机抽样(stratified sampling)



分层随机抽样:亦称分类抽样或类型抽样,指把调查总体 按照其属性不同分为若干层次或类型,然后在各层或类型 按一定的比例关系随机抽取样本。 注意:(1)分层的标志必须可以把总体分隔为相互排斥 的次层,而层间不能有交叉重叠;(2)分层的标志必须 与关心的总体特征相关;(3)各层之间差异大,但层内 差异小;(4)各层单位数目和比例必须可获得;(5)分 层的层次数量不宜太多;(6)在各层抽取样本的方法依 然是简单随机抽样。 分层随机抽样的类型:通常包括比例分层抽样和非比例分 层抽样。比例分层随机抽样是指按各层的单位数量占总体 单位数量的比例分配各层的样本数量。
★非抽样误差
样本容量 的计算
平均数条件下样本量的计算
谢绝拷贝 成数条件下样本量的计算 宋思根
抽样调查的含义

普查:是对构成总体的每一个体都进行调查,并 从中得出有关总体特征的结论的一种调查方法。

抽样调查:是抽取具有代表性的样本,测算样本 结果,并以样本结果推断总体特征的一种调查方 法。
抽样调查的适用条件
个体编号
即对所确定的调查总体中的个体进行编号。 一般,只有当调查者选择随机抽样技术时,这一 步骤才是必要的,其目的是为了简化抽样工作。 当调查总体规模较大时,编号的工作量会增大, 调查者可能会采用分层抽样或分群抽样来简化编号 工作。
抽选样本

这一过程实施涉及两个方面的内容:
– 一是要明确所采取的抽样方法;
8
2
0
6
5
9
为什么采用分群抽样?


1、缺少基本单位的名单,但以由基本单位组 成的群体有现成的名单或有明显的空间界限时, 分群抽样就显得方便实用。 2、总体各个单位在空间上的分布面很广。 2、抽样调查本身目的的需要。例如人口普查 后的抽样复查。
分群随机抽样与分层随机抽样的区别
比较项目 分层标志 分层随机抽样 与研究的总体特征相关 分群随机抽样 与研究的总体特征无关 各群间同质或差异小
子集间差异 各层之间差异大
子集内个 体差异
抽样方式
层内个体同质或差异小
各群内个体差异大
各层内分别随机抽取适当 随机抽取一个或几个群 个体组成样本 作为样本
系统随机抽样(systematic sampling)

系统随机抽样:又称等距离抽样、间隔抽样、
SYS抽样,指先将总体中的个体按一定标志进
行排列编号,并根据总体单位数和样本单位 数计算出抽样距离,然后按照相同的距离或 间隔选取样本的一种抽样方法。

适用:对于总体单位很多的情形,通常采用随机数表
法来抽样。
随机数表法示例

某大学共有30000(五位数)学生,要求采用随机数表法从 中抽取1000人作为样本进行关于大学生消费态度的调查。首 先,调研人员要将总体中的每个个体从l到30000进行编号; 然后从随机数表的任意一行和任意一列的某一个五位数开 始,按照从左到右的顺序,或者从下到上的顺序,以30000 为标准,对随机数表中依次出现的每个五位数进行取舍: 凡小于或等于30000的编码就选出来,凡大于30000的数以及 已经选出的数字则抛弃。直到选够1000个编码为止;最后按 照所抽取的数码,从总体名单中找到它们所对应的l000个个 体。这l000个个体就构成一个随机样本。
任意抽样(convenience sampling)

任意抽样:也称便利抽样或方便抽样,指调研人 员从工作方便出发,在调研对象范围内随意抽选 一定数量的样本进行调查,通常没有严格的标准。 如在超级市场和车站等进行的街头拦截调查,都 属于任意抽样的范畴。 任意抽样的优点:操作简单、节约时间和费用。 适用:非正式的探索性调研。

适合大总体 费用更低 时效更好 满足特殊要求
抽样调查的步骤
定义调查总体
个体编号 抽选样本 实施调查 测算结果
定义调查总体
定义总体的因素 因素 举例
抽样调查的地域范围——顾客活动的范围,可以是 地理因素 一个国家,一个城市,一个县。 根据调查目的和产品的目标市场,从人口统计的角 人口统计 度确定对调查结果起重大影响的那些个体。如年龄 因素 阶段、收入层次、职业群体等。 对于一些市场调查来说,它们的调查总体通常可以 产品/服务 根据消费者对企业产品或者服务的使用情况来定义 使用情况 ,包括是否使用以及使用频率等。
比例分层抽样

例:根据某产品的销售统计数据,家庭用户总体为4万户, 其中,低收入家庭为1.2万户,中等收入家庭为2万户,高收 入家庭为8千户。为进一步研究该产品用户使用状况,需对 300户进行抽样调查,如采用比例分层抽样,低、中、高收 入家庭用户的样本容量分别为多少?抽样结果如下: 户数(万) 1.2 2 0.8 4 所占比例(%) 30 50 20 100 各层样本容量 90 150 60 300
1
2 2 1 3 4 5 1 6
1
1 3 2 3 6 7 4 2
1
1 2 3 1 2 4 5 7
1
2 1 1 5 3 2 6 4
1
1 2 4 5 6 1 3 9
1
1 3 4 2 1 7 2 1
1
2 1 2 1 4 3 8 5
1
1 2 3 4 3 6 7 3
1
2 3 1 2 5 4 1 6
10
4
3
5
1
第七章 抽样技术
本章学习目标

了解抽样调查的相关概念、过程和适用条件;


理解抽样技术的含义;
掌握抽样技术的种类; 理解非随机抽样和随机抽样的含义和实际应用; 理解抽样误差的来源; 掌握平均数和成数条件下误差和样本量计算方法。
学习导航
抽样调查的含义
抽样调查的 概念与步骤
抽样调查的适用条件 抽样调查的步骤 抽样技术的类型
家庭收入分层 低 中 高 总计
非比例分层抽样

非比例分层抽样:也称最佳抽样法,是指根据其 他因素,如各层的标准差来分配各层所应抽取的 样本数目。这种方法的优点在于可以降低各层的 差异,提高样本的可信度。其计算公式为:
ni n
NS
NiSi
i i

式中,ni:第i层应抽取的样本数目;n:应抽取 的样本总数;Ni:第i层的包含的单位总数;Si: 第i层的标准差。

随机抽样与非随机抽样的适用条件
抉择考虑方面 非随机抽样 随机抽样
研究的性质
误差 变异程度
探索性
非抽样误差大 同质(低)
归纳性
抽样误差大 异质(高)
统计
操作
不利
有利
有利
不利
简单随机抽样(simple random sampling)

相关文档
最新文档