第七章 抽样调查技术

合集下载

第7章 抽样方法

第7章 抽样方法

分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。

第七章抽样

第七章抽样

第七章抽样一、抽样与抽样调查抽样:是一种选择调查对象的程序和方法。

抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。

优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。

二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。

与整体调查(普查)比,抽样调查具有下列优越性。

第一、调查费用低。

抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。

例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。

第二、速度快。

时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。

第三、范围广。

由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。

第四、可获得内容丰富的资料。

普查通常只了解少量项目,无法进行深入分析。

例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。

第五、准确性高。

整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。

4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。

在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。

这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。

对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。

有两个因素可以减少抽样误差。

首先,大样本比小样本产生的误差小。

其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。

07第七章等距抽样

07第七章等距抽样
一般,若随机起为i,则抽中的n/2对样本单元的 号码可以表示为
i+2jK,2(j+1)K-i+1] [j=0,1,…,(n/2)-1]]
当n为奇数时,式中的j由0变到(n-1)/2-1为止, 并且,要加上接近末端的第i+(n-1)K个单元。
实际中,为便于对称等距抽样的实施,当N=nK时, 可以将原来由小到大(或由大到小)顺序排列的单 元按照顺逆交替的次序排列在一个表中,这样, 按随机起点等距抽样所抽取的样本即为对称等距 样本。所谓顺逆交替是指在单元的排序中,若第 一间隔由小到大排序,则第二间隔按由大到小排 序,以此类推。
[i+jK,(N-jK)-i+1],[j=0,1,…, (n/2)-1]
当n为奇数时,式中的j由0变到[(n-1)/2]-1为止。 然后,再加上中间一个抽样间隔中的第i+(n1)K/2个单元。(我国抽样调查工作者提出在中间 一个抽样间隔抽取中点处的一个单元。)
五、两端修正法
抽样方法同随机起点等距抽样时的情形。 但在计算总体均值的估计量时,对第一个 和最后一个样本单元加权,其余单元的权 数仍为1(在除以n以前),以矫正由于起点 不在中心位置而引起的系统偏差。
2、按有关标志排序
所谓有关标志排序,即用来对总体单元规 定排列次序的辅助标志,与调查标志具有 共同性质或密切关系。这种排序标志,在 我国抽样调查实践中有广泛应用,如农产 量调查,以本年平均亩产为调查变量,以 往年已知平均亩产作为排序标志。利用这 些辅助标志排序,有利于提高等距抽样的 抽样效果。
法,设i为1~N中的随机数。 (1)若i+(n-1)K≤N,这时n个样本单元不经
过yN,则第1个样本单元和第n个样本单元 的权数分别为:

第7章抽样

第7章抽样
29
随机抽样技术的优缺点
(1) 优点 ①随机抽样是从总体中按照随机原则抽取一部分单位进行的 调查。 ②随机抽样技术能够计算调查结果的可靠程度。 (2) 不足 ① 对所有调查样本都给予平等看待,难以体现重点。 ② 抽样范围比较广,所需时间长,参加调查的人员和费用多。 ③ 需要具有一定专业技术的专业人员进行抽样和资料分析。 一般调查人员难以胜任。 ④抽样框难以构建。 ⑤比其他概率抽样精确度低,标准差较大。 30
24
1.简单随机抽样 • 又称纯随机抽样,即对总体单位不进行任何分组 排列,仅按随机原则直接从总体中抽取样本,以 使总体中的每一个单位均有同等的被抽取的机会。
• 这是最基本,最简单的的机率抽样方法。它易于 理解,样本结果可以推断总体,大多数统计推论 方法都假定数据是由简单随机抽样法法获得的。
25
1.简单随机抽样 • 每个单位被选取的机会是相同的。就好像把各个 单位的名字写在大小相同的纸上,放到一个箱子 中,由我们抽取,每个个案都有被抽到的可能, 而且机会相同。如平日常见的摸彩或摇奖,在数 学上则会利用随机数表来抽取样本。
第七章
抽样
1
本章的学习目标 一、抽样的概念
二、抽样的基本过程
三、概率抽样
四、非概率抽样
五、样本量的确定
六、 PPS抽样简介
七、 KISH表的运用
2
一、抽样的概念
3
(一)什么是抽样?
• 抽样就在我们的日常生活中。抽血化验,尝试水 温,窥一斑而知全豹。
• 抽样,就是从研究总体中抽取一部分的过程。 • 抽样调查,就是从研究总体中抽取一部分代表加 以调查研究,然后用所得结果推论和说明总体的 特性。这也称为推论统计。
2.等距抽样
• 又称系统抽样或机械抽样。 • 具体做法: • 1)将总体的所有单位按一定顺序排列起来; • 2)计算抽样间隔R=N/n;

经济统计学第7章抽样调查

经济统计学第7章抽样调查
CHAPTER ONE
参数的假设检验是根据样本,对总体参数某种假设的正确性作出判断。 可以分别提出两种假设: 前一种不能轻易拒绝的假设为原假 设,后一种为备选假设。假设检验就是根据样本,检验 是否成立, 不成立就接受备选假设 。
一、基本思想: 小概率原则:认为在一次实验中 小概率事件几乎是不可能发生的,小概率事件的概率为显著性水平 。
一个总体的检验
Z 检验 (单尾和双尾)
t 检验 (单尾和双尾)
Z 检验 (单尾和双尾)
2检验 (单尾和双尾)
均值
一个总体
比例
方差
总体方差已知时的均值检验 (双尾 Z 检验)
均值的双尾 Z 检验 (2 已知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 原假设为:H0: =0;备择假设为:H1: 0
单侧检验 (原假设与备择假设的确定) 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上
除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为
H0: 1000 H1: < 1000
第二节
一个正态总体参数的假设检验
-10
100
20
25
-5
25
30
30
0
0
离差
40
35
5
25
50
40
10
100
10
25
-5
25
20
30
0
0
30
35
5
25
40
40
10
100
50
45
15

(标准抽样检验)第七章整群抽样

(标准抽样检验)第七章整群抽样

(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。

确切地说,这种抽样组织形式应称为单级整群抽样。

如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。

当诸Mi都相等时,称为等群;否则,称为不等群。

采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。

整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。

如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。

群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。

同分层抽样一样,整群抽样的前提是先要对总体进行分群。

关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。

这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。

而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。

第七章市场调查方式(抽样技术)

第七章市场调查方式(抽样技术)

具体做法: A、抽签法(有重复和不重复抽样两种选择)
先给调查总体的每个单位编号,然后将号码写在卡片上搅拌均匀, 任意从中抽选,抽到一个号码,就对上一个单位,直到抽足预先 规定的项目为止。适用于总体单位较少的情况。
B、乱数表(随机数表)法 优点:完全排除了抽样中主观因素的干扰、简单易行 缺点:在调查总体单位差异小(同质总体)情况下,调查结果 具有代表性,否则会产生较大误差 适用范围:总体单位明确、总体单位数较少、总体各单位间差 异程度较小
14
1
合 计
1 30
50
20
100
第四步:具体抽样 优点:较简单易行、准确度较高;节省费用, 能较快地获得市场信息 缺点:若调查者对调查总体不了解,会产生较 大误差 适用范围:调查者对调查总体了解
(二)随机抽样
严格按随机原则从调查总体中 抽取样本单位的调查方式。
1、简单随机抽样(纯随机抽样)
含义:在总体单位中,不进行任何有目的 的选择,完全按随机原则抽取样本单位 的方式。
具体做法:
第一步:对样本总体进行分类; 第二步:确定每类样本的分配数额; 第三步:编制样本交叉配额分配表; 第四步:具体抽样 仍以上例为例,采用相互控制配额抽样 第一步、第二步(略) 第三步:编制样本交叉配额分配表
高收入 民族 汉 族 回 族 其他民族
中收入
低收入
合计
21 8
35
14 6 0
70 28 2
2、分层随机抽样(类型随机抽样、分类 随机抽样)
( 1 )含义:将总体单位按某一标准(有关标 志)分组,然后在各个类型组中,按随机原 则抽取样本单位的方式。 (2)具体做法: 第一步:选择有关标志对总体进行划分; 第二步:确定各组的样本分配数额 方法:等比例和不等比例 等比例:ni = n× (Ni / N) 不等比例: ni = n×(Ni· Si /∑Ni· S i)

07章 抽样和参数估计习题及答案

07章 抽样和参数估计习题及答案

第七章 抽样调查1、 抽样调查的目的在于用抽样指标去推断总体指标。

( )2、 不论总体单位数多少都适用抽样调查方法。

( )3、 古典概率是指每次试验中事件等可能出现的条件下,试验前就可计算出来的比率。

( )4、 股票指数在未来的一周内上升可能性的大小指的是主观概率。

( )5、对一个有限总体进行重复抽样,各次抽取的结果是相互独立的。

( )6、对一个无限总体进行不重复抽样,各次抽取的结果是相互独立的。

( )7、抽样极限误差可以大于抽样平均误差,可以小于抽样平均误差,当然也可以等于抽样平均误差。

( )8、对于重复简单随机抽样,若其它条件不变,样本单位数目增加3倍,则样本平均数抽样平均误差将必须减少30%。

( )9、对于重复简单随机抽样,若其它条件不变,要使抽样平均误差减少一半,则抽样单位数目将必须增加1倍。

( )10、抽样误差产生的原因是抽样调查时违反了随机原则。

( ) 11、抽样误差是抽样调查所固有的、无法消除的误差。

( )12、在确定样本单位数目时,若总体成数方差未知,则P 可取0.5。

( )1、 若某一事件出现的概率为1/6,当试验6次时,该事件出现的次数将是()。

1次 大于1次小于1次上述结果均有可能2、 已知一批计算机元件的正品率为80%,现随机抽取n 个样本,其中x 个为正品,则x 的分布服从()。

正态分布二项分布泊松分布超几何分布3、某工厂生产的零件出厂时每200个装一盒,这种零件分为合格与不合格两类,合格率约为99%,设每盒中的不合格数为X ,则X 通常服从( )。

正态分布二项分布泊松分布超几何分布4、 若一个系的学生中有65%是男生,40%是高年级学生。

若随机抽选一人,该学生或是男生或是高年级学生的概率最可能是( )。

0.350.600.80 1.055、 有为朋友从远方来,他乘火车、轮船、汽车、飞机来的概率分别为0.3、0.2、0.1和0.4,如果他乘火车、轮船、汽车来的话,迟到的概率分别为1/4、1/3和1/12,而乘飞机则不会迟到,试求他迟到的概率为( )。

抽样技术7不等概率抽样

抽样技术7不等概率抽样

M0
M2 0
例 某企业欲估计上季度每位职工的平均病假天数。该 企业共8个分厂,现用不等概整群抽样拟抽取3个分厂, 并以置信度95%计算其置信区间。
分厂编号
职工人数 Mi
累积区间
1
1200
1-1200
2
450
1201-1650
3
2100
1651-3750
4
860
3751-4610
5
2840
4611-7450
17 21
15.00 1045 22*
12.30 220 23
3.86 4600 24 15.80 2370 25
9.00 21.00
940 26 640 27
mi
yi
1.50
10
8.00
80
28.42 13672
9.01 3845
0.75
480
5.00 28.43
311 9284
9.97
842
5.20
放回不等概率抽样对总体特征的估计
三、Hansen-Hurwitz(汉森-郝维茨)估计量及其性质:
样本单元被抽中的概率z1, ,zn ,则对总体总量Y的估计是
YˆHH
1 n
n i 1
yi zi
(1)E(YˆHH ) Y
(2)V (YˆHH )
1 n
N i 1
Zi
(
Yi Zi
Y )2
(3)v(YˆHH )
其中第2、19号被抽中两次
解:根据题中所给资料,n=30,M0=9542, 利用汉森-郝维茨估计量,则有:
YHH
1 n
n 1
yi M 0 zi n

第七章 抽样

第七章 抽样

第七章抽样一、抽样与抽样调查1、抽样:是一种选择调查对象的程序和方法。

2、抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。

3、优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。

二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。

与整体调查(普查)比,抽样调查具有下列优越性。

第一、调查费用低。

抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。

例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。

第二、速度快。

时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。

第三、范围广。

由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。

第四、可获得内容丰富的资料。

普查通常只了解少量项目,无法进行深入分析。

例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。

第五、准确性高。

整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。

4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。

在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。

这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。

对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。

有两个因素可以减少抽样误差。

首先,大样本比小样本产生的误差小。

其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。

抽样方法

  抽样方法

5. 修正的概率抽样
修正的概率抽样是概率抽样与非概 率抽样的结合。主要用于多阶段抽 样,前几个阶段用概率抽样,最后 用非概率抽样,一般是配额抽样。
实用文档
21
二、概率抽样
在需要根据样本的结果对总体进行推断时 应使用概率抽样。
最简单的概率抽样设计是等概率抽样,包 括简单随机抽样和系统抽样。
不等概率抽样比较复杂且大多需要辅助抽 样框信息。不等概率抽样有:概率与大小 成比例的抽样,整群抽样,分层抽样,多 阶段抽样和多相抽样。不等概率抽样通常 用来提高抽样设计方案的效率,或降低抽 样费用。
简单随机抽样的缺点是:
抽样框中即使有现成的辅助信息也不 加利用,使得估计的统计效率较其他 利用辅助信息的样本设计低;
由于样本在总体中的地理分布范围比 较广,如果采用面访,费用较高;有 可能抽到一个“差的”样本;
如果不用计算机,而用随机数表抽一 个大样本将十分单调劳神。
实用文档
31
系统抽样(SYS)
能计算出各个单元的入样概率。从而
无法得到总体目标量的可靠估计值及
其抽样误差估计值。
实用文档
4
非概率抽样能用在下面几个方面的研 究中:
用来形成一种想法; 作为设计开发概率抽样调查的初始步骤; 在后续步骤中帮助理解概率抽样调查结
果。 有时,非概率抽样是唯一可行的选择。
例如,在医学实验中,采用志愿者抽样 可能是取得数据的唯一途径。
其抽样单元是从总体中等距抽出的。 它需要一个抽样间距和一个随机起点。
抽样间距是k=N/n,随机起点r是介 于1到k之间的一个随机数。 被抽中的单元是:r,r十k,r+2k, r+3k,…,r+(n-1)k。
实用文档

第7章抽样调查

第7章抽样调查

二、抽样误差的基本要求
无偏性 一致性 有效性
评价估计量优良性的三个标准:
1、无偏性: 样本统计量的期望值等于被估计 的总体参数。
设 表示总体的待估参数,ˆ 是估计 的样本
统计量,无偏估计指的是ˆ 满足:
E

如:由于 E x X ,所以样本平均数是总体平
x
9.13
n3
2.在不重复抽样下
抽样平均误差
x
2 1 n n N
σ为总体标准差,n为样本单位数,N为总体单位数。
例:从40、50、70、80中抽取3个组成样本,在不重 复抽样下,求抽样平均误差。
求总体标准差,直接用计算器统计功能键可以求出:
X X 2 15.81
N
求抽样平均误差
x
2 N n n N 1
15.812 4 3 5.27 3 41
练习:
1、随机重复抽选某校学生100人,调查他们的体 重得到平均体重为58公斤,标准差为10公斤。问 抽样推断的平均误差是多少?
练习:
1、随机重复抽选某校学生100人,调查他们的体重得到平 均体重为58公斤,标准差为10公斤。问抽样推断的平均误 差是多少?
设它们的平均数为 X,方差为,2 即 Exi ,X u
2 xi 2(i=1,2,…)。则对任意的正数ε,有:
limBiblioteka n p1 n
n i 1
xi
u




1
中心极限定理
正态分布的再生定理:
只要在样本容量n充分大的条件下,不论全 及总体的变量分布是否属于正态分布,其抽样 平均数也趋近正态分布。

统计学课件--第七章抽样调查

统计学课件--第七章抽样调查

2. 贝努力大数定律
设m是 n 次独立随机试验中事件A发生(“成功”)的次数, p是事件A在每次试验中发生的概率,则对于任意小的正 数 ε,有
第七章 抽样调查
第二节 总体和样本
三、抽样方法和样本可能数目
(一)抽样方法 1. 重复抽样
重复抽样(sampling with replacement)也叫重
置抽样,是指每次抽取一个单位记录其标志表现 后又放回,重新参加下一次的抽选。
2. 不重复抽样
不重复抽样(sampling without replacement)也叫
二、大数定律及其意义
大数定律是阐述大量随机变量的平均结果具有稳定性的 一系列定律的总称。
1. 独立同分布大数定律
独立随机变量 x1, x2 ,,具有相同分布,且存在有限的
数学期望 X 和方差 2,则对于任意小的正数ε,有
lim
n
P
1 n
n i1
xi
X
1
2021/3/2
17
第七章 抽样调查
第三节 抽样调查的数理基础
第二次
样本均值
5
4
3

5
5
4.5
4
一4
4.5
4
3.5
次 2021/3/2
3
4
3.5
3
15
第七章 抽样调查
第三节 抽样调查的数理基础
重复抽样的样本统计量分布表
x 3 3.5 4 4.5 5 Σ
m 1 2 3219
p 1/9 2/9 3/9 2/9 1/9 1
2021/3/2
16
第七章 抽样调查
第三节 抽样调查的数理基础
1. 重复抽样的样本可能数目(通常为考虑单位排列顺序)

07章抽样调查基础知识

07章抽样调查基础知识


1.14%
n
150
若按不重复抽样方式:
p(1p) n 0.98(10.98) 150
p
(1 )
(1 )1.137%4
nN
150
15000
三、抽样误差的允许范围
(一)抽样极限误差 抽样极限误差也叫允许误差,是指样本指标与
总体指标之间抽样误差的可能范围。
x x X p pP 将上式等价转换为下列不等式:
抽样误差
一、抽样误差的概念 (一)代表性误差
代表性误差是指在抽样调查中,用部分样 本推断总体时,由于样本各单位的结构情况不 足以代表总体状况而产生的误差。
代表性误差有两种:系统误差和随机误差。
1、系统误差是指破坏了抽样的随机原则而产生 的误差。例如有意识的选取好的单位或较差单 位进行调查造成的误差。
4、抽样组织方式(分层抽样误差较小,整群抽 样误差较大)。
二、抽样平均误差的计算 (一)样本平均数的抽样的平均误差
的计算 重复抽样条件下:
不重复抽样条件下:
(二)样本成数的抽样平均误差的计算 重复抽样条件下: 不重复抽样条件下:
(三)总体方差未知时的解决办法 1.用样本方差、成数代替 2.用过去的资料代替 3.用估计值代替 4.用小规模试验性调查资料代替 见书例2.
例:
某灯泡厂从一天所生产的产品10,000个 中抽取100个检查其寿命,得平均寿命为 2000小时,根据以往资料:σ =20小时, 分别按重复抽样和不重复抽样求抽样平 均误差
重复抽样平均误差为:
202 202(小时 )
x 100 100

不重复抽样平均误差为: x

400(1 100 ) 1.99(小时) 100 10000

第七章 抽样调查

第七章 抽样调查

第七章抽样调查一、抽样原理1、定义抽样调查是按照随机原则从被研究对象的总体中(全部研究对象)抽取一部分单位进行调查观察,并运用数理统计的原理,以调查所得的指标(实际观察数值)来推断被研究总体的相应指标达到对总体的认识。

简言之,抽样调查就是从总体中抽取一定数量的样本来推断总体的情况。

2、抽样调查的特点⑴随机原则。

所谓随机原则,就是说在我们所研究的总体中,每一个个案都有被选中、抽取的机会。

也即我们在总体中抽样时,哪一个个案能被抽取,哪一个个案不能被抽取,不是人为主观决定的,而完全是偶然碰机会的。

⑵从数量上推算全体。

抽样调查是抽取部分个案进行调查,但它的主要目的不是为了了解这部分单位本身,而是为了据此从数量上推算全体。

⑶抽样调查使我们有可能用更少的人力、物力、时间、费用达到对总体的认识,而且可以起到丢普查资料进行修正补充,提高大范围调查的准确程度的作用,因而在理论上和方法上都具有重要的意义。

3、几个概念⑴总体也称为母体、一般总体等。

是指具有某种统计特征的一类事物的全部个案。

也即,研究对象的全体称为总体。

例如,某批产品、某类病人、某个生产过程等。

总体的单位数通常用符号N来表示。

⑵个体也称为个案、元素。

组成总体的每个元素称为个体。

有时也称具有某种统计特征的每一个对象为个案构成一个总体的个案,可以是人或物,也可以指个性、心理反应等。

⑶样本也称为抽样总体、样本总体等从总体中抽取一部分代表进行研究分析时,这一部分被抽取的个案称为总体中的一个样本。

也就是说,从总体中抽取的若干个案所组成的群体,称之为样本。

总体是大群体,样本是小群体。

在社会研究中,资料的收集工作往往是在样本中完成的。

样本的单位数(即样本容量)常用符号n来表示。

⑷抽样从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽样样本的过程。

(5)抽样单位就是一次直接的抽样所使用的基本单位。

抽样调查技术

抽样调查技术

学术研究应用案例
总结词
在学术研究中,抽样调查技术被广泛用于 研究各种社会现象和科学问题。
详细描述
例如,一项关于气候变化的研究可能会通 过随机抽样选择一部分气候观测站的数据 进行分析。通过收集和分析这些数据,研 究者可以了解气候变化的趋势和影响因素 ,为政策制定者和科学家提供有价值的研 究成果。
THANKS
对调查过程进行严格的质量控制 ,包括对调查员进行培训、实施 现场督导等措施,以确保数据的 准确性和可靠性。
05
抽样调查技术的应用案例
市场调查应用案例
总结词
在市场调查中,抽样调查技术被广泛应用于了解消费者的需求和行为模式。
详细描述
例如,一家饮料公司想要了解其产品的市场接受程度和销售情况,可以通过对消费者进行随机抽样,然后收集 和分析这些消费者的购买行为数据和反馈意见。通过这种方式,饮料公司可以获得对市场趋势的准确理解,从 而做出更明智的商业决策。
制定抽样方案
确定抽样框
根据调查目的和调查对象的特点,确定合适 的抽样框,即包含所有可能被调查的个体的 名单。
确定样本量
根据抽样框的大小和抽样方法,计算所需的样本量 ,以确保样本的代表性和统计推断的准确性。
制定抽样方案
根据抽样框和样本量,制定具体的抽样方案 ,包括如何选取样本、如何分配样本等。
实施抽样调查
社会调查应用案例
总结词
社会调查中,抽样调查技术被用于研究人口群体的特征和行为。
详细描述
例如,一项关于教育水平与职业发展的研究可能会通过随机抽样选择一部分人口进行调查。通过收集 和分析这些人的教育背景、职业选择和工作满意度等数据,研究者可以了解教育水平与职业发展的关 系,为政策制定者和教育机构提供有价值的参考信息。

第7章-抽样调查PPT课件

第7章-抽样调查PPT课件

是总体平均数:840/12- = 70
22
(二)抽样平均误差的计算
1. 抽样平均误差与抽样的组织方式和抽样方法 有关,这里仅介绍简单随机抽样条件下的重复抽 样和非重复抽样的抽样平均误差的计算。
2.抽样平均误差又分为平均数的抽样平均误差 和成数的抽样平均误差
3.教材311页重复抽样、313页非重复抽样的抽
样平均误差仅是“理论公式”。在实际工作中使
用……
-
23
(三)重复抽样的抽样平均误差
1.平均数的抽样平均误差的计算
2 ,为总体标准
x
n
n
2.成数的抽样平均误差的计算
p
P(1P),P为总体成数
n
-
24
(四)非重复抽样抽样平均误差的计算
1.平均数的抽样平均误差的计算
x
2 1 n ,为总体标准
6.抽样单元
7.抽样比
-
6
(一)全及总体
1.是所要研究对象的全体 2.是客观存在的,由许多性质相同的基本单位
组成的整体,就是统计总体 3.一般用N表示总体中包含的基本单位数,X表
示总体单位的某个数量标志值。 4. 称:N为总体单位总数
X为总体单位标志值 5.总体具有唯一性和确定性
- 这是唯
7
一的
(二)抽样总体
X x,P p
2.没有考虑估计的误差范围和可靠程度
3.这种方法适合于对推断准确程度和可靠程度要 求都不高的统计推断工作
-
35
点估计法
用样本指标
1. 估计总体指

X
x, P
p,
X N X N x 2.
用样本指标 替代总体指
标估计总体
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

13
一、简单随机抽样

(一)具体操作步骤:
第一,对总体的每个单位进行编号,总体单位数 为10,000的总体可编为00 001到期10,000号;

第二,在随机数码表(一般的数理统计书中都有 此表)中从任意一个编号数开始,向上、向下或 跳跃选取编号,在00 001和10,000之间选出200个 (样本单位数);
5
2015/12/22
(二)样本总体


概念: 也称抽样总体(sampled population)或者“子 样”、“样本”,是指从全及总体中抽取出来的 单位集合。 大样本与小样本: 样本总体通常是有限总体,它所包含的的总 体单位数目称为样本容量(通常用英文字母n来表 示)。一般来说,样本单位数达到或者超过30个 称为大样本,而在30个以下的称为小样本。
第二,等距抽样的效率取决于对总体进行 排列时所使用的标志值。在等距抽样中, 调研人员假设总体是有序的。

2015/12/22
23
三、分层抽样

(一)分层抽样的具体步骤 (二)分层抽样的方法 (三)分层指标的选择 (四)分层抽样的优缺点 (五)分层抽样适用的范围
2015/12/22
24

假如我们要进行北京市居民家用电器的拥 有状况调查,采用整群抽样方法,那么, 我们在北京市3,600个居民委员会中随机抽 取20个居委会,这20个居委会中的所有户都 成为我们的调查样本。
2015/12/22
32
(二)采用整群抽样的原因


原因一:当缺少基本单位的名单而难以 直接从总体中抽取所要调查的基本单位。 原因二:即使容易获得个体的抽样框, 但从费用上考虑,直接从个体抽样获得 的样本可能比较分散。 原因三:采用整群抽样是抽样调查本身 目的的需要。 原因四:如果某些总体的各个子总体之 间的差异不大。
20
(三)等距抽样的参数估计
1、估计量
1 ysy yi yij n j 1
n
2015/12/22
21
V ( y sy )
N 1 2 K (n 1) 2 S S wsy N N
2.估计量的方差
N 1 2 K (n 1) 2 V ( ysy ) S S wsy N N


(一)等距抽样法的具体操作 (二)等距抽样的实施办法 (三)等距抽样的参数估计 (四)等距抽样的优缺点
2015/12/22
18
(一)等距抽样法的具体操作


第一步,将N个总体单位按一定顺序排列, 编号为1,2,…N, 第二步,根据总体单位数N和样本单位数n 计算出抽样间隔K(必须是整数),K=N/n; 第三步,在1和K之间随机选一个数字r,称 为随机起点; 第四步,根据r和K从总体中抽取n个样本单 位。
11
2015/12/22
第二节 概率抽样设计样 三、分层抽样 四、整群抽样法 五、多阶段抽样
2015/12/22
12
一、简单随机抽样



(一)简单随机抽样的具体操作 (二)简单随机抽样平均误差 (三)简单随机抽样的方法 (四)简单随机抽样的优缺点
2015/12/22
类别
简单随机 抽样
各自特点
共同点
抽样间的联系
适用范围 总体个数 较少
等距抽样
分层抽样
从总体中逐个抽 (1)抽样过 取 程中每个个 体被抽到的 将总体均分成几 可能性相等 部分,按预先制 (2)每次抽 定的规则在各部 出个体后不 再将它放回, 分抽取 即不放回抽 样 将总体分成几层, 分层进行抽取
其中,
2 S wsy K 1 K (n 1) i 2 ( y y ) ij i j n
为等距样本(群) 内方差
2015/12/22
S
2
为总体方差。
22
(四)等距抽样的优缺点

第一,运用等距抽样的前提是要有总体每 个单位的有关材料,特别是按有关标志排 队时,往往需要有较为详细、具体的相关 资料。
4
2015/12/22
二、全及总体与样本总体


(一)全及总体 概念: 也称目标总体(target population),是由符合研 究目的的所有具有相同性质或特征的个体(individual) 所组成的集合。在抽样调查中,全及总体是抽样推 断的目标。 分类: 全及总体可以根据单位数量是否有限,分为无限 全及总体(infinite population)和有限全及总体 (finite population)。
6
2015/12/22
三、抽样误差

在市场调查中存在两类误差:抽样误差与 非抽样误差。 抽样误差是指在调查中因使用的样本而发 生的样本指标与总体指标之间的差异。

2015/12/22
7
四、抽样框与抽样框误差


(一)抽样框(sampling frame) 1.抽样框的概念 抽样框就是供抽样调查使用的所有调查单位 的名单。这份名单为调查者提供了辨别和联系调 查总体中个体的有效途径。 2.设计抽样框的要点 准确的抽样框包括两个方面:完整性与不重复 性。①完整性是指不遗漏总体中的任意一个个体; ②不重复性是指任意一个个体不能重复列入抽样 框。
16
2015/12/22
(四)简单随机抽样的优缺点

方法简单直观,当总体名单完整时,可直 接从中随机抽取样本,由于抽取概率相同, 计算抽样误差及对总体指标加以推断比较 方便。
尽管简单随机抽样在理论上是最符合随机 原则的,但在实际应用中则有一定的局限 性。

2015/12/22
17
二、等距抽样

第三,在有明确总体单位的数字表中选出符合上 述数字的总体单位,这些总体单位就是样本。
14

2015/12/22
Sx
2
n


n
(二)简单随机抽样平均误差公式
Sx


2
n

n

是抽样单位数
是全及总体标准差;
n

2015/12/22
15
(三)简单随机抽样的方法





1.抽签法 2.随机掷骰子法 3.计算机随机数法 4.随机数表法 5.使用统计软件直接抽取 6.其他方法 7.放回抽样与不放回抽样的比较
2015/12/22
2
第一节 抽样调查的基本概念



一、普查 二、全及总体与样本总体 三、抽样误差 四、抽样框与抽样框误差
2015/12/22
3
一、普查


概念: 普查是指为了某一特定调查目的而专门组织 的一次性全面调查,即为了了解调查对象的基本 情况而一次性地对调查对象中的全部单位逐一进 行登记的调查。 特点: 同其它调查形式相比,涉及面大、调查的内 容和项目比较简单,但所收集的资料全面准确、 可靠、误差比较小。同时,普查需要占用较多的 人力、花费较多的财力和物力才能完成。
35
2015/12/22
(二)二级抽样和分层抽样、整群抽样的比较
名称
一级 二级 精度(样本含 单元 单元 量相同时)
在起始部分时 采用简单随机 抽样
总体个数 较多
分层抽样时采 用简单随机抽 样或等距抽样
总体由差 异明显的 几部分组 成
2015/12/22
30
四、整群抽样法


(一)整群抽样法的具体操作 (二)采用整群抽样的原因 (三)整群抽样需注意的几个问题
2015/12/22
31
(一)整群抽样法的具体操作
2015/12/22
19
(二)等距抽样的实施办法




1.随机起点等距抽样 2.循环等距抽样 3.中点等距抽样 4.对称等距抽样法 (1)塞蒂(Sethi)的方法——两两对称等距抽样。 (2)辛(Singh)等人的修正方法——中心对称等距 抽样。 5.总体有周期性变化时的等距抽样
2015/12/22
(一)分层抽样的具体步骤


第一步,辨明突出的(重要的)人口统计 特征和分类特征,这些特征与所研究的行 为相关。 第二步,确定在每个层次上总体的比例。
2015/12/22
25
(二)分层抽样的方法

例如,我们要在一个有1000名职工的企业中 抽取100名职工。我们以工作岗位为分层指 标,主要分为管理人员、一线工人和后勤 工人三类,已知的情况是管理人员占职工 总数的10%、一线工人占60%、后勤工人占 30%,从而确定了各类人员的样本数为管理 人员10名、一线工人60名、后勤工人30名。 然后,用简单随机抽样的方法对各类人员 进行抽样。
第七章:抽样调查技术


本章教学目的 第一节 抽样调查的基本概念 第二节 概率抽样设计 第三节 非概率抽样 第四节 样本容量的确定
2015/12/22
1
本章教学目的
通过本章学习,了解抽样调查的各项 技术的特点,正确地应用各项技术进行 抽样调查;掌握如何选取样本、样本框, 减少抽样调查的误差,提高抽样调查的 精确度。

2015/12/22 10
3.减少抽样框误差的方法





(1)在抽选样本之前,要对抽样框加以检查,发 现可能存在的问题,进行识别、处理,并采取一 定措施加以补救。 (2)联接遗漏单位法,就是指把抽样样本遗漏的 个体和抽样样本中某个值相联接,其联接规则必 须在调查前明确规定。 4.抽样估计的总体参数 (1)总体和 (2)总体中具有某种特定特征的个体总数或它们 在总体中所占的比例或百分率: (3)总体两个不同指标的总和或均值的比值
相关文档
最新文档