第七章 抽样
(抽样检验)第七章整群抽样最全版
(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。
如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。
群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样壹样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。
(抽样检验)第七章整群抽样
第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。
第7章 抽样方法
分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。
第七章抽样
第七章抽样一、抽样与抽样调查抽样:是一种选择调查对象的程序和方法。
抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。
优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。
二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。
与整体调查(普查)比,抽样调查具有下列优越性。
第一、调查费用低。
抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。
例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。
第二、速度快。
时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。
第三、范围广。
由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。
第四、可获得内容丰富的资料。
普查通常只了解少量项目,无法进行深入分析。
例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。
第五、准确性高。
整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。
4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。
在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。
这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。
对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。
有两个因素可以减少抽样误差。
首先,大样本比小样本产生的误差小。
其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。
第七章 抽样推断
x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制
ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n
第7章抽样
随机抽样技术的优缺点
(1) 优点 ①随机抽样是从总体中按照随机原则抽取一部分单位进行的 调查。 ②随机抽样技术能够计算调查结果的可靠程度。 (2) 不足 ① 对所有调查样本都给予平等看待,难以体现重点。 ② 抽样范围比较广,所需时间长,参加调查的人员和费用多。 ③ 需要具有一定专业技术的专业人员进行抽样和资料分析。 一般调查人员难以胜任。 ④抽样框难以构建。 ⑤比其他概率抽样精确度低,标准差较大。 30
24
1.简单随机抽样 • 又称纯随机抽样,即对总体单位不进行任何分组 排列,仅按随机原则直接从总体中抽取样本,以 使总体中的每一个单位均有同等的被抽取的机会。
• 这是最基本,最简单的的机率抽样方法。它易于 理解,样本结果可以推断总体,大多数统计推论 方法都假定数据是由简单随机抽样法法获得的。
25
1.简单随机抽样 • 每个单位被选取的机会是相同的。就好像把各个 单位的名字写在大小相同的纸上,放到一个箱子 中,由我们抽取,每个个案都有被抽到的可能, 而且机会相同。如平日常见的摸彩或摇奖,在数 学上则会利用随机数表来抽取样本。
第七章
抽样
1
本章的学习目标 一、抽样的概念
二、抽样的基本过程
三、概率抽样
四、非概率抽样
五、样本量的确定
六、 PPS抽样简介
七、 KISH表的运用
2
一、抽样的概念
3
(一)什么是抽样?
• 抽样就在我们的日常生活中。抽血化验,尝试水 温,窥一斑而知全豹。
• 抽样,就是从研究总体中抽取一部分的过程。 • 抽样调查,就是从研究总体中抽取一部分代表加 以调查研究,然后用所得结果推论和说明总体的 特性。这也称为推论统计。
2.等距抽样
• 又称系统抽样或机械抽样。 • 具体做法: • 1)将总体的所有单位按一定顺序排列起来; • 2)计算抽样间隔R=N/n;
经济统计学第7章抽样调查
参数的假设检验是根据样本,对总体参数某种假设的正确性作出判断。 可以分别提出两种假设: 前一种不能轻易拒绝的假设为原假 设,后一种为备选假设。假设检验就是根据样本,检验 是否成立, 不成立就接受备选假设 。
一、基本思想: 小概率原则:认为在一次实验中 小概率事件几乎是不可能发生的,小概率事件的概率为显著性水平 。
一个总体的检验
Z 检验 (单尾和双尾)
t 检验 (单尾和双尾)
Z 检验 (单尾和双尾)
2检验 (单尾和双尾)
均值
一个总体
比例
方差
总体方差已知时的均值检验 (双尾 Z 检验)
均值的双尾 Z 检验 (2 已知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 原假设为:H0: =0;备择假设为:H1: 0
单侧检验 (原假设与备择假设的确定) 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上
除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为
H0: 1000 H1: < 1000
第二节
一个正态总体参数的假设检验
-10
100
20
25
-5
25
30
30
0
0
离差
40
35
5
25
50
40
10
100
10
25
-5
25
20
30
0
0
30
35
5
25
40
40
10
100
50
45
15
(标准抽样检验)第七章整群抽样
(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
07章抽样调查基础知识
总 体 指 标 是 指 根 据 总 体 各 单 位 标 志 值 计 算 的 综 合 指 标 , 又 称 为 总 体 参 数 。 常 用 的 总 体 指 标 有 总 体 平 均 数 X, 总
体 成 数 P, 总 体 方 差 ( x2或 p2) 和 标 准 差 ( x或 p) .
样本指标是根据样本各单位标志值计算的综合指标。常 用的样本指标有样本平均数,样本成数p,样本方差(sx2 或sp2)和标准差(sx或sp),其计算方法与总体指标计算 方法相同,只是公式中所用的符号不同。
随机原则是在抽取调查单位时,完全排除人 为的主观因素影响,保证每一个调查单位都 有相等的中选可能的原则。就概率意义而言, 又称为等可能性原则。
抽样调查遵守随机原则的原因:
抽样调查的目的是用样本来推断总体的数 量特征,这就要求抽样的部分单位能够充 分的代表总体。遵守随机原则,可以使样 本结构与总体结构相同,进而可以按概率 理论计算误差,并进行统计推断。
(2)系统随机抽样
系统随机抽样也称为机械随机抽样或等距随 机抽样。它是先将总体中各单位按一定的标 志排队,然后每隔一定的距离抽取一定单位 构成样本。
(3)分层随机抽样
分层随机抽样又称为类型随机抽样、分类随机抽 样。它是按照某一标志,先将总体分成若干组 (类),其中每一组(类)称为一层,再在层内 按简单随机抽样方法进行抽样。
△=tu=2*2=4小时
某玻璃器皿厂某日生产15000只印花 玻璃杯,现从中抽取150只进行质量检 验,结果有147只合格,其余3只为不 合格品,以68.27%的可靠程度,求这 批印花玻璃杯合格率(成数)的极限误 差。按重复抽样
△=tu=1*1.14%=1.14%
参数估计
一、点估计 点估计是直接用一个样本指标估计总体指标的 推断方法。如用样本指标和p直接代替总体指标和 P。特点:方法简便,但可靠程度不高。 二、区间估计 区间估计是在一定的概率保证下,根据点估计 值,联系一定的误差范围估计总体指标值的一种 推断方法。
第7章 抽样调查及答案
第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。
它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。
是一种灵活快捷的调查方式。
2.抽样调查有全及总体与样本总体之区分。
样本容量小于30时一般称为小样本。
对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。
样本可能数目与样本容量有关也与抽样的方法有关。
抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。
3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。
正态分布的密度函数有两个重要的参数(σ;x )。
它有对称性、非负性等特点。
中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。
推出了样本分布的标准差为:1--=N n N n x σμ。
4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。
无偏性、一致性和有效性是抽样估计的优良标准。
抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。
抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。
在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。
在通常情况下总体的方差是未知的,一般要用样本的方差来代替。
把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。
μt =∆,用抽样的平均误差来度量抽样的极限误差。
把抽样估计的把握程度称为抽样估计的置信度。
抽样的极限误差越大,抽样估计的置信度也越大。
抽样估计又可区分为点估计和区间估计。
第7章抽样检验原理与应用
计数~ 抽样检验
计量~
计数标准型~ 计数挑选型~ 计数连续生产型~ 计数调整型~
计量标准型~
计量调整型~
7.2 批质量判断过程
1、一次抽样检验方案 2、二次抽样检验方案 3、多次抽样检验方案 4、序贯抽样检验方案
1、一次抽样检验方案 从批量N中抽取一个样本(n件),检验、 判定批合格与不合格,决定接收或拒收
问题: 百分比抽样是否合理?
• 淮海电器公司生产的三批产品交检,它们都 按10%抽取样本,于是有下列三种抽样方案:
• 第一批批量900件, 则样本90件, c=0 • 第二批批量300件, 则样本30件, c=0 • 第三批批量90件,则样本9件, c=0 • 试问:这三种方案的宽严程度是否一样?
第三次 200
600
3
8
第四次 200
800
5
9
第五次 200
1000
9
10
7.3 抽检特性曲线
1、样本中不合格品出现的概率
• 从批量为N ,不合格品率为P的一批产品中, 随机抽取含量为n的样本,样本中出现的不 合格品数d的概率:
P(d)
C C d nd Np NNp
CN n
• 例:已知N=100,n=10,不合格品率5%, 问:样本中出现d=1时的概率是多少?
为什么?
样本量n=批量N×10%的OC曲线
Nn p c
L(P)
900 90
0.05
0
C
0 90
(0.05)0(0.95)90=0.01
300 30
0.05
0
C
0 30
(0.05)0(0.95)30=0.22
90
《统计学》第七章(抽样调查)
20
(1)以99.73%的概率保证程度估计这批茶叶平均每包重量的 范围,以便确定平均重量是否达到规格要求。
第七章 抽样调查
第一节 抽样调查概述 第二节 抽样估计 第三节 抽样的组织形式
1
第一节 抽样调查概述 一、抽样调查的含义
(一)抽样推断的含义 抽样调查是按随机原则,从全部研究对象中抽取一
部分单位进行观察,并根据样本的实际数据,对总体的 数量特征做出具有一定可靠程度的估计和判断,从而达 到对全部研究对象的认识的一种统计方法。其中心问题 是如何根据已知的部分资料来推断未知的总体情况。
(3)抽样总体标准差和抽样总体方差。
说明抽样总体之间标志值变异程度的指标,叫做抽样
总体标准差。抽样总体标准差的平方称为抽样总体方
差(简称样本方差)。其计算公式为:
s
2
xx n
2
s2 x x n
20
一个总体可以抽取许多个样本,而样本不同, 抽样指标的数值也各不相同。可见,抽样指标的数 值不是惟一确定的。因为抽样指标是样本变量的函数, 是随机可变的变量。也就是说,由 样本观测值所决定的 统计量是随机变量。
x=2*60=120
8480~8720
(2) up=3.1%
p=6.2%
68.8%~81.2%
50
例4,某外贸公司出口一种茶叶,规定每包规格不低于150克。 现在用不重复抽样的方法抽取其中1%进行检验,其结果如下:
每包重量 (克)
包数
148~149
10
149~150
20
150~151
50
151~152
21
(三)重复抽样和不重复抽样 1.重复抽样(重置抽样) 采用这种方法抽取样本单位的特点是:同一单位 有多次重复被抽中的机会,并且总体单位数目始 终不变,每个单位抽中或抽不中的机会在各次都 是相同的。
第七章 抽样
第七章抽样一、抽样与抽样调查1、抽样:是一种选择调查对象的程序和方法。
2、抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。
3、优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。
二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。
与整体调查(普查)比,抽样调查具有下列优越性。
第一、调查费用低。
抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。
例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。
第二、速度快。
时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。
第三、范围广。
由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。
第四、可获得内容丰富的资料。
普查通常只了解少量项目,无法进行深入分析。
例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。
第五、准确性高。
整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。
4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。
在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。
这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。
对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。
有两个因素可以减少抽样误差。
首先,大样本比小样本产生的误差小。
其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。
第七章抽样 审计学原理
样本
审计抽样
总体
7.1 审计抽样概述
一、含义 二、分类
任意抽样 判断抽样
非统计抽样
属性抽样
统计抽样
变量抽样 统计抽样中是否需要专业判断?
属性抽样与变量抽样的比较
抽样技术 属性抽样 测试种类 符合性测试 目标 估计总体既定控制的偏差 率(次数) 估计总体总金额或者 总体中的错误金额
变量抽样
实质性测试
审计结论:有95.4%的把握确信1000个应收账款账户 的金额在[ 4 996 004.4 ,5 003 995.6 ]元范围内。
注册会计师在审核某公司应收账款账户时,发现该公 司今年共有4000个明细帐,账面余额为580 000元。审 计人员对该公司应收账款余额进行审查时,选取了500 个明细帐,账面价值共计90 000元。经审查,样本的 真实价值为72 000元。 要求:运用下列各种方法,计算该公司本年度应收账 款真实余额。 (1)均值估计 (2)比率估计 (3)差额估计
五、得到审计结论
属性抽样
查表
变量抽样
计算
属性抽样审计结论:
有 95%
可靠程度
的把握保证被审项目的差错率不 实际精确度上限
超过 7%
变量抽样审计结论:
可靠程度 有 95% 的把握保证被审项目的金额在
20100元至19900元 之间。 精确区间
统计抽样程序
确 定 总 体 确 定 抽 样 规 模 选 取 样 本 审 查 样 本
种类:1.均值估计抽样; 2.差异估计抽样; 3.比率 估计抽样 基本步骤---1、确定测试目的;2、确定总体规模; 3、确定样本量(总体规模、可靠性水平、抽样误 差、预计总体标准差);4、选取样本;5、审查样 本;6、推断总体。 举例说明---
统计学原理第七章抽样调查
第七章 抽样调查
1
第ห้องสมุดไป่ตู้节 抽样调查的基本概念 及理论依据
一、估计量和估计值 二、全及总体和抽样总体 三、全及指标和样本指标 四、抽样方式和样本可能数目 五、抽样理论依据
2
一、估计量和估计值
►1. 估计量:是指用于估计相关的总体参数的 统计量。样本均值、样本比例(样本成数) 和样本方差都是估计量,估计量是随机的。
►2. 抽样总体(样本):是从全及总体中随机 抽取出来一部分单位的集合体。有大样本和 小样本之分,以30个样本单位为划分依据。
►样本总体是随机的、已知的,常用“n”表示。
4
三、全及指标和样本指标
►(一) 全及指标 ►根据全体总体各个单位的标志值或标志
特征计算的、反映总体某种属性的综合 指标。全及指标也是惟一确定的,但也 是未知的。
13
(二)中心极限定律 ►1. 独立同分布中心极限定理:证明不论变量
总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布. ►2. 德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
xxf2114010057 f 200
样本平均数
灯 泡 P 2 合 0 10 格 7 18 率 9 3 .5 1 % 200 200
第7章抽样调查
二、抽样误差的基本要求
无偏性 一致性 有效性
评价估计量优良性的三个标准:
1、无偏性: 样本统计量的期望值等于被估计 的总体参数。
设 表示总体的待估参数,ˆ 是估计 的样本
统计量,无偏估计指的是ˆ 满足:
E
如:由于 E x X ,所以样本平均数是总体平
x
9.13
n3
2.在不重复抽样下
抽样平均误差
x
2 1 n n N
σ为总体标准差,n为样本单位数,N为总体单位数。
例:从40、50、70、80中抽取3个组成样本,在不重 复抽样下,求抽样平均误差。
求总体标准差,直接用计算器统计功能键可以求出:
X X 2 15.81
N
求抽样平均误差
x
2 N n n N 1
15.812 4 3 5.27 3 41
练习:
1、随机重复抽选某校学生100人,调查他们的体 重得到平均体重为58公斤,标准差为10公斤。问 抽样推断的平均误差是多少?
练习:
1、随机重复抽选某校学生100人,调查他们的体重得到平 均体重为58公斤,标准差为10公斤。问抽样推断的平均误 差是多少?
设它们的平均数为 X,方差为,2 即 Exi ,X u
2 xi 2(i=1,2,…)。则对任意的正数ε,有:
limBiblioteka n p1 n
n i 1
xi
u
1
中心极限定理
正态分布的再生定理:
只要在样本容量n充分大的条件下,不论全 及总体的变量分布是否属于正态分布,其抽样 平均数也趋近正态分布。
第七章 抽样
第七章抽样本章讨论抽样。
对抽样的统计学原理我们不作详细介绍,重点讨论抽样的过程和具体的操作。
抽样是一项非常重要的技术,在自然科学和社会科学的各个领域广泛运用。
自然科学方面包括化学、天文学、机械工程学和动物学等。
在社会科学研究中,抽样技术可用于实验、调查、内容分析等研究。
7.1 抽样原理7.1.1 为什么要抽样抽样是从一大批研究对象中选出一小群作为研究对象,如从20000人中选出150人。
用抽样方法获得的研究对象称为样本(sample)。
研究中用样本作为具体操作对象比用所有对象要经济得多。
然而研究者感兴趣的不仅仅是样本,他的目的是以小见大,希望把从样本得出的结论推广至全体研究对象。
“管中窥豹,可见一斑”。
数学理论和科学研究的实践业已表明,抽样是非常有效的技术。
如果使用正确,两千多个个体的样本,可有效地代表有两亿个成员的研究对象总体,出错的概率不超过百分之二到四。
这种以小见大,以少胜多并非无稽之谈,而是有缜密的统计学原理为依据,并已一再被经验证据所证实。
并非所有样本都可使结论推而广之,抽取样本必须遵守严密的程序,而且从任何样本得出的结论都必须附带说明,表明其局限性。
7.1.2 总体、个体和抽样框架研究者从一大批研究对象中抽取样本。
这些研究对象是一个个的个体(elements),有时称作个案(cases),可以是个人、群体或组织,也可以是信息、文档,甚至是社会行为(如离婚、吸毒、乱扔垃圾)。
这些都是研究者拟测量或可以测量的事物。
拟定研究对象的全体叫做总体(population)或全域(universe)。
总体是抽样的基础,必须严格界定,没有定义清晰的总体就谈不上抽样。
总体有三个要素:内容、范围和时间。
内容即组成总体的个体单位是什么:人、物还是机构等;范围即总体所处的空间界限,包括地理位置;时间即总体存在的时间界限。
表7.1举例说明了抽样的个体单位(人、企业、医院住院人次、商业广告),地理位置和时间界限。
第七章 抽样调查
第七章抽样调查一、抽样原理1、定义抽样调查是按照随机原则从被研究对象的总体中(全部研究对象)抽取一部分单位进行调查观察,并运用数理统计的原理,以调查所得的指标(实际观察数值)来推断被研究总体的相应指标达到对总体的认识。
简言之,抽样调查就是从总体中抽取一定数量的样本来推断总体的情况。
2、抽样调查的特点⑴随机原则。
所谓随机原则,就是说在我们所研究的总体中,每一个个案都有被选中、抽取的机会。
也即我们在总体中抽样时,哪一个个案能被抽取,哪一个个案不能被抽取,不是人为主观决定的,而完全是偶然碰机会的。
⑵从数量上推算全体。
抽样调查是抽取部分个案进行调查,但它的主要目的不是为了了解这部分单位本身,而是为了据此从数量上推算全体。
⑶抽样调查使我们有可能用更少的人力、物力、时间、费用达到对总体的认识,而且可以起到丢普查资料进行修正补充,提高大范围调查的准确程度的作用,因而在理论上和方法上都具有重要的意义。
3、几个概念⑴总体也称为母体、一般总体等。
是指具有某种统计特征的一类事物的全部个案。
也即,研究对象的全体称为总体。
例如,某批产品、某类病人、某个生产过程等。
总体的单位数通常用符号N来表示。
⑵个体也称为个案、元素。
组成总体的每个元素称为个体。
有时也称具有某种统计特征的每一个对象为个案构成一个总体的个案,可以是人或物,也可以指个性、心理反应等。
⑶样本也称为抽样总体、样本总体等从总体中抽取一部分代表进行研究分析时,这一部分被抽取的个案称为总体中的一个样本。
也就是说,从总体中抽取的若干个案所组成的群体,称之为样本。
总体是大群体,样本是小群体。
在社会研究中,资料的收集工作往往是在样本中完成的。
样本的单位数(即样本容量)常用符号n来表示。
⑷抽样从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽样样本的过程。
(5)抽样单位就是一次直接的抽样所使用的基本单位。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3,抽样的类型
简单随机抽样 系统抽样
概率抽样
分层抽样 整群抽样 多段抽样
抽样方法
偶遇抽样 判断抽样
非概率抽样
定额抽样 雪球抽样
二,概率抽样的原则和程序
1,概率抽样的基本原理 社会群体的同质性与异质性 事件的随机性与事件发生的概率的关系 例如: 投掷硬币 放回抽样与不放回抽样
2,抽样的一般程序 (1)界定总体 (2)制定抽样框 (3)决定抽样方案 (4)实际抽取样本 (5)评估样本质量
(4)抽样单位 抽样单位就是一次直接的抽样所使用的 基本单位. (5)抽样框 抽样框也叫抽样范围,是指一次直接抽 样时总体中所有抽样单位的名单.
(6)参数值 参数值也称总体值,它是关于总体中某一 变量的综合描述,或者说是总体中所有 元素的某种特征的综合数量表现. (7)统计值 统计值也称为样本值,它是关于样本中 某一变量的综合描述.或者说是样本中 所有元素的某种特征的综合数量表现 .
第七章Biblioteka 抽 样一,抽样的意义和作用 二,概率抽样的原则和程序 三,概率抽样方法 四,非概率抽样方法 五,样本规模与抽样误差
一,抽样的意义和作用
1,抽样的概念 及其他一些相关概念 (1)总体 总体是构成它的所有元素的集合,而元 素则是构成总体的最基本的单位.
(2)样本 样本就是从总体中按一定方式抽取出的一部分 元素的集合. (3)抽样 抽样是指从组成某个总体的所有元素的集合中, 按一定的方式选择或抽取一部分元素(总体的 一个子集)的过程,或者说,抽样是从总体中 按一定方式选择或抽取样本的过程.
2,判断抽样 (又称立意抽样 )
它是调查者根据研究的目标和自己的主 观的分析来选择和确定调查对象的方法.
3,定额抽样(又称作配额抽样 )
首先研究者要尽可能地依据那些有可能影响研究变量 的各种因素来对总体分层,并找出具有各种不同特征 的成员在总体中所占的比例. 然后依据这种划分以及各类成员的比例去选择调查对 象,使样本中成员在上述各种因素,各种特征方面的 构成和在样本的比例尽量接近总体情形.
3,分层抽样 (又称类型抽样) 它就是先将总体中的所有单位按某种特 征或标志(如性别,年龄,职业或地域 等)划分成若干类型或层次,然后在各 个类型或层次中采用简单随机抽样或系 统抽样的方法抽取一个子样本,最后, 将这些子样本合起来构成总体的样本.
分层抽样的具体步骤如下: (1)按照某一种或几种特征对总体进行 分层. (2)确定在各层中抽取样本单位的数量.
4,滚雪球抽样
当我们无法了解总体情况时,可以从总体中少 数成员入手,对他们进行调查,向他们询问还 知道哪些符合条件的人,再去找那些人并再询 问他们知道的人.如同滚雪球一样,我们可以 找到越来越多具有相同性质的群体成员.
五,样本规模与抽样误差
1,样本规模 样本规模也称为样本容量,它指的是样 本中所含个案的多少.
2,影响样本规模确定的因素
(1)总体的规模; (2)估计的精确性要求; (3)总体的异质性程度; (4)调查者所拥有的经费,人力和时间.
3,样本规模与抽样误差 抽样误差就是用样本统计值去估计总体 参数值时所出现的误差. 度量误差是指在调查,记录,填答,汇 总等工作中所出现的误差. 抽样误差主要取决于总体的分布方差和 抽样规模
2,系统抽样
系统抽样又称等距抽样或机械抽样.它是把总 体的单位进行编号排序后,再计算出某种间隔, 然后按这一固定的间隔抽取个体的号码来组成 样本的方法.
系统抽样的具体步骤是:
(1)将总体中的每一个个体按顺序编上号码,即制定 出抽样框 (2)计算出抽样间距.抽样间距是用总体的规模除以 样本的规模. (3)在最前面的K个个体中,采用简单随机抽样的方 法抽取一个个体作为第一个样本单位记下这个个体的 编号(假设所抽取的这个个体的编号为A),它称作随 机抽样的起点. (4)在抽样框中,以第一个抽中的个体A为起点, 每隔k个个体抽取一个个体. (5)将这n个个体合起来,就构成了该总体的一个样 本.
分层抽样分为按比例分层抽样和不按比例分层 抽样两种.
按比例分层抽样 指按各种类型或层次中的单位数目同总体单位数目间 的比例来抽取子样本的方法,即在单位多的类型或层 次中所抽的子样本就大一些,单位少的类型或层次中 所抽的子样本就小一些. 不按比例分层抽样,即各层之间的抽样比例不等 .
4,整群抽样 (又称聚类抽样) 它是将总体按照某种标准划分为一些子 群体,每个子群体作为一个抽样单位, 用随机的方法从中抽取若干子群,将抽 出的子群中的所有单位合起来作为总体 的样本.
三 概率抽样方法
1,简单随机抽样 简单随机抽样又称纯随机抽样 ,它是按等概率 原则直接从含有N个元素的总体中抽取n个元素 组成样本(N>n) . 例如:抓阄和抽签 在社会调查中的简单随机抽样通常是使用随机 数表进行的.
使用随机数表抽样的具体步骤是:
(1)先取得一份调查总体所有元素的名单(即抽样框); (2)将总体中的所有元素一一按顺序编号; (3)根据总体规模是几位数来确定从随机数表中选几位数码; (4)以总体的规模为标准,对随即数表中的数码逐一进行衡量 并决定取舍; (5)根据样本规模的要求选择出足够的数码个数; (6)依据从随机数表中选出的数码,到抽样框中去找出它所对 应的元素.
5,多段抽样 (又称多级抽样 )
它把抽样的过程分为两个或几个阶段来 进行 . 具体抽样方法是:
先从总体中随机抽取若干大群(组),然后再从 这几个大群(组)内抽取几个小群(组),这样一 层层抽下来,直至抽到最基本的抽样元素为止.
四,非概率抽样方法
1,偶遇抽样 (又称作方便抽样或自然抽样 )
是指研究者根据现实情况,以自己方便的形式 抽取偶然遇到的人作为调查对象,或者仅仅选 择那些离得最近的,最容易找到的人作为调查 对象.
�
(8)置信度
置信度也称为置信水平,它是指总体参数值落在 样本统计值某一区间内的概率,或者说是总体 参数值落在样本统计值某一区间中的把握性程 度.
(9)置信区间 置信区间指的是在一定的置信度下,样 本统计值与总体参数值之间的误差范围.
2,抽样的作用 基本作用是向人们提供一种实现"由部 分认识总体"这一目标的途径和手段 .