第七章 抽样调查

合集下载

第七章 抽样调查技术

第七章 抽样调查技术

13
一、简单随机抽样

(一)具体操作步骤:
第一,对总体的每个单位进行编号,总体单位数 为10,000的总体可编为00 001到期10,000号;

第二,在随机数码表(一般的数理统计书中都有 此表)中从任意一个编号数开始,向上、向下或 跳跃选取编号,在00 001和10,000之间选出200个 (样本单位数);
5
2015/12/22
(二)样本总体


概念: 也称抽样总体(sampled population)或者“子 样”、“样本”,是指从全及总体中抽取出来的 单位集合。 大样本与小样本: 样本总体通常是有限总体,它所包含的的总 体单位数目称为样本容量(通常用英文字母n来表 示)。一般来说,样本单位数达到或者超过30个 称为大样本,而在30个以下的称为小样本。
第二,等距抽样的效率取决于对总体进行 排列时所使用的标志值。在等距抽样中, 调研人员假设总体是有序的。

2015/12/22
23
三、分层抽样

(一)分层抽样的具体步骤 (二)分层抽样的方法 (三)分层指标的选择 (四)分层抽样的优缺点 (五)分层抽样适用的范围
2015/12/22
24

假如我们要进行北京市居民家用电器的拥 有状况调查,采用整群抽样方法,那么, 我们在北京市3,600个居民委员会中随机抽 取20个居委会,这20个居委会中的所有户都 成为我们的调查样本。
2015/12/22
32
(二)采用整群抽样的原因


原因一:当缺少基本单位的名单而难以 直接从总体中抽取所要调查的基本单位。 原因二:即使容易获得个体的抽样框, 但从费用上考虑,直接从个体抽样获得 的样本可能比较分散。 原因三:采用整群抽样是抽样调查本身 目的的需要。 原因四:如果某些总体的各个子总体之 间的差异不大。

(抽样检验)第七章整群抽样

(抽样检验)第七章整群抽样

第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。

确切地说,这种抽样组织形式应称为单级整群抽样。

如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。

当诸Mi都相等时,称为等群;否则,称为不等群。

采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。

整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。

如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。

群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。

同分层抽样一样,整群抽样的前提是先要对总体进行分群。

关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。

这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。

而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。

因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。

《统计学原理》课件第七章抽样调查

《统计学原理》课件第七章抽样调查
4 -6
第二节 抽样调查的基本概念
全及总体(总体) 样本总体(样本)
几组基 本概念
重复抽样 不重复抽样
大数定律 中心极限定理
4 -7
研究对象
抽 取 方 法
重复考虑顺序 不重复不考虑 顺序

究 原
总体分布 样本分布 抽样分布

一、全及总体和样本总体
全及总体:也称总体。指所要认识对象的全体。 用N表示有限总体的单位数,称总体容量。
m
lim p n
n
p
ε
1
贝努大数定律对于抽样调查的意义:
从理论上解释了用频率代替概率的理论依据, 即随着抽样单位数n的增加,事件A发生的频率接近 于事件A发生的概率。
4 - 18
大数定律特点
大数定律论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要依据。 但是:
抽样平均数和总体平均数的离差究竟有多大? 离差的分布状况怎样? 离差不超过一定范围的概率究竟有多少?
(二)抽样成数的抽样平均误差
重复抽样: 不重复抽样:
p
p1 p
n
p
p1 p 1 n
n N
说明:实际应用中,平均数和成数的标准差一般是 未知的,通常采用如下方式解决 (1)用过去调查的资料 (2)样本方差的资料代替总体方差 (3)用小规模调查资料 (4)用估计材料
4 - 30
【进上例行者】测为试合某(1,格灯)平资品泡均料,厂使如计对用下算10时。这00按批0间个质灯:x产量泡品规的进定时x行ff,间寿灯抽命2泡样12检10使平40测0用均0,寿误随1命差0机5在和7(抽小1合0取时格002)率小%样的时本平以
按照随机原则 从调查对象中抽取一部分单位进行 观察,并运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体做出数量上的推断 分析

第7章 抽样方法

第7章 抽样方法

分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。

第七章抽样

第七章抽样

第七章抽样一、抽样与抽样调查抽样:是一种选择调查对象的程序和方法。

抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。

优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。

二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。

与整体调查(普查)比,抽样调查具有下列优越性。

第一、调查费用低。

抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。

例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。

第二、速度快。

时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。

第三、范围广。

由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。

第四、可获得内容丰富的资料。

普查通常只了解少量项目,无法进行深入分析。

例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。

第五、准确性高。

整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。

4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。

在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。

这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。

对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。

有两个因素可以减少抽样误差。

首先,大样本比小样本产生的误差小。

其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。

第七章 抽样调查

第七章  抽样调查

数据计算出样本均值(平均耐用时间)
x=1055小时,样本成数(合格率) p=91% 依据样本统计量可以对总体参数进行估 计(估计方法将在第三节介绍)。
六、抽样推断的基本原理
样本指标 1、理论基础: 大数定律 中心极限定理 2、抽样估计的基本要求:
无偏性、有效性、一致性
总体指标
第二节 抽样组织方式
对无限总体不能采用全面调查。
另外,有些产品的质量检查具有破坏性,不可能进行全面调
查,只能采用抽样调查。 从理论上讲,有些现象虽然可以进行全面调查,但实际上没 有必要或很难办到,也要采用抽样调查
抽样调查可以用于工业生产过程的质量控制。
三、抽样推断的内容
(一)参数估计。特点是不知道总体的数量特征,
X
x

2
K
p
P p
K
2
抽样平均数平均误差的计算公式:
采用重复抽样:
x

n
此公式说明,抽样平均误差与总体标准差成正 比,与样本容量成反比。(当总体标准差未知 时,可用样本标准差代替)
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
1 则: x 0.577 3n 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。 抽样单位数增加 0.5倍,即为原来的 1.5倍

则:
1 x 0.8165 1.5n 1.5

即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165 倍。
例:某施工班组5个工人的日工资分别为:34、38、
例:
某厂生产一种新型灯泡共2000只,随机抽出400只作耐 用时间试验,测试结果平均使用寿命为4800小时,样 本标准差为300小时,求抽样推断的平均误差? 已知:

第7章抽样

第7章抽样
29
随机抽样技术的优缺点
(1) 优点 ①随机抽样是从总体中按照随机原则抽取一部分单位进行的 调查。 ②随机抽样技术能够计算调查结果的可靠程度。 (2) 不足 ① 对所有调查样本都给予平等看待,难以体现重点。 ② 抽样范围比较广,所需时间长,参加调查的人员和费用多。 ③ 需要具有一定专业技术的专业人员进行抽样和资料分析。 一般调查人员难以胜任。 ④抽样框难以构建。 ⑤比其他概率抽样精确度低,标准差较大。 30
24
1.简单随机抽样 • 又称纯随机抽样,即对总体单位不进行任何分组 排列,仅按随机原则直接从总体中抽取样本,以 使总体中的每一个单位均有同等的被抽取的机会。
• 这是最基本,最简单的的机率抽样方法。它易于 理解,样本结果可以推断总体,大多数统计推论 方法都假定数据是由简单随机抽样法法获得的。
25
1.简单随机抽样 • 每个单位被选取的机会是相同的。就好像把各个 单位的名字写在大小相同的纸上,放到一个箱子 中,由我们抽取,每个个案都有被抽到的可能, 而且机会相同。如平日常见的摸彩或摇奖,在数 学上则会利用随机数表来抽取样本。
第七章
抽样
1
本章的学习目标 一、抽样的概念
二、抽样的基本过程
三、概率抽样
四、非概率抽样
五、样本量的确定
六、 PPS抽样简介
七、 KISH表的运用
2
一、抽样的概念
3
(一)什么是抽样?
• 抽样就在我们的日常生活中。抽血化验,尝试水 温,窥一斑而知全豹。
• 抽样,就是从研究总体中抽取一部分的过程。 • 抽样调查,就是从研究总体中抽取一部分代表加 以调查研究,然后用所得结果推论和说明总体的 特性。这也称为推论统计。
2.等距抽样
• 又称系统抽样或机械抽样。 • 具体做法: • 1)将总体的所有单位按一定顺序排列起来; • 2)计算抽样间隔R=N/n;

经济统计学第7章抽样调查

经济统计学第7章抽样调查
经济统计学第7章抽样调查
目录
• 抽样调查概述 • 抽样调查的基本方法 • 样本量的确定 • 抽样误差与推断方法 • 抽样调查的组织与实施
01 抽样调查概述
定义与特点
定义
抽样调查是一种统计学方法,通过对 总体中的一部分进行调查,来推断总 体的特征和规律。
特点
经济高效、快速、准确度高、可操作 性强、误差可控。
THANKS FOR WATCHING
感谢您的观看
准备辅助工具
根据调查需要,准备辅 助工具,如调查表格、 录音设备等。
调查过程的控制
培训调查人员
对调查人员进行培训,确保他们了解调查目 的、问卷内容、抽样方法等。
现场实施
按照抽样计划进行现场调查,确保每个样本 都得到有效的调查。
数据采集
对收集到的数据进行整理、分类和编码,确 保数据的准确性和完整性。
适用于总体内各单位之间存在明显的差异性。
系统抽样
定义
先将总体中的所有单位按一定的顺序排 列,然后按照固定的间隔或系统地抽取
样本单位的方法。
操作方法
首先确定一个合理的起始点,然后按 照固定的间隔依次抽取样本单位。
特点
每隔一个固定数量的单位抽取一个样 本单位,每个样本单位被抽中的概率 都相等。
适用范围
抽样调查的分类
按样本选取方式
随机抽样、分层抽样、系统抽样、整群抽样等。
按样本规模
大样本、中样本、小样本。
按调查目的
探索性调查、描述性调查、因果性调查。
抽样调查的应用场景
01
市场调研
了解市场需求、消费者行为、品牌 知名度等。
质量控制
产品检验、过程控制、质量评估等。
03

(标准抽样检验)第七章整群抽样

(标准抽样检验)第七章整群抽样

(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。

确切地说,这种抽样组织形式应称为单级整群抽样。

如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。

当诸Mi都相等时,称为等群;否则,称为不等群。

采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。

整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。

如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。

群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。

同分层抽样一样,整群抽样的前提是先要对总体进行分群。

关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。

这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。

而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。

第七章市场调查方式(抽样技术)

第七章市场调查方式(抽样技术)

具体做法: A、抽签法(有重复和不重复抽样两种选择)
先给调查总体的每个单位编号,然后将号码写在卡片上搅拌均匀, 任意从中抽选,抽到一个号码,就对上一个单位,直到抽足预先 规定的项目为止。适用于总体单位较少的情况。
B、乱数表(随机数表)法 优点:完全排除了抽样中主观因素的干扰、简单易行 缺点:在调查总体单位差异小(同质总体)情况下,调查结果 具有代表性,否则会产生较大误差 适用范围:总体单位明确、总体单位数较少、总体各单位间差 异程度较小
14
1
合 计
1 30
50
20
100
第四步:具体抽样 优点:较简单易行、准确度较高;节省费用, 能较快地获得市场信息 缺点:若调查者对调查总体不了解,会产生较 大误差 适用范围:调查者对调查总体了解
(二)随机抽样
严格按随机原则从调查总体中 抽取样本单位的调查方式。
1、简单随机抽样(纯随机抽样)
含义:在总体单位中,不进行任何有目的 的选择,完全按随机原则抽取样本单位 的方式。
具体做法:
第一步:对样本总体进行分类; 第二步:确定每类样本的分配数额; 第三步:编制样本交叉配额分配表; 第四步:具体抽样 仍以上例为例,采用相互控制配额抽样 第一步、第二步(略) 第三步:编制样本交叉配额分配表
高收入 民族 汉 族 回 族 其他民族
中收入
低收入
合计
21 8
35
14 6 0
70 28 2
2、分层随机抽样(类型随机抽样、分类 随机抽样)
( 1 )含义:将总体单位按某一标准(有关标 志)分组,然后在各个类型组中,按随机原 则抽取样本单位的方式。 (2)具体做法: 第一步:选择有关标志对总体进行划分; 第二步:确定各组的样本分配数额 方法:等比例和不等比例 等比例:ni = n× (Ni / N) 不等比例: ni = n×(Ni· Si /∑Ni· S i)

《统计学》第七章(抽样调查)

《统计学》第七章(抽样调查)

20
(1)以99.73%的概率保证程度估计这批茶叶平均每包重量的 范围,以便确定平均重量是否达到规格要求。
第七章 抽样调查
第一节 抽样调查概述 第二节 抽样估计 第三节 抽样的组织形式
1
第一节 抽样调查概述 一、抽样调查的含义
(一)抽样推断的含义 抽样调查是按随机原则,从全部研究对象中抽取一
部分单位进行观察,并根据样本的实际数据,对总体的 数量特征做出具有一定可靠程度的估计和判断,从而达 到对全部研究对象的认识的一种统计方法。其中心问题 是如何根据已知的部分资料来推断未知的总体情况。
(3)抽样总体标准差和抽样总体方差。
说明抽样总体之间标志值变异程度的指标,叫做抽样
总体标准差。抽样总体标准差的平方称为抽样总体方
差(简称样本方差)。其计算公式为:
s
2
xx n
2
s2 x x n
20
一个总体可以抽取许多个样本,而样本不同, 抽样指标的数值也各不相同。可见,抽样指标的数 值不是惟一确定的。因为抽样指标是样本变量的函数, 是随机可变的变量。也就是说,由 样本观测值所决定的 统计量是随机变量。
x=2*60=120
8480~8720
(2) up=3.1%
p=6.2%
68.8%~81.2%
50
例4,某外贸公司出口一种茶叶,规定每包规格不低于150克。 现在用不重复抽样的方法抽取其中1%进行检验,其结果如下:
每包重量 (克)
包数
148~149
10
149~150
20
150~151
50
151~152
21
(三)重复抽样和不重复抽样 1.重复抽样(重置抽样) 采用这种方法抽取样本单位的特点是:同一单位 有多次重复被抽中的机会,并且总体单位数目始 终不变,每个单位抽中或抽不中的机会在各次都 是相同的。

第七章 抽样

第七章 抽样

第七章抽样一、抽样与抽样调查1、抽样:是一种选择调查对象的程序和方法。

2、抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。

3、优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。

二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。

与整体调查(普查)比,抽样调查具有下列优越性。

第一、调查费用低。

抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。

例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。

第二、速度快。

时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。

第三、范围广。

由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。

第四、可获得内容丰富的资料。

普查通常只了解少量项目,无法进行深入分析。

例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。

第五、准确性高。

整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。

4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。

在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。

这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。

对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。

有两个因素可以减少抽样误差。

首先,大样本比小样本产生的误差小。

其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。

统计学原理第七章抽样调查

统计学原理第七章抽样调查
只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ►交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ►交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;
第七章 抽样调查
1
第ห้องสมุดไป่ตู้节 抽样调查的基本概念 及理论依据
一、估计量和估计值 二、全及总体和抽样总体 三、全及指标和样本指标 四、抽样方式和样本可能数目 五、抽样理论依据
2
一、估计量和估计值
►1. 估计量:是指用于估计相关的总体参数的 统计量。样本均值、样本比例(样本成数) 和样本方差都是估计量,估计量是随机的。
►2. 抽样总体(样本):是从全及总体中随机 抽取出来一部分单位的集合体。有大样本和 小样本之分,以30个样本单位为划分依据。
►样本总体是随机的、已知的,常用“n”表示。
4
三、全及指标和样本指标
►(一) 全及指标 ►根据全体总体各个单位的标志值或标志
特征计算的、反映总体某种属性的综合 指标。全及指标也是惟一确定的,但也 是未知的。
13
(二)中心极限定律 ►1. 独立同分布中心极限定理:证明不论变量
总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布. ►2. 德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
xxf2114010057 f 200
样本平均数
灯 泡 P 2 合 0 10 格 7 18 率 9 3 .5 1 % 200 200

第7章抽样调查

第7章抽样调查

二、抽样误差的基本要求
无偏性 一致性 有效性
评价估计量优良性的三个标准:
1、无偏性: 样本统计量的期望值等于被估计 的总体参数。
设 表示总体的待估参数,ˆ 是估计 的样本
统计量,无偏估计指的是ˆ 满足:
E

如:由于 E x X ,所以样本平均数是总体平
x
9.13
n3
2.在不重复抽样下
抽样平均误差
x
2 1 n n N
σ为总体标准差,n为样本单位数,N为总体单位数。
例:从40、50、70、80中抽取3个组成样本,在不重 复抽样下,求抽样平均误差。
求总体标准差,直接用计算器统计功能键可以求出:
X X 2 15.81
N
求抽样平均误差
x
2 N n n N 1
15.812 4 3 5.27 3 41
练习:
1、随机重复抽选某校学生100人,调查他们的体 重得到平均体重为58公斤,标准差为10公斤。问 抽样推断的平均误差是多少?
练习:
1、随机重复抽选某校学生100人,调查他们的体重得到平 均体重为58公斤,标准差为10公斤。问抽样推断的平均误 差是多少?
设它们的平均数为 X,方差为,2 即 Exi ,X u
2 xi 2(i=1,2,…)。则对任意的正数ε,有:
limBiblioteka n p1 n
n i 1
xi
u




1
中心极限定理
正态分布的再生定理:
只要在样本容量n充分大的条件下,不论全 及总体的变量分布是否属于正态分布,其抽样 平均数也趋近正态分布。

第7章 抽样调查及答案

第7章  抽样调查及答案

第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。

它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。

是一种灵活快捷的调查方式。

2.抽样调查有全及总体与样本总体之区分。

样本容量小于30时一般称为小样本。

对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。

样本可能数目与样本容量有关也与抽样的方法有关。

抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。

3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。

正态分布的密度函数有两个重要的参数(σ;x )。

它有对称性、非负性等特点。

中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。

推出了样本分布的标准差为:1--=N n N n x σμ。

4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。

无偏性、一致性和有效性是抽样估计的优良标准。

抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。

抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。

在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。

在通常情况下总体的方差是未知的,一般要用样本的方差来代替。

把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。

μt =∆,用抽样的平均误差来度量抽样的极限误差。

把抽样估计的把握程度称为抽样估计的置信度。

抽样的极限误差越大,抽样估计的置信度也越大。

抽样估计又可区分为点估计和区间估计。

07章抽样调查基础知识

07章抽样调查基础知识


1.14%
n
150
若按不重复抽样方式:
p(1p) n 0.98(10.98) 150
p
(1 )
(1 )1.137%4
nN
150
15000
三、抽样误差的允许范围
(一)抽样极限误差 抽样极限误差也叫允许误差,是指样本指标与
总体指标之间抽样误差的可能范围。
x x X p pP 将上式等价转换为下列不等式:
抽样误差
一、抽样误差的概念 (一)代表性误差
代表性误差是指在抽样调查中,用部分样 本推断总体时,由于样本各单位的结构情况不 足以代表总体状况而产生的误差。
代表性误差有两种:系统误差和随机误差。
1、系统误差是指破坏了抽样的随机原则而产生 的误差。例如有意识的选取好的单位或较差单 位进行调查造成的误差。
4、抽样组织方式(分层抽样误差较小,整群抽 样误差较大)。
二、抽样平均误差的计算 (一)样本平均数的抽样的平均误差
的计算 重复抽样条件下:
不重复抽样条件下:
(二)样本成数的抽样平均误差的计算 重复抽样条件下: 不重复抽样条件下:
(三)总体方差未知时的解决办法 1.用样本方差、成数代替 2.用过去的资料代替 3.用估计值代替 4.用小规模试验性调查资料代替 见书例2.
例:
某灯泡厂从一天所生产的产品10,000个 中抽取100个检查其寿命,得平均寿命为 2000小时,根据以往资料:σ =20小时, 分别按重复抽样和不重复抽样求抽样平 均误差
重复抽样平均误差为:
202 202(小时 )
x 100 100

不重复抽样平均误差为: x

400(1 100 ) 1.99(小时) 100 10000

第七章 抽样调查

第七章 抽样调查

第七章抽样调查一、抽样原理1、定义抽样调查是按照随机原则从被研究对象的总体中(全部研究对象)抽取一部分单位进行调查观察,并运用数理统计的原理,以调查所得的指标(实际观察数值)来推断被研究总体的相应指标达到对总体的认识。

简言之,抽样调查就是从总体中抽取一定数量的样本来推断总体的情况。

2、抽样调查的特点⑴随机原则。

所谓随机原则,就是说在我们所研究的总体中,每一个个案都有被选中、抽取的机会。

也即我们在总体中抽样时,哪一个个案能被抽取,哪一个个案不能被抽取,不是人为主观决定的,而完全是偶然碰机会的。

⑵从数量上推算全体。

抽样调查是抽取部分个案进行调查,但它的主要目的不是为了了解这部分单位本身,而是为了据此从数量上推算全体。

⑶抽样调查使我们有可能用更少的人力、物力、时间、费用达到对总体的认识,而且可以起到丢普查资料进行修正补充,提高大范围调查的准确程度的作用,因而在理论上和方法上都具有重要的意义。

3、几个概念⑴总体也称为母体、一般总体等。

是指具有某种统计特征的一类事物的全部个案。

也即,研究对象的全体称为总体。

例如,某批产品、某类病人、某个生产过程等。

总体的单位数通常用符号N来表示。

⑵个体也称为个案、元素。

组成总体的每个元素称为个体。

有时也称具有某种统计特征的每一个对象为个案构成一个总体的个案,可以是人或物,也可以指个性、心理反应等。

⑶样本也称为抽样总体、样本总体等从总体中抽取一部分代表进行研究分析时,这一部分被抽取的个案称为总体中的一个样本。

也就是说,从总体中抽取的若干个案所组成的群体,称之为样本。

总体是大群体,样本是小群体。

在社会研究中,资料的收集工作往往是在样本中完成的。

样本的单位数(即样本容量)常用符号n来表示。

⑷抽样从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽样样本的过程。

(5)抽样单位就是一次直接的抽样所使用的基本单位。

吉珠统计学期末考试重点第7章 抽样及抽样分布

吉珠统计学期末考试重点第7章  抽样及抽样分布

x
时, f (x) 的曲线以 x 轴为渐近线。
第七章 抽样调查
4. 标准正态分布
标准正态分布的概率密度函数为:
1 ( z) e , <z< 2
若随机变量 Z 服从标准正态分布, 则记为 Z~ (0, 1)
z2 2
1. 任何一个一般的正态分布,可通过下面的 线性变换转化为标准正态分布
总体均值的区间估计
(一) 大样本时总体均值的区间估计
第七章 抽样调查
例:某企业生产A产品的工人有1000人, 某日采用不重复抽样从中随机抽取100人调查 他们的当日产量,样本人均产量为35件,产量 的样本标准差为4.5件。请以95.45%的臵信度
估计该日人均产量的臵信区间。
解:①计算抽样平均误差
x 0
x a
第七章 抽样调查
标准差 决定密度函数曲线 f (x) 的陡缓程度.
0.5
1
2
第七章 抽样调查
3. 正态分布密度函数的特点
(1) 对称性。 (2) 非负性。
(3) f (x) 在 X x 时达到极大值 f(x ) 1 2
(4) f (x) 的曲线在 X x 处有拐点。 (5 )当
Z X

x2 2
~ N (0,1)
2. 标准正态分布的概率密度函数
1 ( x) e 2 , x
3. 标准正态分布的分布函数 t2 x x 1 -2 ( x) (t )dt e dt 2
第七章 抽样调查
标准正态分布, 具有如下性质或结论:
③计算抽样极限误差
由 1 ) 0.95 ,查t分布表得, (
t n 1 t 2.5% (9)=2.2622
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例 题 四 解:
已知: N 60000 n 300 n1 6
则:样本合格率 p n n1 300 6 0.98
n
300
p
p1 p 0.98 0.02 0.Biblioteka 08(%)n300
p
p1
p 1
n
n N
0.98 0.02 1
300
0.806(%)
300 60000
=2
1+4 2
=2.5
2+4 2
=3
3+5 = 4 …….. 2
多数样本指标与总体指标都有误差,误差有大、有小,有正、有负,抽 样平均误差就是将所有的误差综合起来,再求其平均数,所以抽样平 均误差是反映抽样误差一般水平的指标。
抽样平均误差的计算理论公式
抽样平均数 的平均误差
x
xX 2
M
抽样成数 平均误差
第五节 抽样单位数目的确定
第五节 抽样单位数目的确定
样本单位数的计算方法: 教材P302-306
通过抽样极限误差公式计算必要的样本单位数。
抽样平均数 抽样成数
重复抽样:
n
t
2
2 x
2x
不重复抽样:
n
t
2
N
2 x
2x N t 2
2 x
n
t 2 p1
2p
p
n
t2 Np1 p N2p t 2 p1
产品质量 x 数量(件) f
合格品 1
N1
不合格品 0
N0
合计
N
平均数
x xf f
1 N1 0 N0 N1 P (成数)
N1 N0
N
(三)样本容量和样本个数
样本容量:一个样本包含的单位数。用 “n”表示。 一般要求 n ≥30
样本个数:从一个全及总体中可能抽取的样本数目。
(四)重复抽样和不重复抽样
例题四: 一批食品罐头共60000桶,随机抽查300桶 ,发现有6桶不合格,求合格品率的抽样平 均误差?
例 题 三 解:
已知: n 400 n1 80 则:样本成数 p n1 80 20%
n 400
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
抽样误差不包括下面两类误差:一类是调查误差, 即在调查过程中由于观察、测量、登记、计算上的差 错而引起的误差;另一类是系统性误差,即由于违反 抽样调查的随机原则,有意抽选较好单位或较坏单位
进行调查,这样造成样本的代表性不足所引起的误差。
二、影响抽样误差大小的因素
1、总体各单位标志值的差异程度 2、样本的单位数 3、抽样方法 4、抽样调查的组织形式
第四节 抽样组织设计
一、简单纯随机抽样
1、含义:按随机原则直接从总体N个单位中
抽取 n 个单位作为样本。
2、样本单位数的计算方法:
通过抽样极限误差公式计算必要的样本单位数。
抽样平均数 抽样成数
重复抽样:
n
t
2
2 x
2x
不重复抽样:
n
t
2
N
2 x
2x N t 2
2 x
n
t 2 p1
2p
p
n
t2 Np1 p N2p t 2 p1
p
p P2
M
(以上两个公式实际上就是第四章讲的标准差。 但反映的是样本指标与总体指标的平均离差程度)
实际上,利用上述两个公式是计算不出抽样平均误差的。
想一想,为什么?
抽样平均数平均误差的实际计算方法
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正比, 与样本容量成反比。(当总体标准差未知时,可 用样本标准差代替)(教材P279例题)
愈低,但抽样估计的精确度愈高。
三、总体参数区间估计的方法
(一)根据给定的概率F(t),推算 抽样极限误差的可能范围
分 析 步 骤:
1、抽取样本,计算样本指标。 2、根据给定的F(t)查表求得概率度 t 。 3、根据概率度和抽样平均误差计算极限误差。 4、计算被估计值的上、下限,对总体参数作
出区间估计。
通过例题可说明以下几点: ①样本平均数的平均数等于总体平均数。
②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例题:假定抽样单位数增加 2 倍、0.5 倍时,抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。
第七章 抽样调查
本章主要内容
•抽样调查的一般问题 •抽样误差 •抽样估计的方法 •抽样组织设计
第一节 抽样调查概述
一、抽样调查的概念:是一种非全面调查,
就是按随机原则从全部研究对象中抽取部分
单位进行观察,并根据这一部分单位的实际 数据推断总体的数量特征,作出具有一定可 靠程度的估计和判断。
二、 特点
它是由部分推断整体的一种认识方法。 建立在随机取样的基础上。 运用概率估计的方法。 其误差可以事先计算并加以控制。
三、有关的基本概念
(一)总 体 和 样 本
总体: 又称全及总体。指所要认识的 研究对象全体。总体单位总数用“N” 表示。
样本: 又称子样。是从全及总体中随机 抽取出来,作为代表这一总体的那 部分单位组成的集合体。样本单位 总数用“n”表示。
某厂生产一种新型灯泡共2000只,随机 抽出400只作耐用时间试验,测试结果 平均使用寿命为4800小时,样本标准差 为300小时,求抽样推断的平均误差?
例题一解: 已知: n=100 x=58
σ=10
则:
x
n
10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
抽样单位数增加 0.5倍,即为原来的 1.5倍
则: x
1.5n
1 0.8165 1.5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。
与重复抽样相比,不重复抽样平均误差是在重复 抽样平均误差的基础上,再乘以 (N-n)(/ N-1) , 而 (N-n)(/ N-1)总是小于1,所以不重复抽样的平
• 习题:有5个工人的日产量分别为(单位: 件):6,8,10,12,14,用重复抽样的方法, 从中随机抽取2个工人的日产量,用以代表这5 个工人的总体水平。则抽样平均误差为多少?
若改用不重复抽样方法,则抽样平均误差为多 少?

解:根据题意可得:X
6
8
10 5
12
14
1(0 件)
(X X)2
40
8(件)
N
5
重复抽样条件下
抽样平均误差 x 8 2(件)
n2
不重复抽样条件下
抽样平均误差
x=
2

N
n )=
n N 1
8( 2
5-2 5-1
)=1.732(件)
抽样成数平均误差的实际计算方法
采用重复抽样:
p
p1 p
n
采用不重复抽样: p
p1
n
p 1
n N
例题三: 某校随机抽选400名学生,发现戴眼镜的学 生有80人。根据样本资料推断全部学生中戴 眼镜的学生所占比重时,抽样误差为多大?
计算结果表明:不重复抽样的平均误差小于重复抽样, 但是“N”的数值越大,则两种方法计算 的抽样平均误差就越接近。
四、抽 样 极 限 误 差
抽样极限误差是指样本和总体指标之间误 差的可能范围。
由于总体指标是一个确定的数,而样本指 标则是围绕总体指标上下波动的,它与总体指 标之间既有正离差,也有负离差,样本指标变 动的上限或下限与总体指标之差的绝对值就可 以表示抽样误差的可能范围,我们将这种以绝 对值形式表示的抽样误差可能范围称为抽样极 限误差。
指标和总体指标的误差不超过一定范 围的概率保证程度(教材P284)
符号表示: P( x - X ≤Δ )x =F(t) (教材P286例题)
理论已经证明,在大样本的情况下,抽 样平均数的分布接近于正态分布,分布特 点是:抽样平均数以总体平均数为中心, 两边完全对称分布,即抽样平均数的正误 差与负误差的可能性是完全相等的。且抽 样平均数愈接近总体平均数,出现的可能 性愈大,概率愈大;反之,抽样平均数愈 离开总体平均数,出现的可能性愈小,概 率愈小,趋于0。(见下图)
p
二、类型抽样
先对总体各单位按主要标志加以分组,然后再从 各组中按随机的原则抽选一定单位构成样本。
三、等距抽样
先按某一标志对总体各单位进行排队,然后依一 定顺序和间隔来抽取样本单位的一种组织形式。
四、整群抽样
将总体各单位划分成许多群,然后从其中随机抽 取部分群,对中选群的所有单位进行全面调查的 抽样组织形式。
正态概率分布图
因为扩大或缩小以后 的平均误差,就是极 限误差: Δ=tμ 所以,抽样平均误 差的系数就是概 率度t。
68.27%
数理统计已经证明,抽样 误差的概率就是概率度的
函数,二者对应的函数 关系已编成“正态分布 概率表”。
95.45%
x-2μ x-1μ X
x+1μ x+2μ
由此可知,误差范围愈大,抽样估计的置信度愈高,但抽样估计 的精确度愈低;反之,误差范围愈小,则抽样估计的置信度
例 题 一:
某农场进行小麦产量抽样调查,小麦播种总面积
为1万亩,采用不重复简单随机抽样,从中抽选了
相关文档
最新文档