第七章抽样

合集下载

统计学课件-第七章抽样调查

统计学课件-第七章抽样调查

分层抽样特点
03
04
05
适用于总体内部差异较 大的情况,能够提高样 本的代表性。
可以根据各层的具体情 分层抽样能够降低抽样 况采用不同的抽样方法, 误差,提高估计的精度。 灵活性强。
分层标准选择与确定
选择分层标准的原则
各层之间具有明显的 区分度,避免出现重 复或遗漏。
与调查目的密切相关, 能够反映总体内部差 异的标志。
3
灵活性高,可以在不同阶段采用不同的抽样方法 和技术。
多阶段抽样优缺点分析
• 节约成本,减少调查人员和资源的需求。
多阶段抽样优缺点分析
抽样误差可能增加
01
由于多阶段抽样的复杂性,可能导致抽样误差的增加。
对抽样设计的要求较高
02
需要仔细设计和规划每个阶段的抽样方法和样本量分配,以确
保抽样的有效性和代表性。
抽样调查作用
抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料, 因而,也可起到全面调查的作用。
抽样方法与类型
抽样方法
简单随机抽样、系统抽样、分层抽样和整群抽样。
抽样类型
概率抽样和非概率抽样。
抽样误差与置信水平
抽样误差
是指由于随机抽样的偶然因素使样本各单位的结构不足以代 表总体各单位的结构,而引起抽样指标和全局指标的绝对离 差。
成本考虑
当总体差异较大时,简单随机抽样的 精度可能受到影响。
对于大规模调查,简单随机抽样可能 需要较高的成本。
实施难度
在某些情况下,获取完整的抽样框可 能较为困难。
03 分层抽样技术及应用
分层抽样原理及特点
01
02
分层抽样原理:将总体 按照某种特征或标志分 成若干层,然后从每一 层中随机抽取一定数量 的样本,最后将这些样 本合并起来构成总体的 样本。

第七章抽样技术

第七章抽样技术

随机数表法

随机数表法:又称乱数表法,其操作过程如下:先将 总体中的每个个体随机编号,然后从随机数表的任一 位置开始,或向左,或向右,或向上,或向下,或一 定间隔向一个固定方向顺序取数,选定的数字所对应 的单元即入样,重复的数字和没有对应单元的数字去 掉,直至抽足所需样本量为止。要注意的是,所有号 码的位数均应相同。
户转人表(KISH表)

1、确定户编号; 2、确定该户中符合调查对象条件的人数; 3、将符合条件的人按年龄大小的顺序排列; 4、查户转人随机抽样程序表,确定何人为被 调查的对象。
选择 户编号
尾数
1
2
3
4
5
6
7
8
9
0
符合条件数
1
2 3 4 5 6 7 8 9
1
2 1 3 4 5 6 7 8
抽样技术的类型 ★随机抽样与非随机抽样的涵义 ★随机抽样与非随机抽样的适用条件
抽样技术
随机抽样技术 非随机抽样技术 误差的来源
随机抽样技术 ★简单随机抽样 ★分层抽样 ★分群抽样 ★系统抽样 非随机抽样技术 ★便利抽样 ★判断抽样 ★配额抽样 ★滚雪球抽样
误差的来源 ★抽样误差
误差来源 与计算
抽样误差的计算 非抽样误差的计算
抽样技术的类型
抽样技术
随机抽样
简 单 随 机 抽 样 分 层 随 机 抽 样 分 群 随 机 抽 样
非随机抽样
系 统 抽 样
任 意 抽 样
判 断 抽 样ቤተ መጻሕፍቲ ባይዱ
配 额 抽 样
滚 雪 球 抽 样
随机抽样与非随机抽样的含义

随机抽样(probability sampling):也称概 率抽样,就是总体中的每一个体都具有相等的 机会被抽取为样本单位的抽样技术。 非随机抽样(non-probability sampling): 也称非概率抽样,指调研总体中的每一个体被 抽取的机会不平等。

统计学原理第七章 抽样调查

统计学原理第七章 抽样调查
29


x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;

第7章 抽样方法

第7章 抽样方法

分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。

第七章 抽样调查

第七章  抽样调查

数据计算出样本均值(平均耐用时间)
x=1055小时,样本成数(合格率) p=91% 依据样本统计量可以对总体参数进行估 计(估计方法将在第三节介绍)。
六、抽样推断的基本原理
样本指标 1、理论基础: 大数定律 中心极限定理 2、抽样估计的基本要求:
无偏性、有效性、一致性
总体指标
第二节 抽样组织方式
对无限总体不能采用全面调查。
另外,有些产品的质量检查具有破坏性,不可能进行全面调
查,只能采用抽样调查。 从理论上讲,有些现象虽然可以进行全面调查,但实际上没 有必要或很难办到,也要采用抽样调查
抽样调查可以用于工业生产过程的质量控制。
三、抽样推断的内容
(一)参数估计。特点是不知道总体的数量特征,
X
x

2
K
p
P p
K
2
抽样平均数平均误差的计算公式:
采用重复抽样:
x

n
此公式说明,抽样平均误差与总体标准差成正 比,与样本容量成反比。(当总体标准差未知 时,可用样本标准差代替)
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
1 则: x 0.577 3n 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。 抽样单位数增加 0.5倍,即为原来的 1.5倍

则:
1 x 0.8165 1.5n 1.5

即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165 倍。
例:某施工班组5个工人的日工资分别为:34、38、
例:
某厂生产一种新型灯泡共2000只,随机抽出400只作耐 用时间试验,测试结果平均使用寿命为4800小时,样 本标准差为300小时,求抽样推断的平均误差? 已知:

第七章 抽样推断

第七章 抽样推断

x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制

ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n

第7章抽样

第7章抽样
29
随机抽样技术的优缺点
(1) 优点 ①随机抽样是从总体中按照随机原则抽取一部分单位进行的 调查。 ②随机抽样技术能够计算调查结果的可靠程度。 (2) 不足 ① 对所有调查样本都给予平等看待,难以体现重点。 ② 抽样范围比较广,所需时间长,参加调查的人员和费用多。 ③ 需要具有一定专业技术的专业人员进行抽样和资料分析。 一般调查人员难以胜任。 ④抽样框难以构建。 ⑤比其他概率抽样精确度低,标准差较大。 30
24
1.简单随机抽样 • 又称纯随机抽样,即对总体单位不进行任何分组 排列,仅按随机原则直接从总体中抽取样本,以 使总体中的每一个单位均有同等的被抽取的机会。
• 这是最基本,最简单的的机率抽样方法。它易于 理解,样本结果可以推断总体,大多数统计推论 方法都假定数据是由简单随机抽样法法获得的。
25
1.简单随机抽样 • 每个单位被选取的机会是相同的。就好像把各个 单位的名字写在大小相同的纸上,放到一个箱子 中,由我们抽取,每个个案都有被抽到的可能, 而且机会相同。如平日常见的摸彩或摇奖,在数 学上则会利用随机数表来抽取样本。
第七章
抽样
1
本章的学习目标 一、抽样的概念
二、抽样的基本过程
三、概率抽样
四、非概率抽样
五、样本量的确定
六、 PPS抽样简介
七、 KISH表的运用
2
一、抽样的概念
3
(一)什么是抽样?
• 抽样就在我们的日常生活中。抽血化验,尝试水 温,窥一斑而知全豹。
• 抽样,就是从研究总体中抽取一部分的过程。 • 抽样调查,就是从研究总体中抽取一部分代表加 以调查研究,然后用所得结果推论和说明总体的 特性。这也称为推论统计。
2.等距抽样
• 又称系统抽样或机械抽样。 • 具体做法: • 1)将总体的所有单位按一定顺序排列起来; • 2)计算抽样间隔R=N/n;

经济统计学第7章抽样调查

经济统计学第7章抽样调查
CHAPTER ONE
参数的假设检验是根据样本,对总体参数某种假设的正确性作出判断。 可以分别提出两种假设: 前一种不能轻易拒绝的假设为原假 设,后一种为备选假设。假设检验就是根据样本,检验 是否成立, 不成立就接受备选假设 。
一、基本思想: 小概率原则:认为在一次实验中 小概率事件几乎是不可能发生的,小概率事件的概率为显著性水平 。
一个总体的检验
Z 检验 (单尾和双尾)
t 检验 (单尾和双尾)
Z 检验 (单尾和双尾)
2检验 (单尾和双尾)
均值
一个总体
比例
方差
总体方差已知时的均值检验 (双尾 Z 检验)
均值的双尾 Z 检验 (2 已知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 原假设为:H0: =0;备择假设为:H1: 0
单侧检验 (原假设与备择假设的确定) 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上
除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为
H0: 1000 H1: < 1000
第二节
一个正态总体参数的假设检验
-10
100
20
25
-5
25
30
30
0
0
离差
40
35
5
25
50
40
10
100
10
25
-5
25
20
30
0
0
30
35
5
25
40
40
10
100
50
45
15

质量管理07-抽样检验-2008

质量管理07-抽样检验-2008
质量统计技术
2000版ISO9000族标准
第七章 抽样检验方法
质量管理学
. 1.
第一节 抽样检验的基本概念
一、概念
抽样检验 利用所抽取的样本对产品或过程进行 检验。
—— 通过检验所抽取的样本对这批产 品的质量进行估计,以便对这批产品作出 合格与否,能否接收的判断的抽样检验。
质量管理学 .2.
抽样检验适用场合 —— 破坏性检查验收; —— 批量很大; —— 测量对象是流程性材料; ——全数检验不适用成本经济。
质量管理学
.3.
抽样检验特点 —— 对象:一批产品 —— 方法:应用数理统计原理 —— 目的:推断产品批合格与否 —— 缺点:接收批不等于批中每 个产品都是合格品;拒收批不等于批中 全部产品都是不合格品。
质量管理学
.4.
抽样检验分类 —— 计量抽样检验 —— 计数抽样检验 计件抽样检验
计点抽样检验
ISO 2859-1:1999
GB/T 2828.1-20003/ISO 2859-1:1999
质量管理学
.38.
4.GB/T 2828.1-2003的主要特点 (1)主要适用于连续批检验 (2)接收质量限(AQL)
当一个连续批被提交验收抽样时,可允 许的最差过程平均质量水平
AQL用不合格品百分数或每百单位产品 不合格数表示
质量管理学
.36.
3.调整型抽样检验标准发展概况
MIL-STD-105D(1963)(美、英、加三国 联合制订) BS-9001(1963)(英民用工业); DEF-131-A(1963)(英军用工业)
105-GP-1(1963)(加民用工业);
CA-G115(1963)(加军用工业)

第7章抽样检验原理与应用

第7章抽样检验原理与应用
连续生产型
计数~ 抽样检验
计量~
计数标准型~ 计数挑选型~ 计数连续生产型~ 计数调整型~
计量标准型~
计量调整型~
7.2 批质量判断过程
1、一次抽样检验方案 2、二次抽样检验方案 3、多次抽样检验方案 4、序贯抽样检验方案
1、一次抽样检验方案 从批量N中抽取一个样本(n件),检验、 判定批合格与不合格,决定接收或拒收
问题: 百分比抽样是否合理?
• 淮海电器公司生产的三批产品交检,它们都 按10%抽取样本,于是有下列三种抽样方案:
• 第一批批量900件, 则样本90件, c=0 • 第二批批量300件, 则样本30件, c=0 • 第三批批量90件,则样本9件, c=0 • 试问:这三种方案的宽严程度是否一样?
第三次 200
600
3
8
第四次 200
800
5
9
第五次 200
1000
9
10
7.3 抽检特性曲线
1、样本中不合格品出现的概率
• 从批量为N ,不合格品率为P的一批产品中, 随机抽取含量为n的样本,样本中出现的不 合格品数d的概率:
P(d)
C C d nd Np NNp
CN n
• 例:已知N=100,n=10,不合格品率5%, 问:样本中出现d=1时的概率是多少?
为什么?
样本量n=批量N×10%的OC曲线
Nn p c
L(P)
900 90
0.05
0
C
0 90
(0.05)0(0.95)90=0.01
300 30
0.05
0
C
0 30
(0.05)0(0.95)30=0.22
90

第七章 抽样

第七章 抽样

第七章抽样一、抽样与抽样调查1、抽样:是一种选择调查对象的程序和方法。

2、抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。

3、优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。

二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。

与整体调查(普查)比,抽样调查具有下列优越性。

第一、调查费用低。

抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。

例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。

第二、速度快。

时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。

第三、范围广。

由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。

第四、可获得内容丰富的资料。

普查通常只了解少量项目,无法进行深入分析。

例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。

第五、准确性高。

整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。

4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。

在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。

这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。

对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。

有两个因素可以减少抽样误差。

首先,大样本比小样本产生的误差小。

其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。

第七章抽样 审计学原理

第七章抽样 审计学原理
第七章
样本
审计抽样
总体
7.1 审计抽样概述
一、含义 二、分类
任意抽样 判断抽样
非统计抽样
属性抽样
统计抽样
变量抽样 统计抽样中是否需要专业判断?
属性抽样与变量抽样的比较
抽样技术 属性抽样 测试种类 符合性测试 目标 估计总体既定控制的偏差 率(次数) 估计总体总金额或者 总体中的错误金额
变量抽样
实质性测试
审计结论:有95.4%的把握确信1000个应收账款账户 的金额在[ 4 996 004.4 ,5 003 995.6 ]元范围内。
注册会计师在审核某公司应收账款账户时,发现该公 司今年共有4000个明细帐,账面余额为580 000元。审 计人员对该公司应收账款余额进行审查时,选取了500 个明细帐,账面价值共计90 000元。经审查,样本的 真实价值为72 000元。 要求:运用下列各种方法,计算该公司本年度应收账 款真实余额。 (1)均值估计 (2)比率估计 (3)差额估计
五、得到审计结论
属性抽样
查表
变量抽样
计算
属性抽样审计结论:
有 95%
可靠程度
的把握保证被审项目的差错率不 实际精确度上限
超过 7%
变量抽样审计结论:
可靠程度 有 95% 的把握保证被审项目的金额在
20100元至19900元 之间。 精确区间
统计抽样程序
确 定 总 体 确 定 抽 样 规 模 选 取 样 本 审 查 样 本


种类:1.均值估计抽样; 2.差异估计抽样; 3.比率 估计抽样 基本步骤---1、确定测试目的;2、确定总体规模; 3、确定样本量(总体规模、可靠性水平、抽样误 差、预计总体标准差);4、选取样本;5、审查样 本;6、推断总体。 举例说明---

第七章 统计 抽样推断

第七章 统计 抽样推断

与全面调查相比,抽样调查既节省了人力、 物力、财力和时间,又达到了认识总体数量特 征的目的。我国在1994年确立了以周期性普查 为基础,以经常性抽样调查为主体,同时辅之 以重点调查、科学核算等综合运用的统计调查 方法体系。
三、优点:
1、更科学
2、更经济 3、时效性强 4、应用广
四、抽样推断的应用
n AN N!/( N n)!
N
n
不考虑顺序的不重复抽样
不考虑顺序的重复抽样
C
n N
C
n N n1
第三节:点估计和抽样平均误差
人们每时每刻都在做估计。根据婴儿的哭 声估计其冷热和什么时候吃奶、根据望闻问切 来估计病人的病情、根据外表估计一个人的身 高体重、根据前几天的数据估计今天的股市行 情,根据营业数据等估计一个公司的业绩等等。 估计就是根据你拥有的信息来对现实世界进行 某种判断。统计中的估计也不例外,它是完全 根据数据做出的。
x 或p P
1、抽样误差是个概念,只能理解无法计算;
2、抽样误差是个变量,随着样本不同而不同。
问:抽样误差是个变量,那么抽样误差有多少个 变量值?
二、抽样平均误差
• 平均误差
(一)抽样平均误差的定义公式 1、平均数的抽样平均误差
x
(x )
2
所有可能的样本数目
2、成数的抽样平均误差
指样本单位的抽取不受主 观因素及其他系统性因素 的影响,每个总体单位都 有均等的被抽中机会
抽样推断
总体指标:参数
(未知量)
统计推断
样本总体指标:统
计量(已知量)
例1 对湖中鱼产量的估计。 欲了解某湖中鱼的总产量,如果湖中有N条鱼, 平均每条鱼的重量为

第7章抽样调查

第7章抽样调查

二、抽样误差的基本要求
无偏性 一致性 有效性
评价估计量优良性的三个标准:
1、无偏性: 样本统计量的期望值等于被估计 的总体参数。
设 表示总体的待估参数,ˆ 是估计 的样本
统计量,无偏估计指的是ˆ 满足:
E

如:由于 E x X ,所以样本平均数是总体平
x
9.13
n3
2.在不重复抽样下
抽样平均误差
x
2 1 n n N
σ为总体标准差,n为样本单位数,N为总体单位数。
例:从40、50、70、80中抽取3个组成样本,在不重 复抽样下,求抽样平均误差。
求总体标准差,直接用计算器统计功能键可以求出:
X X 2 15.81
N
求抽样平均误差
x
2 N n n N 1
15.812 4 3 5.27 3 41
练习:
1、随机重复抽选某校学生100人,调查他们的体 重得到平均体重为58公斤,标准差为10公斤。问 抽样推断的平均误差是多少?
练习:
1、随机重复抽选某校学生100人,调查他们的体重得到平 均体重为58公斤,标准差为10公斤。问抽样推断的平均误 差是多少?
设它们的平均数为 X,方差为,2 即 Exi ,X u
2 xi 2(i=1,2,…)。则对任意的正数ε,有:
limBiblioteka n p1 n
n i 1
xi
u




1
中心极限定理
正态分布的再生定理:
只要在样本容量n充分大的条件下,不论全 及总体的变量分布是否属于正态分布,其抽样 平均数也趋近正态分布。

第七章 抽样

第七章 抽样

第七章抽样本章讨论抽样。

对抽样的统计学原理我们不作详细介绍,重点讨论抽样的过程和具体的操作。

抽样是一项非常重要的技术,在自然科学和社会科学的各个领域广泛运用。

自然科学方面包括化学、天文学、机械工程学和动物学等。

在社会科学研究中,抽样技术可用于实验、调查、内容分析等研究。

7.1 抽样原理7.1.1 为什么要抽样抽样是从一大批研究对象中选出一小群作为研究对象,如从20000人中选出150人。

用抽样方法获得的研究对象称为样本(sample)。

研究中用样本作为具体操作对象比用所有对象要经济得多。

然而研究者感兴趣的不仅仅是样本,他的目的是以小见大,希望把从样本得出的结论推广至全体研究对象。

“管中窥豹,可见一斑”。

数学理论和科学研究的实践业已表明,抽样是非常有效的技术。

如果使用正确,两千多个个体的样本,可有效地代表有两亿个成员的研究对象总体,出错的概率不超过百分之二到四。

这种以小见大,以少胜多并非无稽之谈,而是有缜密的统计学原理为依据,并已一再被经验证据所证实。

并非所有样本都可使结论推而广之,抽取样本必须遵守严密的程序,而且从任何样本得出的结论都必须附带说明,表明其局限性。

7.1.2 总体、个体和抽样框架研究者从一大批研究对象中抽取样本。

这些研究对象是一个个的个体(elements),有时称作个案(cases),可以是个人、群体或组织,也可以是信息、文档,甚至是社会行为(如离婚、吸毒、乱扔垃圾)。

这些都是研究者拟测量或可以测量的事物。

拟定研究对象的全体叫做总体(population)或全域(universe)。

总体是抽样的基础,必须严格界定,没有定义清晰的总体就谈不上抽样。

总体有三个要素:内容、范围和时间。

内容即组成总体的个体单位是什么:人、物还是机构等;范围即总体所处的空间界限,包括地理位置;时间即总体存在的时间界限。

表7.1举例说明了抽样的个体单位(人、企业、医院住院人次、商业广告),地理位置和时间界限。

第7章 抽样调查及答案

第7章  抽样调查及答案

第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。

它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。

是一种灵活快捷的调查方式。

2.抽样调查有全及总体与样本总体之区分。

样本容量小于30时一般称为小样本。

对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。

样本可能数目与样本容量有关也与抽样的方法有关。

抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。

3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。

正态分布的密度函数有两个重要的参数(σ;x )。

它有对称性、非负性等特点。

中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。

推出了样本分布的标准差为:1--=N n N n x σμ。

4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。

无偏性、一致性和有效性是抽样估计的优良标准。

抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。

抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。

在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。

在通常情况下总体的方差是未知的,一般要用样本的方差来代替。

把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。

μt =∆,用抽样的平均误差来度量抽样的极限误差。

把抽样估计的把握程度称为抽样估计的置信度。

抽样的极限误差越大,抽样估计的置信度也越大。

抽样估计又可区分为点估计和区间估计。

07章抽样调查基础知识

07章抽样调查基础知识


1.14%
n
150
若按不重复抽样方式:
p(1p) n 0.98(10.98) 150
p
(1 )
(1 )1.137%4
nN
150
15000
三、抽样误差的允许范围
(一)抽样极限误差 抽样极限误差也叫允许误差,是指样本指标与
总体指标之间抽样误差的可能范围。
x x X p pP 将上式等价转换为下列不等式:
抽样误差
一、抽样误差的概念 (一)代表性误差
代表性误差是指在抽样调查中,用部分样 本推断总体时,由于样本各单位的结构情况不 足以代表总体状况而产生的误差。
代表性误差有两种:系统误差和随机误差。
1、系统误差是指破坏了抽样的随机原则而产生 的误差。例如有意识的选取好的单位或较差单 位进行调查造成的误差。
4、抽样组织方式(分层抽样误差较小,整群抽 样误差较大)。
二、抽样平均误差的计算 (一)样本平均数的抽样的平均误差
的计算 重复抽样条件下:
不重复抽样条件下:
(二)样本成数的抽样平均误差的计算 重复抽样条件下: 不重复抽样条件下:
(三)总体方差未知时的解决办法 1.用样本方差、成数代替 2.用过去的资料代替 3.用估计值代替 4.用小规模试验性调查资料代替 见书例2.
例:
某灯泡厂从一天所生产的产品10,000个 中抽取100个检查其寿命,得平均寿命为 2000小时,根据以往资料:σ =20小时, 分别按重复抽样和不重复抽样求抽样平 均误差
重复抽样平均误差为:
202 202(小时 )
x 100 100

不重复抽样平均误差为: x

400(1 100 ) 1.99(小时) 100 10000

第七章 抽样调查

第七章 抽样调查

第七章抽样调查一、抽样原理1、定义抽样调查是按照随机原则从被研究对象的总体中(全部研究对象)抽取一部分单位进行调查观察,并运用数理统计的原理,以调查所得的指标(实际观察数值)来推断被研究总体的相应指标达到对总体的认识。

简言之,抽样调查就是从总体中抽取一定数量的样本来推断总体的情况。

2、抽样调查的特点⑴随机原则。

所谓随机原则,就是说在我们所研究的总体中,每一个个案都有被选中、抽取的机会。

也即我们在总体中抽样时,哪一个个案能被抽取,哪一个个案不能被抽取,不是人为主观决定的,而完全是偶然碰机会的。

⑵从数量上推算全体。

抽样调查是抽取部分个案进行调查,但它的主要目的不是为了了解这部分单位本身,而是为了据此从数量上推算全体。

⑶抽样调查使我们有可能用更少的人力、物力、时间、费用达到对总体的认识,而且可以起到丢普查资料进行修正补充,提高大范围调查的准确程度的作用,因而在理论上和方法上都具有重要的意义。

3、几个概念⑴总体也称为母体、一般总体等。

是指具有某种统计特征的一类事物的全部个案。

也即,研究对象的全体称为总体。

例如,某批产品、某类病人、某个生产过程等。

总体的单位数通常用符号N来表示。

⑵个体也称为个案、元素。

组成总体的每个元素称为个体。

有时也称具有某种统计特征的每一个对象为个案构成一个总体的个案,可以是人或物,也可以指个性、心理反应等。

⑶样本也称为抽样总体、样本总体等从总体中抽取一部分代表进行研究分析时,这一部分被抽取的个案称为总体中的一个样本。

也就是说,从总体中抽取的若干个案所组成的群体,称之为样本。

总体是大群体,样本是小群体。

在社会研究中,资料的收集工作往往是在样本中完成的。

样本的单位数(即样本容量)常用符号n来表示。

⑷抽样从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽样样本的过程。

(5)抽样单位就是一次直接的抽样所使用的基本单位。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七章抽样本章讨论抽样。

对抽样的统计学原理我们不作详细介绍,重点讨论抽样的过程和具体的操作。

抽样是一项非常重要的技术,在自然科学和社会科学的各个领域广泛运用。

自然科学方面包括化学、天文学、机械工程学和动物学等。

在社会科学研究中,抽样技术可用于实验、调查、内容分析等研究。

7.1 抽样原理7.1.1 为什么要抽样抽样是从一大批研究对象中选出一小群作为研究对象,如从20000人中选出150人。

用抽样方法获得的研究对象称为样本(sample)。

研究中用样本作为具体操作对象比用所有对象要经济得多。

然而研究者感兴趣的不仅仅是样本,他的目的是以小见大,希望把从样本得出的结论推广至全体研究对象。

“管中窥豹,可见一斑”。

数学理论和科学研究的实践业已表明,抽样是非常有效的技术。

如果使用正确,两千多个个体的样本,可有效地代表有两亿个成员的研究对象总体,出错的概率不超过百分之二到四。

这种以小见大,以少胜多并非无稽之谈,而是有缜密的统计学原理为依据,并已一再被经验证据所证实。

并非所有样本都可使结论推而广之,抽取样本必须遵守严密的程序,而且从任何样本得出的结论都必须附带说明,表明其局限性。

7.1.2 总体、个体和抽样框架研究者从一大批研究对象中抽取样本。

这些研究对象是一个个的个体(elements),有时称作个案(cases),可以是个人、群体或组织,也可以是信息、文档,甚至是社会行为(如离婚、吸毒、乱扔垃圾)。

这些都是研究者拟测量或可以测量的事物。

拟定研究对象的全体叫做总体(population)或全域(universe)。

总体是抽样的基础,必须严格界定,没有定义清晰的总体就谈不上抽样。

总体有三个要素:内容、范围和时间。

内容即组成总体的个体单位是什么:人、物还是机构等;范围即总体所处的空间界限,包括地理位置;时间即总体存在的时间界限。

表7.1举例说明了抽样的个体单位(人、企业、医院住院人次、商业广告),地理位置和时间界限。

表7.1:总体的例子1.所有年满18岁(含)以上、2016年12月31日居住在上海市市内并有上海市居民户口的成年人,不包括被监禁和劳教人员。

2.所有雇员10人以上、2016年6月在深圳市开业的国外独资企业。

3.从2016年7月1日至2017年6月30日期间江苏省所有县级以上医院收住的病人人次。

4.从2017年1月27日至2月2日期间,中央电视台一套节目在晚间7:00到9:00播放的所有的电视广告。

5.全国在1970年8月至1977年8月期间获得大学专本科医学学历目前仍在从医的人员。

6.2016年云南省所有吸食海洛因的人员。

研究者对研究的总体一般先有一个初步的设想(如一个城市所有的人口),然后对具体的总体再作出更为精确的界定。

最后确定的总体称为对象总体(target population)。

样本的大小和对象总体规模之间的比值叫做抽样比例(sampling ratio)。

假如从一个50000人组成的总体中抽出150人的样本。

抽样比例为150/50000=0.003,或百分之0.3。

假如总体是500,抽取的样本是100,抽样比例则是100/500=0.2,或百分之20。

总体实际上是一个抽象的概念。

为什么总体有具体的数字但却把它看作是抽象的呢?因为除了极小的总体,一般的总体是很难确定准确的规模的。

如一个城市的人口,在任何特定的时刻,它的总量总是在发生变化。

有人降生,有人去世,有人坐各种交通工具进入或者离开。

在我国,一地的人口一般指的是具有户籍的常住人口,在有关的时刻正在外地工作生活的人也算在内。

即便有户籍登记为依据,精确地查明瞬时人口的确切数字也几乎是办不到的事情,各种不确定因素很多。

越是大的城市越是如此。

由于总体是抽象的概念,研究者有必要对总体作出估计。

抽象的概念却需要具体的测量,因此有必要给总体下操作定义。

怎样才能使总体具有可操作性呢?研究者应首先设法开列一个名单,尽可能包括总体中所有的个体。

这个名单就是抽样框架(sampling frame)。

抽样框架包括户籍登记(以住户或个人为个体)、企业名册(把企业作为个体)、手机号码(对象总体所有成员都拥有手机)、学校花名册,等等。

在美国,研究者可使用驾驶执照注册资料作为抽样框架,因为美国的成年人几乎人人都开车。

这点在中国目前还做不到。

要获得成功的样本,好的抽样框架十分关键。

抽样框架与概念上界定的总体如不一致就可能产生无效抽样。

因此,糟糕的抽样框架是抽样出错的主要原因。

然而,要找到完美的抽样框架极不容易,更何况有些对象总体根本没有可供参考的清单。

类似学校花名册这样完美的框架并不多。

在美国,有人把电话号码作为抽样框架,然而美国有很多人不愿公布自己家庭的电话号码,而且电话号码每天都在变动,有人搬进或者搬出某一住处。

除非研究对象就是那些在电话簿上登出号码的人,否则电话号码不能作为框架。

对象总体的任何性质或特点称为总体的参数(parameter),如城市居民吸烟人口的百分比、16岁以上妇女的平均身高。

严格说来,总体的参数只有在检测完所有个体的时候才能获得。

但是对于大型的总体(如一个国家的人口),我们永远无法获得绝对精确的参数。

因此研究者只能依靠样本来估计。

研究者根据从样本获取的信息来推断总体的参数。

有关的统计推断技术我们将在第十六章介绍。

有一个典型的例子可说明正确使用抽样技术的重要性。

早年在美国有一家杂志叫做《文粹》(The Literary Digest)。

1920、1924、1928和1932总统大选前,该杂志分别给选民寄去明信片,询问他们选谁当总统。

他们利用汽车注册登记和电话号码簿做抽样框架。

这四次选举该杂志的预测完全正确,杂志的名声因此大振。

1936年,他们将样本扩大至一千万人,调查结果预测兰登将击败福兰克林·罗斯福。

然而最终却是罗斯福获得了压倒性胜利。

这次预测的错误有几个原因,但最主要的问题出在抽样上。

尽管杂志选择了一个很大的样本,可是样本没能准确代表对象总体,即所有的选民。

他们的抽样框架将当时未拥有汽车和电话的选民排除在外。

在30年代的大萧条中,这种人口的比例在美国高达百分之六十五。

当时这些低收入的人拥护罗斯福当总统。

该杂志先前的成功是由于那时低收入和高收入人群在选择总统上没有大的分歧,而且因为不是处在大萧条中,拥有汽车和电话的人口比例比30年代后期要大。

这个例子告诉我们两点。

首先,抽样框架至关重要。

第二,样本的代表性比它的大小更为重要。

据信,一个有代表性的2500人的样本对全美人口所能作出的预测,要高于一个不具代表性的一千万甚至五千万人的样本。

7.2 非概率抽样根据是否按照概率论的随机原则进行操作,抽样可分为两类: 非概率抽样(non-probability sampling)和概率抽样(probability sampling)。

按照概率论原则所做的抽样有强有力的数学理据,较为精确。

不按概率论原则办事的抽样有局限性和缺陷。

研究者选择后者可能是缺乏时间或身处特殊条件之下,抑或缺少随机抽样的知识。

除非万不得已,研究者都应该使用概率抽样。

7.2.1 简便抽样简便抽样(convenience sampling)会产生没有代表性因而根本无效的样本,建议不要采用。

如果图方便省事随意找来一个样本,那么这种样本可能完全不能代表对象总体。

唯一的好处是代价低、速度快,但由此产生的偏差会引起误导,甚至很严重。

电视台记者带着摄像机和话筒在城市大街上随意采访行人就是这方面的一个例子。

这类受访问者不具有代表性。

譬如这类人不包括不常外出和家住农村很少进城的人。

此外,采访的记者往往选择他们认为“合适”的对象进行采访,忽略那些其貌不扬、年岁较大、或者看上去反应迟钝的人。

再如,有的报纸或杂志要求读者剪下调查问卷填好后从邮局寄去。

并非所有的读者都对有关的主题感兴趣、或者有时间去做剪报的事。

那些感兴趣并有时间应答的人数可能不在少数,如多达数千人。

尽管如此,由此得出的结论不可用来推测总体的看法。

类似的调查结果可作参考,但不可当真,因为它反映的只是感兴趣并有时间应答的人群的观点。

7.2.2 配额抽样配额抽样(quota sampling)较随意抽样是一大改进,但它仍然是抽样的弱类型。

在做配额抽样时,研究者首先确定类别,如男性和女性,30岁以下、30岁至60岁、60岁以上,然后决定每个类别抽取多少个体。

每个类别的人数是固定的,如在一个四十人的样本中,30岁以下男女各5名,30至60岁男女各10人,60岁以上男女各5人。

这种做法和随机分组中的配对相似,无法准确代表总体所有的特性。

由于研究者确保样本反映总体成员之间的一些差异,配额抽样优于随意抽样,因为随意抽样获得的样本可能来自同一年龄同一性别或者同一职业。

然而,使用配额抽样的研究者在确定类别和每类人数以后,有可能使用随意的方法选定具体的人选,如采访他最先遇到的5个30岁以下的女性。

这5个女性在某些方面可能非常相似,比如都是大学生,或是一块逛街的同事。

在随意选择各类别的成员时,研究者同样有可能只挑选那些看上去愿意合作、善于言谈的人。

美国著名的盖洛普民意调查结构,曾准确预测了1936、1940、1944三届美国总统选举,但在1948年却没能成功。

其中一个重要原因是配额类别没能准确代表地方和所有的选民。

配额抽样虽然有缺陷,但它比概率抽样经济,省事,速度快。

在概率抽样中,研究者必须准备抽样框架,并且设法找到特定的个人。

这些人有可能找不到,即便能找到,他们也有可能拒绝合作。

7.2.3 目的或判断抽样定量研究一般避免使用随意抽样和配额抽样。

在特殊情况下,可使用目的抽样(purposive or judgmental sampling)。

研究者头脑中带有特殊的目的、或根据专家的判断来选择个体。

这种方法不适用于选择如“普通大学生”或“一般的学校”。

所选的个体是否具有代表性,研究者不得而知。

这种方法通常用于探索性研究和实地研究。

目的抽样适用于三种情形。

第一,用这种方法可选择那些有特点、有信息价值的个体。

例如,研究者打算调查近期杂志中出现的某个文化主题,有必要作内容分析。

他选择某家流行的妇女杂志作为取材对象,因为这家杂志代表时尚和潮流。

第二,用目的抽样可从那些通常难以接触、特殊的人群总体抽取样本,如卖淫嫖娼者或吸毒者。

把所有卖淫者列出名单然后进行随机抽样无法做到。

研究者因此转而利用其他途径,如卖淫者出没的场所和其他知情人,也可依靠当地的派出所,目的都是为了找到尽可能多的调查对象,形成研究用的“样本”。

七十年代美国有个社会学家叫道格拉斯·哈珀(Douglas Harper), 他与流浪汉交朋友,与他们一同住在长途运行的火车上或贫民窟里,用实地考察方法研究流浪汉。

目的抽样的第三种情形是对某些特别的个体做深入的考察。

相关文档
最新文档