第七章 抽样调查
合集下载
07第七章 抽样调查
• 试验概率:后验概率(事件A在大量的n次试验中出
现m次,则事件A频率m/n可作事件A的概率P(A) 的近似值)
• 主观概率:以个人经验为基础对某一事件发生的可 能性大小作出的估计。
2021/12/31
第七章 抽样调查
13
第十三页,课件共有79页
• 三)概率的基本运算
• 1、 0 P( A) 1. • 2、必然事件的概率为1,不可能事件的概
43
• Gallup预测的选举结果 (59万人)
56
• 选举结果
62
• (注:上述百分比仅用主要政党所得选票计算,选举中约有2%的选票投向小党的候选人)
• (由于选择偏倚和不回答偏倚造成《摘要》的预测差错)
2021/12/31
第七章 抽样调查
9
第九页,课件共有79页
美国1948年的选举
• 候选人
Crossley Gallup
• 常用的总体指标有:总体平均数、总体成 数、总体方差和标准方差。(参数)
2021/12/31
第七章 抽样调查
5
第五页,课件共有79页
• 未知性:总体数据通常是不知道的,参数 是一个未知的常数。
• 如:不知道一批灯泡的合格率,不知道城 市家庭的收入差异,不知道农产品的产量, 这些均需要抽样调查。
2021/12/31
• 3)经济性是指抽样总体的确定应符合成 本效益原则
现m次,则事件A频率m/n可作事件A的概率P(A) 的近似值)
• 主观概率:以个人经验为基础对某一事件发生的可 能性大小作出的估计。
2021/12/31
第七章 抽样调查
13
第十三页,课件共有79页
• 三)概率的基本运算
• 1、 0 P( A) 1. • 2、必然事件的概率为1,不可能事件的概
43
• Gallup预测的选举结果 (59万人)
56
• 选举结果
62
• (注:上述百分比仅用主要政党所得选票计算,选举中约有2%的选票投向小党的候选人)
• (由于选择偏倚和不回答偏倚造成《摘要》的预测差错)
2021/12/31
第七章 抽样调查
9
第九页,课件共有79页
美国1948年的选举
• 候选人
Crossley Gallup
• 常用的总体指标有:总体平均数、总体成 数、总体方差和标准方差。(参数)
2021/12/31
第七章 抽样调查
5
第五页,课件共有79页
• 未知性:总体数据通常是不知道的,参数 是一个未知的常数。
• 如:不知道一批灯泡的合格率,不知道城 市家庭的收入差异,不知道农产品的产量, 这些均需要抽样调查。
2021/12/31
• 3)经济性是指抽样总体的确定应符合成 本效益原则
第七章_抽样调查
式 中: ni为第i层抽出的样本数 ni为第i 为第
Ni为第i Ni为第i层的总单位数 为第 σ i 为第i层的标准差 为第i ci 为第i层每单位的调查费用 为第i n 为总体样本数
例 如( 3): 仍用上例资料, 仍用上例资料,现假设对不同类型书店进 行调查,每调查一家大型书店需要的调查费用 行调查,每调查一家大型书店需要的调查费用 600元 中型书店需要500 500元 为600元,中型书店需要500元,小型书店需要 400元 其他情况不变。按照最低成本抽样法 400元,其他情况不变。按照最低成本抽样法 应从各层中抽取多少家书店进行调查? 应从各层中抽取多少家书店进行调查?
解:(2)分层最佳抽样法 :(2 高收入:60户(40↑) 高收入:60户 40↑) 中等收入: 120 户(120→) 120→) 中等收入: 低收入: 20户(40↓) 低收入: 20户 40↓)
通过计算可以看出,采用分层最佳抽样法,高收 通过计算可以看出,采用分层最佳抽样法, 入者家庭增加了20 20户 低收入家庭减少了20 20户 入者家庭增加了20户,低收入家庭减少了20户, 中收入不变。 中收入不变。 因此, 因此,由于购买力同家庭经济收入关系很大, 因而采用分层最佳抽样方法, 因而采用分层最佳抽样方法,可以增加高收入样 本数,相应减少低收入层的样本数, 本数,相应减少低收入层的样本数,这样使所抽 代表性。 取的样本更具有代表性 取的样本更具有代表性。
Ni为第i Ni为第i层的总单位数 为第 σ i 为第i层的标准差 为第i ci 为第i层每单位的调查费用 为第i n 为总体样本数
例 如( 3): 仍用上例资料, 仍用上例资料,现假设对不同类型书店进 行调查,每调查一家大型书店需要的调查费用 行调查,每调查一家大型书店需要的调查费用 600元 中型书店需要500 500元 为600元,中型书店需要500元,小型书店需要 400元 其他情况不变。按照最低成本抽样法 400元,其他情况不变。按照最低成本抽样法 应从各层中抽取多少家书店进行调查? 应从各层中抽取多少家书店进行调查?
解:(2)分层最佳抽样法 :(2 高收入:60户(40↑) 高收入:60户 40↑) 中等收入: 120 户(120→) 120→) 中等收入: 低收入: 20户(40↓) 低收入: 20户 40↓)
通过计算可以看出,采用分层最佳抽样法,高收 通过计算可以看出,采用分层最佳抽样法, 入者家庭增加了20 20户 低收入家庭减少了20 20户 入者家庭增加了20户,低收入家庭减少了20户, 中收入不变。 中收入不变。 因此, 因此,由于购买力同家庭经济收入关系很大, 因而采用分层最佳抽样方法, 因而采用分层最佳抽样方法,可以增加高收入样 本数,相应减少低收入层的样本数, 本数,相应减少低收入层的样本数,这样使所抽 代表性。 取的样本更具有代表性 取的样本更具有代表性。
经济统计学第7章抽样调查
经济统计学第7章抽样调查
目录
• 抽样调查概述 • 抽样调查的基本方法 • 样本量的确定 • 抽样误差与推断方法 • 抽样调查的组织与实施
01 抽样调查概述
定义与特点
定义
抽样调查是一种统计学方法,通过对 总体中的一部分进行调查,来推断总 体的特征和规律。
特点
经济高效、快速、准确度高、可操作 性强、误差可控。
误差等。
02
系统误差
由于样本设计、测量工具或数据 处理等系统性因素引起的误差, 需要采取相应措施进行纠正。
04
抽样误差的计算
可以通过方差、标准差等统计量 来计算抽样误差的大小。
参数估计方法
点估计
用样本统计量直接估计总体参数的方法,如用样本均 值估计总体均值。
区间估计
根据样本统计量和抽样误差范围,推断总体参数可能 落入的区间范围。
特点
多阶段抽样能够减少总体单元数,提高调查效率,但增加 了组织调查的难度和成本。
适用范围
适用于总体范围大、调查人员少、组织能力有限的情况。
03 样本量的确定
样本量的影响因素
总体规模
总体规模越大,需要的样本量越大。
抽样误差
抽样误差越小,需要的样本量越大。
置信水平
置信水平越高,需要的样本量越大。
置信区间长度
制定调查计划
制定详细的调查计划,包括调查时间、调查人员、调查 预算等。
目录
• 抽样调查概述 • 抽样调查的基本方法 • 样本量的确定 • 抽样误差与推断方法 • 抽样调查的组织与实施
01 抽样调查概述
定义与特点
定义
抽样调查是一种统计学方法,通过对 总体中的一部分进行调查,来推断总 体的特征和规律。
特点
经济高效、快速、准确度高、可操作 性强、误差可控。
误差等。
02
系统误差
由于样本设计、测量工具或数据 处理等系统性因素引起的误差, 需要采取相应措施进行纠正。
04
抽样误差的计算
可以通过方差、标准差等统计量 来计算抽样误差的大小。
参数估计方法
点估计
用样本统计量直接估计总体参数的方法,如用样本均 值估计总体均值。
区间估计
根据样本统计量和抽样误差范围,推断总体参数可能 落入的区间范围。
特点
多阶段抽样能够减少总体单元数,提高调查效率,但增加 了组织调查的难度和成本。
适用范围
适用于总体范围大、调查人员少、组织能力有限的情况。
03 样本量的确定
样本量的影响因素
总体规模
总体规模越大,需要的样本量越大。
抽样误差
抽样误差越小,需要的样本量越大。
置信水平
置信水平越高,需要的样本量越大。
置信区间长度
制定调查计划
制定详细的调查计划,包括调查时间、调查人员、调查 预算等。
第七章抽样调查
第七章抽样调查
二、抽样调查的特点及适用范围
1、 是专门组织的一次性的非全面调查 2、 抽选样本单位遵循随机原则 3、 用样本指标数值去推断总体指标数值(与重点 调查的区别) 4、 抽样误差可计算并控制在一定范围内(与典型 调查的区别)
抽样调查的适用范围
➢ 有些现象是无法进行全面调查的,为了测算全面资料,必须采 用抽样调查的方法。
❖ 对无限总体不能采用全面调查。 ❖ 另外,有些产品的质量检查具有破坏性,不可能进行全面调
查,只能采用抽样调查。 ❖ 从理论上讲,有些现象虽然可以进行全面调查,但实际上没
有必要或很难办到,也要采用抽样调查
➢ 抽样调查可以用于工业生产过程的质量控制。
三、抽样推断的内容
(一)参数估计。特点是不知道总体的数量特征, 依据所获得的样本观察资料,对所研究现象总体的水 平、规模等数量特征进行估计。
K
抽样成数 平均误差
p
P p2
K
抽样平均数平均误差的计算公式:
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正 比,与样本容量成反比。(当总体标准差未知 时,可用样本标准差代替)
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
(二)假设检验。特点是对总体的变化情况不了解, 不妨对总体的状况作某种假设,然后再根据抽样推断 的原理,根据样本观察资料对所作假设进行检验,来 判断着种假设的真伪,以决定行动的取舍。
二、抽样调查的特点及适用范围
1、 是专门组织的一次性的非全面调查 2、 抽选样本单位遵循随机原则 3、 用样本指标数值去推断总体指标数值(与重点 调查的区别) 4、 抽样误差可计算并控制在一定范围内(与典型 调查的区别)
抽样调查的适用范围
➢ 有些现象是无法进行全面调查的,为了测算全面资料,必须采 用抽样调查的方法。
❖ 对无限总体不能采用全面调查。 ❖ 另外,有些产品的质量检查具有破坏性,不可能进行全面调
查,只能采用抽样调查。 ❖ 从理论上讲,有些现象虽然可以进行全面调查,但实际上没
有必要或很难办到,也要采用抽样调查
➢ 抽样调查可以用于工业生产过程的质量控制。
三、抽样推断的内容
(一)参数估计。特点是不知道总体的数量特征, 依据所获得的样本观察资料,对所研究现象总体的水 平、规模等数量特征进行估计。
K
抽样成数 平均误差
p
P p2
K
抽样平均数平均误差的计算公式:
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正 比,与样本容量成反比。(当总体标准差未知 时,可用样本标准差代替)
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
(二)假设检验。特点是对总体的变化情况不了解, 不妨对总体的状况作某种假设,然后再根据抽样推断 的原理,根据样本观察资料对所作假设进行检验,来 判断着种假设的真伪,以决定行动的取舍。
第七章抽样调查
2、凭据给定的F〔t〕查表求得几率度 t 。
3、凭据几率度和抽样平均误差计较极限误差。 4、计较被估计值的上、下限,对整体参数作
出区间估计。
例 题 一:
某农场进展小麦产量抽样查询拜访,小麦 播种总面积为1万亩,采取不反复简单 随机抽样,从中抽选了100亩作为样本 进展实割实测,测得样本平均亩产400 斤,方差144斤。
2、影响抽样误差大年夜小的成 分193 1、整体各单位标志值的差别水平 2、样本的单位数 3、抽样方式
4、抽样查询拜访的组织形式
3、抽样平均误差
概念
抽样平均误差是抽样平均数或抽样成数的 尺度差,反应了抽样指标与整体指标的平 均误差水平。
理 解 假定整体包孕1、2、3、4、5,五个数字。
那么:整体平均数
即:以95%的掌控水平估计该区域农户中具有彩电的农户在 17.87%至25.63%之间。
例 题 三 的 问 题 二 解:
当 p 0.02 其他前提不变时:
n
t 2 Np1 p N2p t 2 p1 p
1.962 5000 0.2175 0.7825 5000 0.022 1.962 0.2175 0.7825
即:以95.45%的靠得住性估计该农场小麦平均亩产量在
问题二解:
:
F t 不变 x 1斤
那么样本单位数:n
t 2 N 2 2x N t 2 2
3、凭据几率度和抽样平均误差计较极限误差。 4、计较被估计值的上、下限,对整体参数作
出区间估计。
例 题 一:
某农场进展小麦产量抽样查询拜访,小麦 播种总面积为1万亩,采取不反复简单 随机抽样,从中抽选了100亩作为样本 进展实割实测,测得样本平均亩产400 斤,方差144斤。
2、影响抽样误差大年夜小的成 分193 1、整体各单位标志值的差别水平 2、样本的单位数 3、抽样方式
4、抽样查询拜访的组织形式
3、抽样平均误差
概念
抽样平均误差是抽样平均数或抽样成数的 尺度差,反应了抽样指标与整体指标的平 均误差水平。
理 解 假定整体包孕1、2、3、4、5,五个数字。
那么:整体平均数
即:以95%的掌控水平估计该区域农户中具有彩电的农户在 17.87%至25.63%之间。
例 题 三 的 问 题 二 解:
当 p 0.02 其他前提不变时:
n
t 2 Np1 p N2p t 2 p1 p
1.962 5000 0.2175 0.7825 5000 0.022 1.962 0.2175 0.7825
即:以95.45%的靠得住性估计该农场小麦平均亩产量在
问题二解:
:
F t 不变 x 1斤
那么样本单位数:n
t 2 N 2 2x N t 2 2
第7章 抽样调查
对于某一具体问题来说,全及总体是唯一确定的。 但是样本总体不是唯一确定的。
抽样调查
全及总体指标:
参数(未知量)
统计推断
样本总体指标:统
计量(已知量)
抽样调查的特点
按随机原则抽取样本单位
由部分推断总体
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样调查的优越性
STAT
经济性
时效性
准确性 灵活性
抽样调查的应用 不可能进行全面调查时
不必要进行全面调查时
来不及进行全面调查时 对全面调查资料进行补充修正时
用于工业生产过程中的产品质量控 制和管理
抽样调查的一般步骤
设 计 抽 样 方 案
抽 取 样 本 单 位
收 集 样 本 数 据
计 算 样 本 统 计 量
思 考:
• 假定某大学的商学院想对今年的毕业生 进行一次调查,以便了解他们的就业意 向。该学院共有5个专业:会计、金融、 市场营销、经营管理、信息系统。今年 共有1500名毕业生,其中,会计专业有 500名,金融专业300名,市场营销300名, 经营管理250名,信息体统150名。 • 请 问:假定要抽取的样本数为180人, 各专业按比例分别应抽取多少人?
概念:简称总体或母体,是指所要调查认识的 征的单位组成。总体单位数用N表示。
第七章抽样调查
时 即:当 x 1斤 F t 为0.9545 ,
至少应抽544.6亩作为样本。
例 题 二:
某纱厂某时期内生产了10万个单位的纱,按纯随机 抽样方式抽取2000个单位检验,检验结果合格率为 95%,废品率为5%,试以95%的把握程度,估计全部 纱合格品率的区间范围及合格品数量的区间范围?
42
不重复抽样
N(N-1)(N-2)…….
4×3 = 12(个样本)
抽 样 误 差
一、抽样误差的含义 由于随机抽样的偶然因素使样本各单位的 结构不足以代表总体各单位的结构,而引 起抽样指标和全及指标之间的绝对离差。
二、影响抽样误差大小的因素 193 1、总体各单位标志值的差异程度 2、样本的单位数
例题二: 某厂生产一种新型灯泡共2000只,随机
抽出400只作耐用时间试验,测试结果 平均使用寿命为4800小时,样本标准差 为300小时,求抽样推断的平均误差?
例题一解: 则:
已知: n=100
x=58
σ=10
x
n
10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
n
2
x
x x
f
2Baidu Nhomakorabea
f
研究品 质标志
样本成数 p =
统计学原理 第七章 抽样调查
二、 抽样误差 1.抽样误差的概念 抽样误差,是指由于随机抽样引起的样 本结构不同于总体而产生的样本估计量 取值与总体参数之间的离差。即抽样平 均数与总体平均数之间的绝对离差 x X 和抽样成数与总体成数之间的绝对离 差 pP 。
2.抽样误差产生的原因
登记性误差
统 计 误 差 的 产 生 原 因
第三节 抽样误差和抽样估计
一、参数估计的优良标准 (一)无偏性 指一个优良的估计量,其数学期望应等于被估计总体参 数的真值。 (二)有效性 指作为优良的估计量,其方差应比较小。这样才能保证 估计量的取值能集中在被估计的总体参数附近。 (三)一致性 指随着样本容量n 的增大,一个好的估计量将在概率意 义下愈来愈接近于所要估计的总体参数真值。
X
-1.96 x
+1.96x
90%的样本 95% 的样本 99% 的样本
置信水平
1.
2.
将构造置信区间的步骤重复很多次,置 信区间包含总体参数真值的次数所占的 比例称为置信水平 表示为 (1 -
为是总体参数未在区间内的比例 相应的 为0.01,0.05,0.10
3.
(2)车比雪夫定理(Chebyshev
Theorem)
设随机变量相互独立,且具有相同的有限的数学期望和方 差,对于任意正整数有
1 n lim Px lim P X k 1 n n n k 1
《统计学》第七章(抽样调查)
2.根据给定的可信度F(t),求出相应的抽样极限误差范围 X
48
例1,已知:x=80,2=40,n=10,P(t)=0.95,在重复条件下对总体平 均数进行估计。 解:u=2
t=1.96 =tu=3.92 x-<X<x+, 80-3.92<X<80+3.92 点估计:总体平均数为80 区间估计:以95%的概率保证总体平均数在76.08-83.92之间 例2,已知:x=80,2=40,n=10, =4,在重复条件下对总体平均数进 行估计。 解:u=2 ,t= /u=2 点估计:总体平均数为80 区间估计:以95.45%的概率保证总体平均数在76-84之间 49
27
(二)抽样平均误差的计算 1.抽样平均数的平均误差
(1)在重复抽样的条件下总体方差已知,样本平均 数服从正态分布,其抽样平均数的平均误差计算公式为:
x
2
n
n
28
由上式可以看出,抽样平均数的平均误差就是抽样平
均数 的标准差。抽样平均误差和总体标准差是成正比的,与 样本单位数的平方根成反比。因此,要想减少抽样平均误差 以提高抽样指标的代表性,只能增大样本单位数n,因为总体 标准差是不能改变的。
N1代表具有某一种表现的总体单位数;
No代表具有另一种表现的总体单位数;
P、Q代表成数。
11
N1 N0 N P Q N1 N0 1
48
例1,已知:x=80,2=40,n=10,P(t)=0.95,在重复条件下对总体平 均数进行估计。 解:u=2
t=1.96 =tu=3.92 x-<X<x+, 80-3.92<X<80+3.92 点估计:总体平均数为80 区间估计:以95%的概率保证总体平均数在76.08-83.92之间 例2,已知:x=80,2=40,n=10, =4,在重复条件下对总体平均数进 行估计。 解:u=2 ,t= /u=2 点估计:总体平均数为80 区间估计:以95.45%的概率保证总体平均数在76-84之间 49
27
(二)抽样平均误差的计算 1.抽样平均数的平均误差
(1)在重复抽样的条件下总体方差已知,样本平均 数服从正态分布,其抽样平均数的平均误差计算公式为:
x
2
n
n
28
由上式可以看出,抽样平均数的平均误差就是抽样平
均数 的标准差。抽样平均误差和总体标准差是成正比的,与 样本单位数的平方根成反比。因此,要想减少抽样平均误差 以提高抽样指标的代表性,只能增大样本单位数n,因为总体 标准差是不能改变的。
N1代表具有某一种表现的总体单位数;
No代表具有另一种表现的总体单位数;
P、Q代表成数。
11
N1 N0 N P Q N1 N0 1
《统计学教学课件》i第七章抽样调查
特点
多阶段随机抽样适用于大 规模的复杂调查,可以减 少调查成本和难度。
实施步骤
1.确定总体和样本数量;2. 将总体分成若干阶段;3. 从每一阶段中随机抽取一 定数量的样本。
05
抽样调查的应用
在市场调查中的应用
了解市场需求
产品测试与改进
通过抽样调查,可以了解目标市场的 需求、消费者偏好以及潜在的市场机 会。
通过抽样调查,收集消费者对产品的 反馈,以便对产品进行改进或优化。
评估市场趋势
通过定期进行抽样调查,可以追踪市 场趋势,预测未来市场需求和竞争态 势。
在社会调查中的应用
社会问题研究
针对社会问题,如教育、就业、 贫困等,进行抽样调查以了解问
题的现状和原因。
民意调查
通过抽样调查,了解公众对政策、 议题或候选人的态度和意见。
分层随机抽样
01
02
03
定义
分层随机抽样是将总体分 成若干层,然后从每一层 中随机抽取一定数量的样 本。
特点
分层随机抽样可以减少系 统误差,提高样本的代表 性。
实施步骤
1.确定总体和样本数量;2. 将总体分成若干层;3.从 每一层中随机抽取一定数 量的样本。
多阶段随机抽样
定义
多阶段随机抽样是将总体 分成若干阶段,然后从每 一阶段中随机抽取一定数 量的样本。
第7章抽样调查
n
(1 )
3002 1 400 14.85(小时)
x
n
N
400 20000
㈡抽样成数的平均误差
总体成数是总体中具有某种属性的单位占所有 单位的比重,用P表示,不具有某种属性的比重用Q 表示;样本中具有某种属性用p表示,不具有某种 属性用表示。
可以证明:总体平均数=P
㈡统计调查误差种类 按产生的原因分,统计调查误差可分为调查误差和代 表性误差。
调查误差是指统计调查时,由于主观或客观因素引起 的技术性、登记性误差以及责任性误差等。
代表性误差又可分为两种:系统性误差和随机误差。 系统性误差又称偏差,它是由于抽样调查没有遵循随机原
则而产生的误差。只要遵循随机原则就可以避免。 随机误差又称偶然的代表性误差,它是指没有调查误差的
2 3
F (t )
0.6827 0.9000 0.9500 0.9545 0.9973
第七章 抽样调查
第七章 抽样调查
§7.1 抽样调查概述 §7.2 抽样推断的基本原理 §7.3 抽样误差 §7.4 全及总体指标的推断
第一节 抽样调查概述
一、抽样的概念和特点
抽样:根据随机原则从总体中抽取一部分单位作为 样本,并根据样本数量特征对总体数量特征做出 具有一定可靠程度的估计与推断。
特点: 用部分信息推断总体数量特征 按随机原则抽取样本单位 存在抽样误差,但误差可以事先计算并控制
统计学课件--第七章抽样调查
(一)全及总体 也叫母体,简称为总体。 (二)抽样框
在实际进行抽样的总体范围内,包括全部抽样单位的 名单框架称为抽样框。
抽样框的主要形式有三种:
①名单抽样框
②区域抽样框
③时间表抽样框。
2021/3/2
6
区域抽样框 中山路… 桥西区 桥东区… 华北地区 东北地区… 居民一组 居民二组 … 2021/3/2
4)
样本平均数分布的方差
2 x
为:
重复抽样时:
2 x
2
n
不重复抽样时:
2 x
2
n
N n N 1
2021/3/2
28
第七章 抽样调查
第四节 总体参数估计
一、参数估计的优良标准
(一)无偏性
(二)有效性 (三)一致性
2021/3/2
29
第七章 抽样调查
评价准则
无偏性
有效性
一致性
估计量
ˆ
的数学期望
第一节 抽样调查的意义
第二节 总体和样本 第三节 抽样调查的数理基础
第四节 总体参数估计
第五节 抽样设计
第六节 总体假设检验
2021/3/2
1
第七章 抽样调查
第一节 抽样调查的意义
一、抽样调查的概念和特点
(一)抽样调查的概念
抽样调查是一种科学的非全面调查。它是 按照随机原则从调查对象的总体中抽取部分 单位进行调查,并根据这部分单位的调查结 果推断总体的数量特征。
在实际进行抽样的总体范围内,包括全部抽样单位的 名单框架称为抽样框。
抽样框的主要形式有三种:
①名单抽样框
②区域抽样框
③时间表抽样框。
2021/3/2
6
区域抽样框 中山路… 桥西区 桥东区… 华北地区 东北地区… 居民一组 居民二组 … 2021/3/2
4)
样本平均数分布的方差
2 x
为:
重复抽样时:
2 x
2
n
不重复抽样时:
2 x
2
n
N n N 1
2021/3/2
28
第七章 抽样调查
第四节 总体参数估计
一、参数估计的优良标准
(一)无偏性
(二)有效性 (三)一致性
2021/3/2
29
第七章 抽样调查
评价准则
无偏性
有效性
一致性
估计量
ˆ
的数学期望
第一节 抽样调查的意义
第二节 总体和样本 第三节 抽样调查的数理基础
第四节 总体参数估计
第五节 抽样设计
第六节 总体假设检验
2021/3/2
1
第七章 抽样调查
第一节 抽样调查的意义
一、抽样调查的概念和特点
(一)抽样调查的概念
抽样调查是一种科学的非全面调查。它是 按照随机原则从调查对象的总体中抽取部分 单位进行调查,并根据这部分单位的调查结 果推断总体的数量特征。
07第七章抽样调查
07第七章抽样调查
学习内容
一.抽样调查的意义、作用、原理 二.抽样的基本概念 三.抽样的程序 四.抽样样本确定 五.抽样设计
2
一、抽样调查的意义、作用、原理
(一)抽样法的意义及作用 意义:通过对部分单位的调查,达到对总体数量特征的认识。 作用:
不可能采用全面调查时可采用抽样调查。 不必要进行全面调查时可采用抽样调查。 由于时间经费限制或误差要求不高时可采用抽样调查。 满足紧急需要,来不及进行全面调查,可用抽样调查。 在全面调查后,对某些数据进行修正时采用抽样调查。
X
当 X 服 从 标 准 正 态 分 布 时 , 通 常 记 z 2 = ,即 = z 2 X
X
X
当 X 服 从 t 分 布 时 , 通 常 记 t 2 ,n 1 , z 2 与 t 2 ,n 1 通 常 也 称 为 临 界 值
X
X
31
平均数区间估计
p(X)1 的 估 计 区 间 是 [X ,X ]
3
(二)抽样调查的原理
1. 必然现象与偶然现象 2. 大数定理 3. 中心极限定理
4
1.必然现象与偶然现象
① 必然性是指事物联系和发展中一定要发生的、不可避免的趋 势。偶然性是指事物联系和发展中不确定的趋向。必然性和 偶然性是对立统一的关系。
② 二者是对立的,它们是事物发展的两种不同趋向,产生的原 因以及在事物发展中的地位和作用不同。
学习内容
一.抽样调查的意义、作用、原理 二.抽样的基本概念 三.抽样的程序 四.抽样样本确定 五.抽样设计
2
一、抽样调查的意义、作用、原理
(一)抽样法的意义及作用 意义:通过对部分单位的调查,达到对总体数量特征的认识。 作用:
不可能采用全面调查时可采用抽样调查。 不必要进行全面调查时可采用抽样调查。 由于时间经费限制或误差要求不高时可采用抽样调查。 满足紧急需要,来不及进行全面调查,可用抽样调查。 在全面调查后,对某些数据进行修正时采用抽样调查。
X
当 X 服 从 标 准 正 态 分 布 时 , 通 常 记 z 2 = ,即 = z 2 X
X
X
当 X 服 从 t 分 布 时 , 通 常 记 t 2 ,n 1 , z 2 与 t 2 ,n 1 通 常 也 称 为 临 界 值
X
X
31
平均数区间估计
p(X)1 的 估 计 区 间 是 [X ,X ]
3
(二)抽样调查的原理
1. 必然现象与偶然现象 2. 大数定理 3. 中心极限定理
4
1.必然现象与偶然现象
① 必然性是指事物联系和发展中一定要发生的、不可避免的趋 势。偶然性是指事物联系和发展中不确定的趋向。必然性和 偶然性是对立统一的关系。
② 二者是对立的,它们是事物发展的两种不同趋向,产生的原 因以及在事物发展中的地位和作用不同。
第七章 抽样调查
第七章抽样调查
一、抽样原理
1、定义
抽样调查是按照随机原则从被研究对象的总体中(全部研究对象)抽取一部分单位进行调查观察,并运用数理统计的原理,以调查所得的指标(实际观察数值)来推断被研究总体的相应指标达到对总体的认识。简言之,抽样调查就是从总体中抽取一定数量的样本来推断总体的情况。
2、抽样调查的特点
⑴随机原则。所谓随机原则,就是说在我们所研究的总体中,每一个个案都有被选中、抽取的机会。也即我们在总体中抽样时,哪一个个案能被抽取,哪一个个案不能被抽取,不是人为主观决定的,而完全是偶然碰机会的。
⑵从数量上推算全体。抽样调查是抽取部分个案进行调查,但它的主要目的不是为了了解这部分单位本身,而是为了据此从数量上推算全体。
⑶抽样调查使我们有可能用更少的人力、物力、时间、费用达到对总体的认识,而且可以起到丢普查资料进行修正补充,提高大范围调查的准确程度的作用,因而在理论上和方法上都具有重要的意义。
3、几个概念
⑴总体
也称为母体、一般总体等。是指具有某种统计特征的一类事物的全部个案。也即,研究对象的全体称为总体。例如,某批产品、某类病人、某个生产过程等。总体的单位数通常用符号N来表示。
⑵个体
也称为个案、元素。组成总体的每个元素称为个体。有时也称具有某种统计特征的每一个对象为个案构成一个总体的个案,可以是人或物,也可以指个性、心理反应等。
⑶样本
也称为抽样总体、样本总体等
从总体中抽取一部分代表进行研究分析时,这一部分被抽取的个案称为总体中的一个样本。也就是说,从总体中抽取的若干个案所组成的群体,称之为样本。总体是大群体,样本是小群体。在社会研究中,资料的收集工作往往是在样本中完成的。
07章抽样调查基础知识
(2)系统随机抽样
系统随机抽样也称为机械随机抽样或等距随 机抽样。它是先将总体中各单位按一定的标 志排队,然后每隔一定的距离抽取一定单位 构成样本。
(3)分层随机抽样
分层随机抽样又称为类型随机抽样、分类随机抽 样。它是按照某一标志,先将总体分成若干组 (类),其中每一组(类)称为一层,再在层内 按简单随机抽样方法进行抽样。
随机原则是在抽取调查单位时,完全排除人 为的主观因素影响,保证每一个调查单位都 有相等的中选可能的原则。就概率意义而言, 又称为等可能性原则。
抽样调查遵守随机原则的原因:
抽样调查的目的是用样本来推断总体的数 量特征,这就要求抽样的部分单位能够充 分的代表总体。遵守随机原则,可以使样 本结构与总体结构相同,进而可以按概率 理论计算误差,并进行统计推断。
举例说明估计的两种方法:
总体平均数的估计
对一批电子元件进行耐用性能的检查,随机重置抽 样方法选取100件作耐用测试,所得结果的分组资料如下:
耐用时数(小时) 900以下 900—950
950—1000 1000—1050 1050—1100 1100—1150 1150—1200
1200以上 合计
某玻璃器皿厂某日生产15000只印花 玻璃杯,现从中抽取150只进行质量检 验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率 (成数)的抽样平均误差。分别按重复 抽样和不重复抽样
经济统计学第7章抽样调查
精品
6
在 抽 样 调 查 中 应 用 的 总 体 指 标 和 样 本 指 标 还 有 :
方 差 : 总 体 方 差 2、 样 本 方 差 s2 标 准 差 : 总 体 标 准 差 、 样 本 标 准 差 s
抽样框 ——即总体单位的名单,是指对可以选择作为
样本的总体单位列出名册或顺序编号,以 确定总体的抽样范围和结构。
前一种不能轻易拒绝的假设为原假
设,后一种为备选假设。假设检验就是 根据样本,检验H 0 是否成立,H 0不成 立就接受备选假设 H 1。
一、基本思想: 小概率原则:认为在一次实验中 小概率事件几乎是不可能发生的,小概
率事件的概率为显著性水平 。
2
拒绝域
接受域
2
拒绝域
二、假设检验的基本内容
假设检验的规则就是把随机变量取值区间划分为两个 互不相交的部分,即拒绝区域与接受区域。当样本的某个 统计量属于拒绝区域时,将拒绝原假设。落入拒绝区域的 概率,就是小概率,一般用显著性水平表示。
接左:
抽取样本 样本平均数 x
30
40
35
30
50
40
40
10
25
40
20
30
40
30
35
40
40
40
40
50
45
50
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
指标和总体指标的误差不超过一定范 围的概率保证程度(教材P284)
符号表示: P( x - X ≤Δ )x =F(t) (教材P286例题)
理论已经证明,在大样本的情况下,抽 样平均数的分布接近于正态分布,分布特 点是:抽样平均数以总体平均数为中心, 两边完全对称分布,即抽样平均数的正误 差与负误差的可能性是完全相等的。且抽 样平均数愈接近总体平均数,出现的可能 性愈大,概率愈大;反之,抽样平均数愈 离开总体平均数,出现的可能性愈小,概 率愈小,趋于0。(见下图)
例 题 四 解:
已知: N 60000 n 300 n1 6
则:样本合格率 p n n1 300 6 0.98
n
300
p
p1 p 0.98 0.02 0.808(%)
n
300
p
p1
p 1
n
n N
0.98 0.02 1
300
0.806(%)
300 60000
p
二、类型抽样
先对总体各单位按主要标志加以分组,然后再从 各组中按随机的原则抽选一定单位构成样本。
三、等距抽样
先按某一标志对总体各单位进行排队,然后依一 定顺序和间隔来抽取样本单位的一种组织形式。
四、整群抽样
将总体各单位划分成许多群,然后从其中随机抽 取部分群,对中选群的所有单位进行全面调查的 抽样组织形式。
抽样成数极限误差: p-Δp≤P≤p+Δp
五、抽样误差的可信度(概率度)
含义
抽样误差的概率度是测量抽样估计可靠 程度的一个参数。用符号“ t ”表示。
公式表示:
t=
Δ μ
(t 是极限误差与抽样平均误差的比值)
上式可变形为: Δ = t μ
(极限误差是 t 倍的抽样平均误差)
参看P284-286例题
三、抽样平均误差
抽样平均误差是抽样平均 数或抽样成数的标准差,反映 了抽样指标与总体指标的平均 误差程度。
假设总体包含1、2、3、4、5,五 个数字。 则:总体平均数为
x = 1+2+3+4+5 = 3 5
现在,采用重复抽样从中抽出 两个,组成一个样本。可能组成的 样本数目:25个。
如:
1+3 2
抽样误差不包括下面两类误差:一类是调查误差, 即在调查过程中由于观察、测量、登记、计算上的差 错而引起的误差;另一类是系统性误差,即由于违反 抽样调查的随机原则,有意抽选较好单位或较坏单位
进行调查,这样造成样本的代表性不足所引起的误差。
二、影响抽样误差大小的因素
1、总体各单位标志值的差异程度 2、样本的单位数 3、抽样方法 4、抽样调查的组织形式
第四节 抽样组织设计
一、简单纯随机抽样
1、含义:按随机原则直接从总体N个单位中
抽取 n 个单位作为样本。
2、样本单位数的计算方法:
通过抽样极限误差公式计算必要的样本单位数。
抽样平均数 抽样成数
重复抽样:
n
t
2
2 x
2x
不重复抽样:
n
t
2
N
2 x
2x N t 2
2 x
n
t 2 p1
2p
p
n
t2 Np1 p N2p t 2 p1
=2
1+4 2
=2.5
2+4 2
=3
3+5 = 4 …….. 2
多数样本指标与总体指标都有误差,误差有大、有小,有正、有负,抽 样平均误差就是将所有的误差综合起来,再求其平均数,所以抽样平 均误差是反映抽样误差一般水平的指标。
抽样平均误差的计算理论公式
抽样平均数 的平均误差
x
xX 2
M
抽样成数 平均误差
某厂生产一种新型灯泡共2000只,随机 抽出400只作耐用时间试验,测试结果 平均使用寿命为4800小时,样本标准差 为300小时,求抽样推断的平均误差?
例题一解: 已知: n=100 x=58
σ=10
则:
x
n
10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例题四: 一批食品罐头共60000桶,随机抽查300桶 ,发现有6桶不合格,求合格品率的抽样平 均误差?
例 题 三 解:
已知: n 400 n1 80 则:样本成数 p n1 80 20%
n 400
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
例 题 一:
某农场进行小麦产量抽样调查,小麦播种总面积
为1万亩,采用不重复简单随机抽样,从中抽选了
100亩作为样本进行实割实测,测得样本平均亩产 400斤,方差144斤。
(二)全及指标 和 样本指标
全及指标: 反映总体数量特征的指标数值。
∑X
总体平均数 X= N
研究总体中 的数量标志
∑XF X= ∑F
全 及 指 标
研究总体中
总体方差 总体成数
σ
2=
Σ(X-X)2 N
σ
2=
Σ(X-X)2F ΣF
N1 P=
N
的品质标志
(只有两种表现) 成数方差 σ 2 = P(1-P)
愈低,但抽样估计的精确度愈高。
三、总体参数区间估计的方法
(一)根据给定的概率F(t),推算 抽样极限误差的可能范围
分 析 步 骤:
1、抽取样本,计算样本指标。 2、根据给定的F(t)查表求得概率度 t 。 3、根据概率度和抽样平均误差计算极限误差。 4、计算被估计值的上、下限,对总体参数作
出区间估计。
均误差也总是小于重复抽样的平均误差。
采用不重复抽样:
x
2 1
n
n
N
公式表明:抽样平均误差不仅与总体变异程度、 样本容量有关,而且与总体单位数的多少有关。
例题一:
随机抽选某校学生100人,调查他们的体 重。得到他们的平均体重为58公斤,标 准差为10公斤。问抽样推断的平均误差 是多少?
例题二:
抽样极限误差指在进行抽样估计时,根据研究 含义: 对象的变异程度和分析任务的要求所确定的样
本指标与总体指标之间可允许的最大误差范围。 计算方法:设Δx与Δp分别表示样本平均数与样本成数的抽样
极限误差,则有: |x-X|≤Δx,|p-P|≤Δp 上述不等式也可表示成 :
抽样平均数极限误差:x-Δx≤X≤x+Δx
它是由部分推断整体的一种认识方法。 建立在随机取样的基础上。 运用概率估计的方法。 其误差可以事先计算并加以控制。
三、有关的基本概念
(一)总 体 和 样 本
总体: 又称全及总体。指所要认识的 研究对象全体。总体单位总数用“N” 表示。
样本: 又称子样。是从全及总体中随机 抽取出来,作为代表这一总体的那 部分单位组成的集合体。样本单位 总数用“n”表示。
正态概率分布图
因为扩大或缩小以后 的平均误差,就是极 限误差: Δ=tμ 所以,抽样平均误 差的系数就是概 率度t。
68.27%
数理统计已经证明,抽样 误差的概率就是概率度的
函数,二者对应的函数 关系已编成“正态分布 概率表”。
95.45%
x-2μ x-1μ X
x+1μ x+2μ
由此可知,误差范围愈大,抽样估计的置信度愈高,但抽样估计 的精确度愈低;反之,误差范围愈小,则抽样估计的置信度
通过例题可说明以下几点: ①样本平均数的平均数等于总体平均数。
②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例题:假定抽样单位数增加 2 倍、0.5 倍时,抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。
第五节 抽样单位数目的确定
第五节 抽样单位数目的确定
样本单位数的计算方法: 教材P302-306
通过抽样极限误差公式计算必要的样本单位数。
抽样平均数 抽样成数
重复抽样:
n
t
2
2 x
2x
不重复抽样:
n
t
2
N
2 x
2x N t 2
2 x
n
t 2 p1
2p
p
n
t2 Np1 p N2p t 2 p1
重复抽样: 又称置回抽样。
不重复抽样:又称不置回抽样。
例如:从A、B、C、D四个单位中,抽出两个单位构成 一个样本
重复抽样 16个样本 不重复抽样
12个样本
AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD
第三节 抽 样 误 差
一、抽样误差的含义
由于随机抽样的偶然因素使样本各单位的结构不 足以代表总体各单位的结构,而引起抽样指标和全及 指标之间的绝对离差。
• 习题:有5个工人的日产量分别为(单位: 件):6,8,10,12,14,用重复抽样的方法, 从中随机抽取2个工人的日产量,用以代表这5 个工人的总体水平。则抽样平均误差为多少?
若改用不重复抽样方法,则抽样平均误差为多 少?
•
解:根据题意可得:X
6
8
10 5
12
14
1(0 件)
(X X)2
计算结果表明:不重复抽样的平均误差小于重复抽样, 但是“N”的数值越大,则两种方法计算 的抽样平均误差就越接近。
四、抽 样 极 限 误 差
抽样极限误差是指样本和总体指标之间误 差的可能范围。
由于总体指标是一个确定的数,而样本指 标则是围绕总体指标上下波动的,它与总体指 标之间既有正离差,也有负离差,样本指标变 动的上限或下限与总体指标之差的绝对值就可 以表示抽样误差的可能范围,我们将这种以绝 对值形式表示的抽样误差可能范围称为抽样极 限误差。
第七章 抽样调查
本章主要内容
•抽样调查的一般问题 •抽样误差 •抽样估计的方法 •抽样组织设计
第一节 抽样调查概述
一、抽样调查的概念:是一种非全面调查,
就是按随机原则从全部研究对象中抽取部分
单位进行观察,并根据这一部分单位的实际 数据推断总体的数量特征,作出具有一定可 靠程度的估计和判断。
二、 特点
例题二解: 已知: N=2000 n=400 σ=300 x=4800
则:
x
n
300 15(小时) 400
x
2 1 n 3002 1 400 13.42(小时)
n N
400 2000
计算结果表明:根据部分产品推断全部产品的平均使用寿命 时,采用不重复抽样比重复抽样的平均误差要小。
p
第六节 全集总体指标的推断
一、总体的点估计
点估计的特点:P307
无偏性
总体参数优良估计的标准
一致性
有效性
二、总体的区间估计
教材P271
区间估计的 区方间法估步计骤三:要素
P307
估计值
x, p
抽样误差范围 x , p x , p
抽样估计的置信度 F t
什 么 是 抽 样 估 计 的 置 信 度? 抽样估计的置信度就是表明抽样
p
p P2
M
(以上两个公式实际上就是第四章讲的标准差。 但反映的是样本指标与总体指标的平均离差程度)
实际上,利用上述两个公式是计算不出抽样平均误差的。
想一想,为什么?
抽样平均数平均误差的实际计算方法
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正比, 与样本容量成反比。(当总体标准差未知时,可 用样本标准差代替)(教材P279例题)
40
8(件)
N
5
重复抽样条件下
抽样平均误差 x 8 2(件)
n2
不重复抽样条件下
抽样平均误差
x=
2
(
N
n )=
n N 1
8( 2
5-2 5-1
)=1.732(件)
抽样成数平均误差的实际计算方法
采用重复抽样:
p
p1 p 百度文库
n
采用不重复抽样: p
p1
n
p 1
n N
例题三: 某校随机抽选400名学生,发现戴眼镜的学 生有80人。根据样本资料推断全部学生中戴 眼镜的学生所占比重时,抽样误差为多大?
产品质量 x 数量(件) f
合格品 1
N1
不合格品 0
N0
合计
N
平均数
x xf f
1 N1 0 N0 N1 P (成数)
N1 N0
N
(三)样本容量和样本个数
样本容量:一个样本包含的单位数。用 “n”表示。 一般要求 n ≥30
样本个数:从一个全及总体中可能抽取的样本数目。
(四)重复抽样和不重复抽样
样本指标:
研究数 量标志
样 本 指 标
研究品 质标志
根据样本数据计算的综合指标。
样本平均数
x
=
∑x n
x
=
∑xf ∑f
S
样本标准差
样本成数
S
p=
n n
x
2
x
n
x
2
x
f
f
成数标准差 p p1 p
什么是成数?
将总体所包含的总体单位按某一标志划分为两大部分,具有 某种特征的单位数占全部单位数的比重,就是成数。 成数也是这个总体的平均数。
抽样单位数增加 0.5倍,即为原来的 1.5倍
则: x
1.5n
1 0.8165 1.5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。
与重复抽样相比,不重复抽样平均误差是在重复 抽样平均误差的基础上,再乘以 (N-n)(/ N-1) , 而 (N-n)(/ N-1)总是小于1,所以不重复抽样的平
符号表示: P( x - X ≤Δ )x =F(t) (教材P286例题)
理论已经证明,在大样本的情况下,抽 样平均数的分布接近于正态分布,分布特 点是:抽样平均数以总体平均数为中心, 两边完全对称分布,即抽样平均数的正误 差与负误差的可能性是完全相等的。且抽 样平均数愈接近总体平均数,出现的可能 性愈大,概率愈大;反之,抽样平均数愈 离开总体平均数,出现的可能性愈小,概 率愈小,趋于0。(见下图)
例 题 四 解:
已知: N 60000 n 300 n1 6
则:样本合格率 p n n1 300 6 0.98
n
300
p
p1 p 0.98 0.02 0.808(%)
n
300
p
p1
p 1
n
n N
0.98 0.02 1
300
0.806(%)
300 60000
p
二、类型抽样
先对总体各单位按主要标志加以分组,然后再从 各组中按随机的原则抽选一定单位构成样本。
三、等距抽样
先按某一标志对总体各单位进行排队,然后依一 定顺序和间隔来抽取样本单位的一种组织形式。
四、整群抽样
将总体各单位划分成许多群,然后从其中随机抽 取部分群,对中选群的所有单位进行全面调查的 抽样组织形式。
抽样成数极限误差: p-Δp≤P≤p+Δp
五、抽样误差的可信度(概率度)
含义
抽样误差的概率度是测量抽样估计可靠 程度的一个参数。用符号“ t ”表示。
公式表示:
t=
Δ μ
(t 是极限误差与抽样平均误差的比值)
上式可变形为: Δ = t μ
(极限误差是 t 倍的抽样平均误差)
参看P284-286例题
三、抽样平均误差
抽样平均误差是抽样平均 数或抽样成数的标准差,反映 了抽样指标与总体指标的平均 误差程度。
假设总体包含1、2、3、4、5,五 个数字。 则:总体平均数为
x = 1+2+3+4+5 = 3 5
现在,采用重复抽样从中抽出 两个,组成一个样本。可能组成的 样本数目:25个。
如:
1+3 2
抽样误差不包括下面两类误差:一类是调查误差, 即在调查过程中由于观察、测量、登记、计算上的差 错而引起的误差;另一类是系统性误差,即由于违反 抽样调查的随机原则,有意抽选较好单位或较坏单位
进行调查,这样造成样本的代表性不足所引起的误差。
二、影响抽样误差大小的因素
1、总体各单位标志值的差异程度 2、样本的单位数 3、抽样方法 4、抽样调查的组织形式
第四节 抽样组织设计
一、简单纯随机抽样
1、含义:按随机原则直接从总体N个单位中
抽取 n 个单位作为样本。
2、样本单位数的计算方法:
通过抽样极限误差公式计算必要的样本单位数。
抽样平均数 抽样成数
重复抽样:
n
t
2
2 x
2x
不重复抽样:
n
t
2
N
2 x
2x N t 2
2 x
n
t 2 p1
2p
p
n
t2 Np1 p N2p t 2 p1
=2
1+4 2
=2.5
2+4 2
=3
3+5 = 4 …….. 2
多数样本指标与总体指标都有误差,误差有大、有小,有正、有负,抽 样平均误差就是将所有的误差综合起来,再求其平均数,所以抽样平 均误差是反映抽样误差一般水平的指标。
抽样平均误差的计算理论公式
抽样平均数 的平均误差
x
xX 2
M
抽样成数 平均误差
某厂生产一种新型灯泡共2000只,随机 抽出400只作耐用时间试验,测试结果 平均使用寿命为4800小时,样本标准差 为300小时,求抽样推断的平均误差?
例题一解: 已知: n=100 x=58
σ=10
则:
x
n
10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例题四: 一批食品罐头共60000桶,随机抽查300桶 ,发现有6桶不合格,求合格品率的抽样平 均误差?
例 题 三 解:
已知: n 400 n1 80 则:样本成数 p n1 80 20%
n 400
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
例 题 一:
某农场进行小麦产量抽样调查,小麦播种总面积
为1万亩,采用不重复简单随机抽样,从中抽选了
100亩作为样本进行实割实测,测得样本平均亩产 400斤,方差144斤。
(二)全及指标 和 样本指标
全及指标: 反映总体数量特征的指标数值。
∑X
总体平均数 X= N
研究总体中 的数量标志
∑XF X= ∑F
全 及 指 标
研究总体中
总体方差 总体成数
σ
2=
Σ(X-X)2 N
σ
2=
Σ(X-X)2F ΣF
N1 P=
N
的品质标志
(只有两种表现) 成数方差 σ 2 = P(1-P)
愈低,但抽样估计的精确度愈高。
三、总体参数区间估计的方法
(一)根据给定的概率F(t),推算 抽样极限误差的可能范围
分 析 步 骤:
1、抽取样本,计算样本指标。 2、根据给定的F(t)查表求得概率度 t 。 3、根据概率度和抽样平均误差计算极限误差。 4、计算被估计值的上、下限,对总体参数作
出区间估计。
均误差也总是小于重复抽样的平均误差。
采用不重复抽样:
x
2 1
n
n
N
公式表明:抽样平均误差不仅与总体变异程度、 样本容量有关,而且与总体单位数的多少有关。
例题一:
随机抽选某校学生100人,调查他们的体 重。得到他们的平均体重为58公斤,标 准差为10公斤。问抽样推断的平均误差 是多少?
例题二:
抽样极限误差指在进行抽样估计时,根据研究 含义: 对象的变异程度和分析任务的要求所确定的样
本指标与总体指标之间可允许的最大误差范围。 计算方法:设Δx与Δp分别表示样本平均数与样本成数的抽样
极限误差,则有: |x-X|≤Δx,|p-P|≤Δp 上述不等式也可表示成 :
抽样平均数极限误差:x-Δx≤X≤x+Δx
它是由部分推断整体的一种认识方法。 建立在随机取样的基础上。 运用概率估计的方法。 其误差可以事先计算并加以控制。
三、有关的基本概念
(一)总 体 和 样 本
总体: 又称全及总体。指所要认识的 研究对象全体。总体单位总数用“N” 表示。
样本: 又称子样。是从全及总体中随机 抽取出来,作为代表这一总体的那 部分单位组成的集合体。样本单位 总数用“n”表示。
正态概率分布图
因为扩大或缩小以后 的平均误差,就是极 限误差: Δ=tμ 所以,抽样平均误 差的系数就是概 率度t。
68.27%
数理统计已经证明,抽样 误差的概率就是概率度的
函数,二者对应的函数 关系已编成“正态分布 概率表”。
95.45%
x-2μ x-1μ X
x+1μ x+2μ
由此可知,误差范围愈大,抽样估计的置信度愈高,但抽样估计 的精确度愈低;反之,误差范围愈小,则抽样估计的置信度
通过例题可说明以下几点: ①样本平均数的平均数等于总体平均数。
②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例题:假定抽样单位数增加 2 倍、0.5 倍时,抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。
第五节 抽样单位数目的确定
第五节 抽样单位数目的确定
样本单位数的计算方法: 教材P302-306
通过抽样极限误差公式计算必要的样本单位数。
抽样平均数 抽样成数
重复抽样:
n
t
2
2 x
2x
不重复抽样:
n
t
2
N
2 x
2x N t 2
2 x
n
t 2 p1
2p
p
n
t2 Np1 p N2p t 2 p1
重复抽样: 又称置回抽样。
不重复抽样:又称不置回抽样。
例如:从A、B、C、D四个单位中,抽出两个单位构成 一个样本
重复抽样 16个样本 不重复抽样
12个样本
AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD
第三节 抽 样 误 差
一、抽样误差的含义
由于随机抽样的偶然因素使样本各单位的结构不 足以代表总体各单位的结构,而引起抽样指标和全及 指标之间的绝对离差。
• 习题:有5个工人的日产量分别为(单位: 件):6,8,10,12,14,用重复抽样的方法, 从中随机抽取2个工人的日产量,用以代表这5 个工人的总体水平。则抽样平均误差为多少?
若改用不重复抽样方法,则抽样平均误差为多 少?
•
解:根据题意可得:X
6
8
10 5
12
14
1(0 件)
(X X)2
计算结果表明:不重复抽样的平均误差小于重复抽样, 但是“N”的数值越大,则两种方法计算 的抽样平均误差就越接近。
四、抽 样 极 限 误 差
抽样极限误差是指样本和总体指标之间误 差的可能范围。
由于总体指标是一个确定的数,而样本指 标则是围绕总体指标上下波动的,它与总体指 标之间既有正离差,也有负离差,样本指标变 动的上限或下限与总体指标之差的绝对值就可 以表示抽样误差的可能范围,我们将这种以绝 对值形式表示的抽样误差可能范围称为抽样极 限误差。
第七章 抽样调查
本章主要内容
•抽样调查的一般问题 •抽样误差 •抽样估计的方法 •抽样组织设计
第一节 抽样调查概述
一、抽样调查的概念:是一种非全面调查,
就是按随机原则从全部研究对象中抽取部分
单位进行观察,并根据这一部分单位的实际 数据推断总体的数量特征,作出具有一定可 靠程度的估计和判断。
二、 特点
例题二解: 已知: N=2000 n=400 σ=300 x=4800
则:
x
n
300 15(小时) 400
x
2 1 n 3002 1 400 13.42(小时)
n N
400 2000
计算结果表明:根据部分产品推断全部产品的平均使用寿命 时,采用不重复抽样比重复抽样的平均误差要小。
p
第六节 全集总体指标的推断
一、总体的点估计
点估计的特点:P307
无偏性
总体参数优良估计的标准
一致性
有效性
二、总体的区间估计
教材P271
区间估计的 区方间法估步计骤三:要素
P307
估计值
x, p
抽样误差范围 x , p x , p
抽样估计的置信度 F t
什 么 是 抽 样 估 计 的 置 信 度? 抽样估计的置信度就是表明抽样
p
p P2
M
(以上两个公式实际上就是第四章讲的标准差。 但反映的是样本指标与总体指标的平均离差程度)
实际上,利用上述两个公式是计算不出抽样平均误差的。
想一想,为什么?
抽样平均数平均误差的实际计算方法
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正比, 与样本容量成反比。(当总体标准差未知时,可 用样本标准差代替)(教材P279例题)
40
8(件)
N
5
重复抽样条件下
抽样平均误差 x 8 2(件)
n2
不重复抽样条件下
抽样平均误差
x=
2
(
N
n )=
n N 1
8( 2
5-2 5-1
)=1.732(件)
抽样成数平均误差的实际计算方法
采用重复抽样:
p
p1 p 百度文库
n
采用不重复抽样: p
p1
n
p 1
n N
例题三: 某校随机抽选400名学生,发现戴眼镜的学 生有80人。根据样本资料推断全部学生中戴 眼镜的学生所占比重时,抽样误差为多大?
产品质量 x 数量(件) f
合格品 1
N1
不合格品 0
N0
合计
N
平均数
x xf f
1 N1 0 N0 N1 P (成数)
N1 N0
N
(三)样本容量和样本个数
样本容量:一个样本包含的单位数。用 “n”表示。 一般要求 n ≥30
样本个数:从一个全及总体中可能抽取的样本数目。
(四)重复抽样和不重复抽样
样本指标:
研究数 量标志
样 本 指 标
研究品 质标志
根据样本数据计算的综合指标。
样本平均数
x
=
∑x n
x
=
∑xf ∑f
S
样本标准差
样本成数
S
p=
n n
x
2
x
n
x
2
x
f
f
成数标准差 p p1 p
什么是成数?
将总体所包含的总体单位按某一标志划分为两大部分,具有 某种特征的单位数占全部单位数的比重,就是成数。 成数也是这个总体的平均数。
抽样单位数增加 0.5倍,即为原来的 1.5倍
则: x
1.5n
1 0.8165 1.5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。
与重复抽样相比,不重复抽样平均误差是在重复 抽样平均误差的基础上,再乘以 (N-n)(/ N-1) , 而 (N-n)(/ N-1)总是小于1,所以不重复抽样的平