第七章抽样推断
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
dt
1
2
2
标准正态分布函数值表
若确定了保证程度 0.95, 1 则 0.05, x 1 应查 2 0.975
第三节 抽样的组织方式
简单随机抽样 分层抽样 等距抽样 整群抽样
多阶段抽样
简单随机抽样:简单随机抽样又称纯随机抽样, 是直接从总体中按随机的原则抽容量为 n 的样本, 每一个总体单位有相同的可能性被抽中。 特点:在差异较大的总体中,简单随机抽样的 样本不一定能保证样本的代表性。
第七章 抽样推断
★ 第一节 抽样法的概述
第二节
第三节 第四节
抽样误差
抽样的组织方式 抽样方案的设计
第五节
抽样估计方法
第一节 抽样法的概述
抽样法的概念与特点 抽样推断中的基本概念 抽样的方法 非抽样误差和抽样误差
抽样法的基本概念:
抽样调查是一种非全面调查。它按随机的原则
从总体中抽出部分单位(简称样本)进行调查,以 获得有关的数据资料。
ˆ ˆ 若 E ( ) ,则称 为 的无偏 估计量
抽样估计量的优良标准 有效性
若 ˆ1
作为优良的估计量,除了满足无偏 性的要求外,其方差应比较小
ˆ ,则称 1 ˆ为比 更有效的估计量 ˆ 2
2
指随着样本单位数n的增大,样本 一致性 估计量将在概率意义下越来越接近 于总体真实值
ni n N i i
i 1
k
N i i
i 是各层的标准差。
3、经济分配法: 既考虑每层中总体单位的变异程度不同, 又考虑每层的调查费用。所以在样本容量一定 的条件下,标志变异大的层样本容量也大一些 ,调查费用大的层,样本容量相对小些。则
ni n N i i / C i
i 1
抽样推断是根据抽样调查所获得的样本信息,
对总体的数量特征做出具有一定可靠程度的估计和 推断。 特点:按随机原则抽取样本;目的在于用样 本指标推断相应的总体指标进行估计、推断;可 以计算和控制抽样误差。
NEXT
抽样推断的基本概念:
全及总体: (总体) 所要研究的全部对象构成的整体。 总体单位:组成总体的每一个单位。 有限总体与无限总体;总体容量(N) 样本总体(样本):
ˆ 若 n 越大 ˆ越小,则称 为 的一致估计量
抽样估计量的优良标准
数理统计证明:
x 为 X的无偏、有效、一百度文库估计量; S n 1 的无偏、有效、一致估计量; 为
p 为 P的无偏、有效、一致估计量。
指样本估计量与总体参数之间数量 抽样误差 上的差异,仅指由于按照随机原则 抽取样本而产生的代表性误差,不 包括登记性误差和系统偏差
P 1 P n 1 n N
P 1 P N n n N 1
抽样平均误差的计算公式 关于总体方差的估计方法
用过去同类问题全面调查或抽样调查的经 验数据代替; 用样本标准差 s代替总体标准差 ,用 s p 代替 P 。
影响抽样误差的因素
三、抽样误差的概念
四、抽样平均误差 五、抽样极限误差
样本统计量所有可能值的 抽样分布 概率分布
样本统 样本统 样本统 样本统 样本统 计量样本统 计量 计量 样本统 计量 样本统 计量 样本统 计量 样本统 计量 样本统 计量 样本统 计量 样本统 计量 计量 计量 计量
主要样本
总体未 知参数
平均数
p ~ N ( P , P P n) 1 np 5, n(1 p ) 5
样本抽样分布 5
x
X
X
原总体分布 10
抽样估计量的优良标准
设 为待估计的总体参数, ˆ为样本统 计量,则 的优良标准为: ˆ 无偏性 指样本指标的均值应等于被估 计的总体指标
比率(成数)
方差
统计量
x
p
S
2
平均数的抽样分布 全部可能样本平均数的均值等于总体均 值,即: E ( x ) X ( x X ) 从非正态总体中抽取的样本平均数当n 足够大时其分布接近正态分布。 从正态总体中抽取的样本平均数不论容 量大小其分布均为正态分布。 1 样本均值的标准差为总体标准差 n
说 明
对于任何一个样本,其抽样 误差都不可能测量出来 抽样误差的大小可以依据概 率分布理论加以说明
更大样本 容量的抽 样分布
某个样本 容量的抽 样分布
X
x n
抽样平均 误差
指每一个可能样本的估计值与 总体指标值之间离差的平均数, 即样本估计量的标准差
x
1 M
x
M i 1
xx n p n1 n
S 2
S [
总体平均数 X
总体成数 P
样本平均数
样本成数
总体方差 2
总体标准差
样本方差
样本标准差
( x x )2
n 1
( x x )2
n 1 ]1 2
抽样方法:
重复抽样:抽一个容量为 n 的样本时,每次抽 出一个单位进行登记。再放回下总体中继续下次 抽选,直至抽够样本点为止。 特点是:每个总体单位可能被重复抽中; 有 N n 个可能的样本 ; 每个总体单位被抽中的可能性为1 / N。
2
NEXT
多阶段抽样:
概念:先将一个很大的总体划分为若干个子总 体,既一阶单位;再把一阶单位划分为若干个更小 的单位,称为二阶单位,照此继续下去划分出更小 的单位。然后分别按随机的原则,逐阶段抽样。最 终抽出 mn n 阶单位构成样本。 个 多阶段抽样的抽样误差的计算公式: 各阶段抽样误差的合计。例如二阶段抽样的抽 样平均误差的为: 2 2 1 2 x 重复抽样 n nm 2 12 n 2 m 不重复抽样 x (1 ) (1 ) n N nm M
指样本单位的抽取不受主 观因素及其他系统性因素 的影响,每个总体单位都 有均等的被抽中机会
不重复抽样:抽一个容量为n的样本时,每 次抽出一个单位进行登记。不再放回总体中, 继续进行次抽选,直至抽够 个样本点为止。 n 特点是: 每个总体单位不可能被重复抽中; 不考虑顺序的情况下,有个可能的样本 ; n CN n CN 。 每个总体单位被抽中的可能性为1/ 1/ N
NEXT
调查误差:
非抽样误差—在统计调查中,由于主客观原
按随机原则从总体中抽取的部分单位构成的 小总体。 样本单位:构成样本的每一个单位。
样本容量(n)
总体参数— 描述总体数量特征的指标。总体是惟一的, 所以参数也是惟一的; 样本统计量— 描述样本数量特征的指标,由样本计算而 得。由于样本是随机的,所以样本统计量 是随机变量。
总体参数 样本统计量 样本统计量公式
抽样极限误差的计算公式 (大样本条件下)
⒈ 样本平均数的 极限误差: ⒉ 样本成数的极 限误差:
x z x
p z p
Z为概率度,是给定概率保证程度下样本均值 偏离总体均值的抽样平均误差的倍数。
抽样极限误差的计算公式 (大样本条件下)
Z与相应的概率保证程度存在一一对应关系, 常用Z值及相应的概率保证程度为:
N n N n n 1 N 1 N N
不重复抽样时:
x 2 N n
n N 1
2
n 1 n N
抽样平均误差的计算公式 ⒉ 样本成数的抽样平均误差 重复抽样时:
p
不重复抽样时:
p
P P 1 n 当N≥500时,有 N n N n n 1 N 1 N N
NEXT
分层抽样(类型抽样) 概念:首先将总体单位按某一个标志分层;然后在各
层按随机抽样的方法分别抽出各层的样本。
特点:分层抽样在层内是抽样调查,层间是全面调查,
所以分层时应该尽量让每层内的变异程度小,而层间的变 异程度大。分层抽样的抽样误差较简单随机抽样小,样本 具有很好的代表性。
1 1 k 抽样平均误差的计算公式: N i i2 n N i 1
NEXT
整群抽样:
概念:首先将总体划分为群 R;然后按随机的 原则不重复抽出群 r ,在每群中进行全面调查。 该调查方法适用于单位较多的总体。 与分层抽样相反的,整群抽样在群内是全面 调查,在群间是抽样调查。 计算抽样平均误差的公式:
x 2 Rr
r ( R 1 )
1 R N i ( xi X ) 2 N i 1
k
( N i i / C i )
NEXT
等距抽样(机械抽样): 概念:首先将总体单位按某标志排队,排队 的标志可以与调查有关,也可以与调查无关; N 然后计算抽样的距离 k ;然后随机确定抽 n 样起点 ,最后等距离抽出样本点构成样本 抽样误差的计算:有关标志排队用分层抽样 的公式估计抽样误差;无关标志排队等同于简 单随机抽样,所以用简单随机抽样的方法计算
i
X
2
式中: x 为样本平均数的抽样平均误差; 为 M 2 注意:不要混淆抽样 为第 i 个可能样本的平均 (x x) 可能的样本数目; i x S 标准差与样本标准差! 数;X 为总体平均数 n 1
抽样平均误差的计算公式
⒈ 样本平均数的抽样平均误差
重复抽样时:
x
2
n 当N≥500时,有n
z值 1.00 1.65 1.96 2.00 2.58 3.00
概率保证程度 0.6827 0.9000 0.9500 0.9545 0.9900 0.9973
1
2
Z
x
1
Z
2
Z
2
2
t2 2
Z
1 e 2
dt
x
x
1 e 2
t2 2
x ~ N ( X ,
2
n)
比率的抽样分布 全部可能样本比率的均值等于总体比率, 即: E ( p) P ( p P) 从非正态总体中抽取的样本比率,当n足 够大时其分布接近正态分布。 从正态总体中抽取的样本比率,不论容 量大小其分布均为正态分布。 1 样本比率的标准差为总体标准差的 n
X x ~ N ( X , 2 n)
x
2 x
3 x
x
指在一定的概率保证程度下, 抽样极限 抽样误差不允许超过的某一给 误差 定范围,也称作允许误差、误 差范围、误差臵信限等
由于提高把握程度,会增大允许误差, 使估计精度降低,而缩小允许误差,提高估 计的精度,又会降低估计的把握程度,所以
在实际中应根据具体情况,先确定一个合理 的把握程度再求相应的允许误差或先确定一 个允许误差范围再求相应的把握程度。
2 x
通常情况下,分层抽样的抽样平均误差小于简单随 机抽样的平均误差)。
方法:
1、比例分配法; 考虑每层中的总体单位数,按比例在 每层中抽出相同比例的样本,即
nk n n1 常数 N N1 Nk
N1 N 2 N k N
每层的样本容量
Ni ni n N
2、奈曼最佳分配法: 考虑每层中总体单位的变异程度不同, 在样本容量一定的条件下,变异大的层样本容 量也大,变异小的层样本容量也小。每层的样 本容量为
因而引起的诸如测量、登录、计算等误差。该误
差可以避免。
抽样误差—在抽样调查中由于抽样的随机性
而产生的样本指标对总体指标的代表性误差。样 本虽然是总体的缩影,但是还不足以完全代表总
体,从而产生了误差。抽样误差是随机抽样固有
的,可以计算并加以控制,但不可以避免。
NEXT
第二节
抽样误差
★ 一、抽样分布
二、抽样估计量的优良标准
总体各单位的差异程度(即标准差 的大小): 越大,抽样误差越大; n 样本单位数的多少: 越大,抽样误 差越小; 抽样方法:不重复抽样的抽样误差 比重复抽样的抽样误差小; 抽样组织方式:简单随机抽样的误 差最大。
抽样极限误差
99.73%
95.45% 68.27%
3 x 2 x x
NEXT
第四节 抽样方案的设计 ★ 一、抽样估计的意义和一般步骤
二、抽样方案设计的基本准则 三、抽样方案设计的主要内容
一、抽样估计的意义和一般步骤
㈠ 抽样估计的定义 ㈡ 抽样估计的特点 ㈢ 抽样估计的运用 ㈣ 抽样估计的一般步骤 ㈤ 总体参数与样本指标
抽样估计
按照随机原则 从调查对象中抽取一部 分单位进行调查,并以调查结果对总体 数量特征作出具有一定可靠程度的估计 与推断,从而认识总体的一种统计方法