第六章 抽样推断
第六章 抽样推断
μx——抽样平均数的抽样平均误差 μp——抽样成数的抽样平均误差
抽样平均误差的计算方法
重复抽样情况下抽样平均数的平均误差计算
x
( x X )2 K
式中
x — 抽样平均数的平均误差;
x — 抽样总体平均数; X — 全及总体平均数; K — 样本平均指标个数或抽样成数 的个数(样本可能数目。 )
应用概率论的理论与方法,用样本的指标数 值推断总体的指标数值
二、抽样调查的作用
可对不可能或不必要全面调查的 现象作全面研究
节约人力、物力和财力,取得事半功 倍的效果 对全面调查的数据资料作质量检 验和修正
可对工业产品生产质量进行控制
可对总体的假设进行检验,判断真伪
三、抽样推断中常用的几个基本概念
总体不具有某种标志的单位数为 N0 N = N1 + N0 则:总体具有某种标志的全及成数 P = N1 / N
总体不具有某种标志的比重 Q = N0 / N
有: P + Q = N1 / N + N0 / N = 1
Q=1-P
总体成数的平均数 XP
Xf f
1 N1 0 N 0 N1 P N N
重复抽样——从全及总体N个单位中抽取n个样本,每 次从总体中随机抽出一个单位后,再放 回总体中重新参加下一次抽取 不重复抽样——从全及总体N个单位中抽取n个样本, 当某一个单位被随机抽出后,不再放 回总体
四、抽样调查的理论依据
大数定律(大数法则)
对某现象观察,由于 受偶然因素影响,每次结 果不同,但经大量观察并 综合平均后,将消除偶然 的差异,而接近总体平均 值,使现象总体某标志规 律及其共同特征在数量、 质量上显示出来。 中心极限定律 只要样本容量n 在充分大的条件下 (一般要求n>30), 不论全及总体的变 量分布是否属于正 态分布,其抽样平 均数也是趋向于正 态分布的。
统计学基础课件(第六章抽样推断)
Fundamentals of Statistics
统计是指这种偶然性代表性误差。 即按随机原则抽样时,在没有登记性误差和系统性误 差的条件下单纯由于不同的随机样本得出不同估计量 而产生的误差。抽样误差是抽样调查所固有的,是无 法避免与消除的,但可以运用数学方法计算其数量界 限,并通过抽样设计程序控制其范围,所以这种抽样 误差也称为可控制误差。 需要指出,抽样误差不是 固定不变的数,它的数值是随样本不同而变化的,所 以它也是随机变量。
重复抽样 AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD
N n = 42 =16 (个样本)
Fundamentals of Statistics
统计学基础
第六章 抽样推断
不重复抽样
N(N-1)(N-2)……. 4×3 = 12(个样本)
Fundamentals of Statistics
Fundamentals of Statistics
统计学基础
第六章 抽样推断
本章主要内容 •抽样推断概述 •抽样误差 •抽样估计的方法 •样本容量的确定
Fundamentals of Statistics
统计学基础
第第一六章节抽样推抽断样推断概述
一、抽样推断的概念和特点 概念
抽样推断是在抽样调查的基础上,用样 本实际资料计算样本指标,并据以推算总 体相应的数量特征的一种统计分析方法。
代表性误差的发生有以下两种情况:
一种是由于违反抽样调查的随机原则,如有意地多选较好的 单位或较坏的单位进行调查。这样做,所据以计算的抽样指标 必然出现偏高或偏低现象,造成系统性的误差。系统性误差和 登记性误差都是不应当发生的,是可以也应该采取措施避免发 生或将其减小到最小限度。
第6章抽样推断88821373
PPT文档演模板
2020/11/26
第6章抽样推断88821373
•2.样本(sample)又称子样,它是从全及总体中随 机抽取出来,作为代表这一总体的那部分单位组成的 集合体。
•样本的单位数是有限的,相对来说,它的数目比 较小,一般用英文小写字字母n来表示样本的单位 数。如上例n=50人。
•作为推断对象的总体是确定的,而且 是唯一的。但作为观察对象的样本就不 是这样。从一个总体可以抽取很多个样 本,每次可能抽到哪个样本不是确定的。 也不是唯一的,而是可变的。
PPT文档演模板
2020/11/26
第6章抽样推断88821373
•抽样推断具有如下几个特点
•抽样推断是由部分推算整体的一种认识方 法。 •抽样推断是建立在随机取样的基础上。
•抽样推断是运用概率估计的方法,利用 样本指标来估计总体参数。
•抽样推断的误差是可以事先控制的,用样本 指标值推断总体指标值是存在一定误差的。
PPT文档演模板
2020/11/26
第6章抽样推断88821373
•6.1.2 参数和统计量
•1.参数(parameter)。根据总体各单位的标 志值或标志属性计算的,反映总体数量特征 的综合指标称为全及指标。
•全及指标是总体变量的函数,其数值是由 总体各单位的标志值决定的。由于总体是唯 一确定的,因此,全及指标也是唯一确定的, 所以也称参数。常用的参数有总体平均数, 总体成数、总体方差和总体标准差。
第6章抽样推断 88821373
PPT文档演模板
2020/11/26
第6章抽样推断88821373
•6.1 抽样推断的基本概念
•抽样推断是在抽样调查的基础上利用样 本的实际资料计算出的样本数据,并运 用概率估计方法,推算总体相应的数量 指标的一种统计分析方法。
《国民经济统计学概论》_第六章_抽样推断
总体分组: 2 (X X )2 F F
总体成数的方差为 P(1 - P)
2.统计量,又称样本指标,反映样本特 征的统计指标
(1)样本平均数( x ),样本各 单位数量标志值的平均数
未分组: x x
n
分组: x xf f
(2)样本成数(p) 是指样本中具有某一相同标志表现的单
要有四个:
(1)总体平均数( X )
总体各单位数量标志值的平均数
X
总体未分组情况下:X N
总体分组情况下:
XF
X
F
(2)总体成数(P)
是指总体中具有某一相同标志表现的单 位数占全部总体单位数的比重
多为交替指标
总体中具有相同标志表现的单位数用N1 表示
P N1 N
(3)总体方差和标准差 总体方差(σ2)
特点: 1.抽样方式组织简便,便于实施 2.在已知总体某些有关信息的情况下,
采用等距抽样能保证样本单位在总体中 均匀的分布,从而提高了样本对总体的 代表性,有利于降低抽样误差。
无关标志排队 有关标志排队
(三)类型抽样 首先把总体按某一标志分成若干个类型
组,使各组组内标志值比较接近,然后 分别在各组内按随机原则抽取样本单位。 特点:在于把分组法和随机抽样原则结 合起来。
i2ni
n
抽样成数的平均误差:
重置抽样:
p
P(1 P) n
不重置抽样:
第四节 抽样的组织形式及抽样方 案设计
一、抽样的组织形式 (一)简单随机抽样 从总体全部单位中直接按随机原则抽取
样本单位,使每个总体单位都有同等机 会被抽中
最基本形式
(1)直接抽选法 直接从调查对象中随机抽选。
统计学第6章抽样推断
t
x
S
X
,S
n
(x x)2
n 1
t
xX S
,S
n 1
(x x)2
n
t 分布
t分布是类似正态分布的一种对称分布,它通常要比 正态分布平坦和分散。一个特定的t分布依赖于称之 为自由度的参数。随着自由度的增大,t分布也逐渐 趋于正态分布
•
10、市场销售中最重要的字就是“问”。17:19:1217:19:1217:198/29/2021 5:19:12 PM
•
11、现今,每个人都在谈论着创意,坦白讲,我害怕我们会假创意之名犯下一切过失。21.8.2917:19:1217:19Aug-2129-Aug-21
•
12、在购买时,你可以用任何语言;但在销售时,你必须使用购买者的语言。17:19:1217:19:1217:19Sunday, August 29, 2021
• 抽样误差是由于随机原则导致的样本统计量 (如样本平均数、样本成数)与总体参数之间 的误差,主要包括:
xX
pP
抽样误差的影响因素
•样本容量的大小
容量大
抽样误差小
•总体的变异程度
变异大
抽样误差大
•抽样方法和抽样组织方式
不重复抽样的抽样误差比重复 抽样的抽样误差小;
抽样组织方式:简单随机抽样 的误差最大。
2x.中心极限定理
从非正态总体(平均数和标准差有限)中抽取的样本,当n足够 大时(n>30),样本平均数分布接近正态分布。n越大,分布越趋 近于正态分布。
正态总体或非正态总体、大样本
x
~
N(X
,
2 x
)
令Z x X , Z ~ N (0,1)
经济应用统计学-第六章抽样推断
非参数检验优缺点总结
• 易于理解和实现:非参数检验方法通常基于直观和易于理解的思想,计算和实现相对简单。
非参数检验优缺点总结
检验效能较低
与参数检验方法相比,非参数检 验方法的检验效能通常较低,即 当原假设为真时,非参数检验方 法更容易犯第二类错误(接受原 假设)。
对数据信息的利用不 充分
非参数检验方法通常只利用数据 的部分信息(如排序信息),而 忽略了数据的其他有用信息(如 数值大小),因此可能无法充分 利用数据信息。
两配对样本非参数检验
包括Wilcoxon 符号秩次检验、McNemar 检验 等方法,用于比较同一总体内两个配对样本的差 异是否显著。
两独立样本非参数检验
包括Mann-Whitney U 检验、Kruskal-Wallis H 检验等方法,用于比较两个独立样本所来自的 总体的分布位置或分布形状是否存在差异。
考虑样本量大小
在选择置信水平时,应充分考虑样本量的大小。当样本量较小时,应选择较低的置信水平以避免过大的估计误差;当 样本量较大时,可以选择较高的置信水平以获得更精确的估计结果。
参考相关文献或行业标准
在选择置信水平时,可以参考相关领域的文献或行业标准,了解通常采用的置信水平及其依据。这有助 于确保研究结果的可比性和可靠性。
04
假设检验原理与步骤
假设检验基本概念阐述
原假设与备择假设
原假设通常是研究者想要推翻的 假设,而备择假设则是研究者希 望证实的假设。
检验统计量与拒绝域
检验统计量是根据样本数据计算出 的用于检验原假设的统计量,而拒 绝域则是根据显著性水平和检验统 计量的分布确定的,当检验统计量 落入拒绝域时,我们拒绝原假设。
单侧检验
当研究者对备择假设的方向有明确预期时,即备择假设只可能大于或小于原假设时,应选择单侧检验 。例如,在比较两种药物疗效的研究中,如果研究者预期新药疗效优于旧药,则应选择单侧检验。
第六章抽样推断
第六章 抽样推断一、本章学习要点(一)总体参数,也称总量指标,是由总体各单位标志值计算而来的,样本统计量则由样本各单位标志值计算而来的指标。
通常有平均数、标准差、成数等。
重复抽样与不重复抽样的样本统计量分布是不同的。
如果样本的n 个个体完全来自于某一正态总体N (X ,2σ),则当方差已知时,样本均值服从正态分布;如果总体方差未知,则样本均值服从t (n-1)分布,且对于大样本,样本均值趋于正态分布。
即使总体分布未知,根据中心极限定理,大样本下的样本均值近似服从正态分布。
对于大样本,样本成数同样趋于服从正态分布。
(二)抽样估计就是利用样本指标值来估计相应总体指标的数值,又称参数估计,它有点估计和区间估计两种。
点估计就是用样本指标的实际值直接作为相应总体参数的估计值,如X =x ,区间估计就是根据给定的概率保证度,利用实际资料计算出总体参数的估计区间(上限和下限),并以这一区间作为总体参数的估计值。
优良估计量应该满足无偏性、一致性、有效性。
抽样误差有几种不同的形式。
实际抽样误差是指样本统计量所得的抽样统计值与总体参数真值之间的绝对离差;抽样平均误差(抽样标准误差)是样本统计量抽样分布的标准差。
通常有用x μ、p μ或者σ(x )、σ(p )表示;抽样极限误差是指以样本统计量统计总体参数时所允许的最大误差范围。
通常用x ∆或 p ∆ 表示。
影响抽样误差的因素有:总体内在差异程度、样本容量、抽样方法、抽样组织形式。
抽样极限误差Δ与抽样标准误差μ 所得的相对数称抽样误差的概率度,用t 表示。
x x t μ∆= 或 p p t μ∆= ,它是测定抽样估计可靠程度的一个参数。
(三)不同抽样组织形成的含义、要求、效果及估计方法是不同的,具体表现为点估计值、抽样标准误差及样本容量的计算公式不同。
其中最基本的是简单随机抽样,下表给出了二、本章思考题及练习题(一) 填空题1.抽样推断是按照,从总体中抽取样本,然后以样本的观察结果来估计总体的数量特征。
第六章抽样推断
概率
三、抽样极限误差
0.6827 0.9545 0.9973
3 x 2 x 1 x
1 x 2
x
3
x
思考题
三、抽样极限误差
1、对400名大学生抽取19%进行不重复抽样调查, 其中优等生比重为20%,概率保证程度为95.45%, 则优等生比重的极限抽样误差为(B) A. 4% B. 4.13% C. 9.18% D. 8.26% 2、在抽样推断中,抽样误差是( D ) A、可以避免的 C、不可避免且无法控制 B、可避免且可控制 D、不可避免但可控制
全国电视观众抽样调查
抽 样 调 查 的 一 般 程 序
规定总体
根据研究课题,对研 究对象的整体做出明 确定义 简单随机抽样 类型抽样 系统抽样 整群抽样 多阶段抽样 抽样平均误差 置信区间
选取样本
统计推断
全国电视观众抽样调查
调查目的:准确获取全国电视观众群 体规模、构成以及分布情况;获取这些观 众的收视习惯,对电视频道和栏目的选择 倾向、收视人数、收视率与喜爱程度,为 改进电视频道和栏目、开展电视观众行为 研究提供新的依据。
重复抽样
p
P(1 P) n
总体成 总体方 数已知 差已知
不重复抽样
p
P(1 P) n
(1
n N
)
p
p(1 p) n
总体方 差未知
思考题
二、抽样平均误差
1、在500个抽样产品中,有475个是一级品,则在 简单随机抽样下一级品率的抽样平均误差为( A ) A 0.9747% B 0.9545% C 0.9973% D 0.6827% 2、有5个工人的日产量分别为(单位:件):6, 8,10,12,14,用重复抽样的方法,从中随机抽取2 个工人的日产量组成样本,则抽样平均误差为多少?
第六章 抽样推断
在不重复抽样下:
x
2
N
n
n N 1
2
53.63
10000
200
3.754小时
200 10000 1
23
第二十三页,共53页。
(2)计算灯泡的合格率和合格率的抽样平均误差。
求灯泡合格率的抽样平均误差
:
p
在重复抽样下:
p
p1 p
n
0.915 0.085 1.972% 200
⒉全及总体的分类
属性总体(是非总体)
变量总体
⒊总体单位数:N
4
第四页,共53页。
一、全及总体和抽样总体
(二)抽样总体
简称样本,是从全及总体中随机抽取出 来,作为代表这一总体的那部分单位组成的 集合体。
样本单位数:n
第五页,共53页。
返回
5
二、全及指标和抽样指标
(一)全及指标(参数): 1、概念:根据全及总体各单位标志值计
x i1
fi
m
(xi x )2 fi
2 i1
fi
m
( xi
i1
x)2 fi fi
10
第十页,共53页。
属性总体的抽样指标
抽样成数
抽样平均数
其中:
抽样标准差
p n1 n
q n0 n n1 1 p
n
n
n1:总体中具有某种属性的单位数目。
n0:总体中不具有某种属性的单位数目。
n0 n1 n
21
第二十一页,共53页。
(1)求灯泡平均使用时间、标准差和 灯泡合格率(样本)
x
xi fi fi
1057小时
2
xi x fi
第六章抽样推断
第六章参数估计通过本章的学习,我们应该知道:1. 统计抽样推断的常用术语2. 抽样推断基于什么样的原理3. 点估计与区间估计的具体操作4. 抽样组织方式及其相应的误差计算5. 每次抽样需要多大的样本容量目录第六章参数估计 __________________________________________________________________________ 3第一节抽样推断的基本概念与原理 ________________________________________________________ 3一、抽样推断的特点和作用 _____________________________________________________________ 3二、重复抽样与不重复抽样 _____________________________________________________________ 4三、抽样误差与抽样平均误差 ___________________________________________________________ 4四、抽样推断的理论基础 _______________________________________________________________ 6五、参数估计的基本步骤 _______________________________________________________________ 7第二节参数估计中的点估计 ______________________________________________________________ 7一、总体参数的点估计 _________________________________________________________________ 7二、点估计量的优良标准 _______________________________________________________________ 7第三节参数估计中的区间估计 ____________________________________________________________ 8一、参数估计的精度与抽样平均误差计算 _________________________________________________ 8二、参数估计的误差范围与概率度 _______________________________________________________11三、总体参数的区间估计 ______________________________________________________________ 12第四节抽样组织方式及其参数估计 _______________________________________________________ 13一、简单随机抽样 ____________________________________________________________________ 13二、分层抽样 ________________________________________________________________________ 14三、机械抽样 ________________________________________________________________________ 16四、整群抽样 ________________________________________________________________________ 16第五节必要样本容量的确定 _____________________________________________________________ 17一、平均数的必要样本容量 ____________________________________________________________ 17二、成数的必要样本容量 ______________________________________________________________ 18三、影响必要样本容量的因素 __________________________________________________________ 19习题 _________________________________________________________________________________ 19第六章参数估计统计抽样推断是统计学研究的重要内容,它包括两大核心内容:参数估计(Parameter Estimation)和假设检验(Hypothesis Testing)。
第6章 抽样推断
控制。
三、抽样推断的作用
1、对某些不可能进行全面调查的而又要求反映全面 情况的无限总体,必须采用抽样推断的方法。 2、对某些属于破坏性或消耗性产品质量的检查只能 进行抽样推断。 3、对某些不必要进行全面调查的总体现象可以利用 抽样推断取得资料。 4、对全面调查进行验证,并作为修正数字的参考。 5、生产过程中的质量控制。 6、对某些总体的假设进行检验,判断真伪,为制定 决策提供依据。
第二节 抽样估计的一般原理
一、抽样估计的特点
1、运用的是归纳推理的方法。 2、抽样估计运用的是概率原理。 3、抽样估计的结论存在一定的抽样误差。
二、抽样估计的优良标准
由于抽样指标作为统计量,它是一个随 机变量,随着抽取的样本不同,便有不同估 计值。因此要判断一种估计量的好坏,仅从 某一次试验的结果来衡量是不可能的,而应 该从多次重复试验中,看这种估计量是否在 某种意义上说最接近于被估计参数的真值。 一般地说,用抽样指标估计总体指标应 该有三个要求。满足了这个要求的,就可以 认为是合理的估计或优良的估计。
x
x x X x x
1500 160 X 1500 160 1340 X 1660
两种抽样误差的关系
抽样平均误差具有较强的客观性,抽取的样
本一旦确定,抽样平均误差也就随之确定。 它由样本单位数、总体标准差、总体单位数 确定。
抽样极限误差具有较强的主观性,人们可以
离差,不可避免,可以控制。 登记误差:由于观察、测量、登记、计算造 成的误差,可以避免。 系统性误差:由于有意识选取调查单位造成 的系统偏差。理论上可以避免。
3.影响抽样误差的因素
(1) 抽样单位数目的多少
在其他条件不变的情况下,抽样单位数愈 多,抽样误差就愈小;反之抽样单位数少了, 则抽样误差就要增大。
统计学教学课件:第六章 抽样推断
已知: N 5000, 300小时,x 25小时
F (t) 95% t 1.96
重复抽样:
二、区间估计
总体指标的推断(置信区间):
x x X x x pp P pp
说明在一定可能下,总 体指标落在抽样指标的 一定范围内。
置信区间: X [x x , x x ]
P [ p p, p p ]
置信区间是统计意义上的,即一定概率下,总体指标所 落在的区间长度,等于两倍的抽样极限误差。
第四节 全及指标的推断
抽样调查的目的是为了用样本指标推断总 体指标。对总体指标的估计有两种,一种是点 估计,一种是区间估计。
一、点估计(又称“定值估计”)
——不考虑抽样误差,直接用样本指标代替全及指标。即:
X x;P p
点估计不能说明误差大小,意义不大;而采用区间估 计,可以将误差控制在一定的范围内(即说明总体指标 在某一范围内的可能性大小) 。
1. 概念:先将总体单位按某一有关标志分类(组),再按
随机原则从各类(组)中抽取样本的组织形式。
(1)样本容量n的 分配方法:
① 等比例抽取
② 不等比例抽取 (标志变异大的组多抽,反之少抽。)
组与组之间是全面调查(组间方差不影响 ) (2)特点:
组内是非全面调查(组内方差影响 )
注:类型抽样的误差常小于简单随机抽样。
原则:
节省人力、物力、财力;
保证抽样推断能达到预期的可靠程度和精确 度的要求下,确定一个适当的样本容量。
确定必要抽样单位数n的依据
1、总体被研究标志的变异程度(变异大多抽,小则少抽) 2、抽样误差的范围(精确程度)(范围大少抽,小则多抽) 3、抽样推断的可靠程度(可靠程度高多抽,反之少抽)
统计学A第6章 抽样推断
2
样本可能数目
3 0.577 9
计算复杂,可对 定义公式变形为 更为简单的形式
3.2 抽样平均误差
(2)抽样平均误差的计算 1)抽样平均数的抽样平均误差 ① 重复抽样
第6章 抽样推断 第3节 抽样平均误差
x
(总体标准差)
n (样本容量)
在总体标准差未知, 且样本单位数较大时, 可用样本标准差代替。
解: 已知: n 100, x 58, x
则:
x
10
10 1(公斤) 100 n
x
即: 当根据样本学生的平均体重估计全部学生 的平均体重时,抽样平均误差为1公斤。
② 不重复抽样
1)抽样平均数的抽样平均误差
例2: 某厂生产一种新型灯泡共2000只,随机抽出400只作 耐用时间试验,测试结果平均使用寿命为4800小时, 样本标准差为300小时,求抽样推断的平均误差?
的数量特征做出具有一定可靠性的估计判断,从而达
到对全部研究对象的认识的一种统计方法。 一、 2.特点 ① 抽样调查建立在随机取样的基础上; ② 抽样推断是由部分推算总体的一种方法; ③ 抽样推断是运用概率估计的方法; ④ 抽样推断的抽样误差可以事先计算并加以控制。
1.2 抽样调查的作用
第6章 抽样推断 第1节 抽样调查的意义和作用
x E x
1 0.25 0 0.25 0 0.25 0 0.25 1
2
合计
—
—
27
3
3.2 抽样平均误差
第6章 抽样推断 第3节 抽样平均误差
例1 样本平均数的平均数(总体平均数)
27 23 4 E x 3(或X 3) 9 3
第六章 抽样推断
x 样本比率 p 或 q) (
样本方差: 样本方差: s 2 样本标准差: 样本标准差: s
第六章 抽样推断
第一节 抽样推断的一般问题
(三)抽样方法和样本可能数目 1、抽样方法 (1)重复抽样
重复抽样( replacement)也叫重置抽样, 重复抽样(sampling with replacement)也叫重置抽样, 是指每次抽取一个单位记录其标志表现后又放回, 是指每次抽取一个单位记录其标志表现后又放回,重新 参加下一次的抽选。 参加下一次的抽选。
第六章 抽样推断
第二节 抽样误差
大数定律可归纳如下: 大数定律可归纳如下: 4)各单位的共同倾向(这些表现为主要的、基本的因素) )各单位的共同倾向(这些表现为主要的、基本的因素) 决定着平均数(或比率)的水平,而各单位对平均数( 决定着平均数(或比率)的水平,而各单位对平均数(或比 的离差(这些表现为次要的、偶然的因素) 率)的离差(这些表现为次要的、偶然的因素)则会由于足 够多数单位的综合汇总的结果,而相互抵消,趋于消失。 够多数单位的综合汇总的结果,而相互抵消,趋于消失。 根据大数定律的内容特点,运用抽样法时, 根据大数定律的内容特点,运用抽样法时,必须注意以下两 个问题: 个问题: 第一、抽样必须遵循随机原则。 第一、抽样必须遵循随机原则。 第二、抽样必须遵循大量原则。 第二、抽样必须遵循大量原则。
抽样误差
第六章 抽样推断
第二节 抽样误差
二、影响抽样误差的主要因素
1、样本单位数(样本容量)的多少(反比) 、样本单位数(样本容量)的多少(反比) 2、总体被研究标志变异程度的大小σ(正比) 、总体被研究标志变异程度的大小σ 正比) 3、抽样组织方式 (简单随机抽样、类型抽样、等 、 简单随机抽样、类型抽样、 距抽样、整群抽样) 距抽样、整群抽样) 4、抽样方法(不重复抽样﹤重复抽样) 、抽样方法(不重复抽样﹤重复抽样)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
五、多阶段抽样和多重抽样
1.多阶段抽样。单阶段抽样是从全及总体中直接抽取最终样本单位;当全
及总体范围较小,调查单位比较集中时常采用这种形式。 多阶段抽样是把
抽取样本单位的过程分为两个或更多个阶段来进行的抽样组织形式。较大规模
的抽样调查一般多采用多阶段抽样。
教
2.多重抽样。也叫多次抽样。是根据对不同调查目标的不同要求,在从总
过
1.抽样推断总是和一定的概率保证程度,即抽样误差落在允许范围内的可
能性,联系在一起的。
2.实际计算中一般不直接用概率保证程度,而是用一标准化变量 t,它是
测量估计可靠程度的一个重要参数,称作概率度。
程
3.抽样平均误差,抽样极限误差,概率度之间的关系:
t
x
x
p t p
4.几个常用的概率度、误差范围、概率(最好记住)
概率度(t)
误差范围( )
0.50
0.50
1.00
1.00
1.50
1.50
1.96
1.96
2.00
2.00
3.00
3.00
概率 F(t) 0.3829 0.6827 0.8644 0.9500 0.9545 0.9973
六、抽样推断的优良标准
1.无偏性:样本指标的平均数等于被估计的总体指标。 2.一致性:当样本容量充分大时,样本指标充分地接近总体指标。 3.有效性:作为优良估计量的方差应小于其它估计量的方差。
p
P(1 P) N n n N 1
四、抽样极限误差
教
1.在抽样推断中,抽样误差是客观存在的,它不能被消除和避免,而只能
控制在一定的允许误差范围内。抽样推断中根据研究目的所允许的误差范围叫
抽样极限误差。
学
2.实际中一般用以下公式: x x X
p pP
五、抽样推断的可靠程度
中缺少的条件,针对缺少的条件倒推,所有条件都满足后,把倒推的过程反过 来,即可。如:据以上资料在重复抽样条件下对总体平均数做区间估计,思路 为:估计三要素为估计值,概率保证程度,允许误差范围……
第四节 抽样组织形式
一、纯随机抽样
1.纯随机抽样也叫简单随机抽样,是按照随机原则直接从总体 N 个单位
中抽取 n 个单位作为样本,然后对样本单位进行观测,计算出样本指标,并据
程
使用寿命(小时)
产品数(件)
3000 以下
2
3000~4000
30
4000~5000
50
5000 以上
18
根据以上资料,以 9545%的概率保证程度,分重复抽样,不重复抽样;推
断总体平均数,推断总体成数;点估计,区间估计及以上分类中八种情况进行
计算。(4194.8<=X<=4486.2) 讲解时注意首先教给学生做此类题的思路:由参数估计三要素入手,找其
按一定方法随机抽取容量为 n 的样本,所有可能样本的特征值及与其相对应的
概率分布情况。
(二)抽样分布定理
三、抽样平均误差
(一)抽样平均误差的概念: 1.抽样误差是样本指标和总体指标之间的实际误差,它无法直接计算出来, 因此实际中一般用抽样平均误差来说明样本指标和总体指标之间的平均差异程 度。 2.抽样平均误差是根据所有可能样本的样平均数或样本成数计算的标准 差,即每一次抽样的样本指标和总体指标之间的平均差异程度。 3.抽样平均误差的定义公式要求掌握所有可能样本的样本平均数,而在实 际中,N 一般相当大,从中抽取容量为的样本,其可能数目极大,无法将其全 部抽出来加以计算,为此,数理统计中证明了以下公式:
5.样本指标的计算方法。
三、等距抽样
1.又叫机械抽样或系统抽样,它是将总体各单位按某一标志排列,然后按 固定的顺序和间隔抽选调查单位的组织形式。(学号,成绩)
2.种类:按有关标志排队等距抽样,按无关标志排队等距抽样。(成绩, 产量,收入;学号,地理位置)
3.按抽取样本单位的方法不同,分为随机起点等距抽样(一般只适用于按 无关标志排队的等距抽样),中点等距抽样(按有关标志排队时,可以保证样本 有充分的代表性;但是一,抽样随机性受限制,不能保证每个单位都有同等被 抽取的机会,二,从总体中只能抽出一个样本,抽样框利用率太低),对称等距 抽样。
(1)估计总体平均数的必要样本容量
(2)估计总体成数的必要样本容量 4.不重复抽样计算公式:
第三节 参数的估计方法
一、参数估计的两种方法
1.参数估计指用得到的样本指标来推断总体指标。
2.参数估计的三个要素:估计值、估计的误差范围、相应的概率保证程度。
教
3.参数估计的两种方法:
(1)点估计:用抽样指标值直接作为总体指标的估计值,同时给出极限误
践中当 N 很大时,这是很难办到的;(2)不能充分利用总体有关信息,抽样误
差较大。
5.抽取样本单位的方法:(1)抽签法;(2)滚球法;(3)计算机模拟法;
(4)随机数表法(目前广泛应用)
6.抽样指标的计算方法:抽样平均数,抽样成数,抽样平均误差。
教
7.必要样本容量的确定及应注意的问题(与极限误差的 4 倍关系,对总体
七、必要样本容量
1.既能满足抽样推断精确性和可靠性的要求,又不会造成浪费的样本数目。 2.影响必要样本容量的主要因素:(1)总体各单位之间的标志变异程度, 即总体方差和 P(1-P)的大小;(2)允许误差范围,即 值的大小;(3)要 求的概率保证程度;(4)抽样方法和抽样组织方式。 3.重复抽样计算公式:
平均数和总体成数同时进行推断时,选较大值)。
二、分层抽样
学 1.分层抽样也叫类型抽样。设总体由 N 个单位构成,把总体按某一标志
划分为 K 层(类,组),使 N=N1+N2+……+Nk,然后从每类的 Ni 个单位中随
机抽取 ni 个单位,构成容量为 n 的样本,使 n=n1+n2+……+nk,这种方法叫分
以推算总体指标的抽样组织形式。
2.是最简单,最基本的抽样组织形式。适用于均匀总体。
3.优点:(1)从理论上最符合随机原则(总体中各单位被抽中的可能性完
全相等;总体中各可能样本被抽中的可能性完全相等);(2)是设计其它复杂抽
样形式的基础;(3)是衡量其它抽样形式抽样效果的比较标准。
4.实际应用中的局限性:(1)纯随机抽样要求对全部单位进行编码,在实
教学 难点
及 突破 方法
难点:类型抽样时的参数估计方法
突破方法:示例讲解法、习题练习
相关 内容 素材
教师授课思路、设问及讲解要点 第一节 抽样推断的一般问题
一、抽样推断的概念
抽样推断指按照随机原则,从总体中抽取一部分单位进行实际调查,然后根据 调查所得的样本数据对总体的特征值做出具有一定可靠程度的推断,以反映总体的 数量特征和数关系。
教师授课思路、设问及讲解要点
(1)用样本平均数推算总体平均数的抽样平均误差:
重复抽样公式:
x
2 nn
不重复抽样公式:
x
2 Nn n N 1 n
N n N 1
(2)抽样成数的抽样平均误差
重复抽样公式:
p
P(1 P) n
P(1 P) n
不重复抽样公式:
层抽样或类型抽样。
过
2.特点:把统计分组和贯彻随机原则结合起来。先对总体按某一标志分类
(分层),然后从各层中按随机原则抽选一定数目单位构成样本。
3.意义:(1)可以提高样本的代表性(样本单位是从各类型组中抽取的,
包含了各种类型,各种水平的单位,因此样本的代表性要比纯随机抽样好);(2)
程
可以缩小抽样平均误差的总体方差。 4.抽取样本单位的方法:等比例分层抽样,不等比例分层抽样。
因素的个别影响将相互抵消,从而显示出它们共同作用的倾向,使总体具有稳
教
定的性质。(硬币)
3.对统计学的意义;
(1)通过对大量现象构成的总体进行研究,可以发现现象的规律性;(硬
Hale Waihona Puke 币)学(2)现象的总体规律性通常以平均数的形式表现出来; (3)总体包含的单位数越多,平均数就越能正确反映现象的规律;
(4)各单位的共同倾向决定着平均数的水平,而各单位对平均数的离差则
样总体。样本总体中所包括的单位数叫样本容量,一般用 n 表示。
(二)全及指标和样本指标
过
1.全及指标:根据全及总体中各单位标志值或标志属性计算的,反映总体某
种特征的指标叫全及指标,又叫总体指标。它是我们推断的指标,其值是唯一确
定的。全及指标主要包括:总体平均数、体成数、总体方差、与标准差、总体成数
的方差与标准差
二、抽样推断的特点:
1.建立在随机原则基础上; 2.运用概率论的原理,目的在于推断总体指标; 3.它的误差可以事先计算和控制。
三、抽样推断的应用
教 四、抽样推断的几个基本概念
(一)全及总体和样本总体
学
1.全及总体:研究对象的全体,即第一章中学过的总体。全及总体中所包括的 单位数一般用 N 表示。
2.样本总体:按随机原则从全及总体中抽取一部分单位组成的集合体,又叫抽
第二节 抽样推断的基本原理
一、抽样推断的理论依据
(一)抽样推断的理论依据是概率论中的大数法则与中心极限定理。
1.大数法则:关于大量随机现象具有稳定性质(规律性)的法则。
2.大数法则的含义:如果被研究总体是由大量相互独立的随机因素构成,
且每个因素对总体的影响都相对小,则对这些因素的影响综合平均的结果,各
会由于足够多单位的综合绘总的结果而相互抵消,趋于消失。
(二)抽样推断的理论支持主要体现在它可以证明:如果随机现象存在有限的
过