第6章 抽样和抽样分布 袁卫
第6章抽样与抽样分布
服从某种分布,若它们的和X Y也 服从同一种分布(参数有所不同),我们 就称该分布具有可加性.
1.设X ,Y独立,且X ~ B(m, p),Y ~ B(n, p),
则X Y ~ B(m n, p)
2.设X ,Y独立,且X ~ P(1),Y ~ P(2 ),
定义2 从总体中抽出的一部分个体叫样本(子 样).样本中所含个体的数目叫做样本容量.样本所 取的值叫做样本值.
由于抽样具有随机性,所以样本是一组随机变量 (或随机向量).
一个容量为n的样本记为
X1, X2,, Xn
样本值记为
(x1,x2, xn)
抽样方法满足的条件:
(1) 随机性
(2) 独立性
(2)显然P( X x2 ) 0.01
由对称性得 : P( X x2 ) 0.005
查表得: x2 t0.005 (10) 3.1693
t分布的性质
(1)其密度函数f(x)为偶函数; (2)当n较大时,其分布很接近正态分布.
(3)t1 (n) t (n) 在n 45时,t (n) u
常用统计量 样本均值
样本方差
X
1 n
n i 1
Xi
S 2
1 n 1
n i 1
(Xi
X
)2
样本标准差
S
1 n 1
n i 1
(Xi
X
)2
样本k阶原点矩 样本k阶中心矩 样本离差平方和
Ak
1 n
n i 1
X
k i
Bk
1 n
n
(Xi
i 1
X )k
n
(Xi X )2
第六章 样本及抽样分布
PPT文档演模板
第六章 样本及抽样分布
•定理1的证明
PPT文档演模板
第六章 样本及抽样分布
•定理1的证明及密度函数图
PPT文档演模板
第六章 样本及抽样分布
•X2—分布
PPT文档演模板
第六章 样本及抽样分布
PPT文档演模板
第六章 样本及抽样分布
PPT文档演模板
第六章 样本及抽样分布
PPT文档演模板
PPT文档演模板
第六章 样本及抽样分布
•F—分布
PPT文档演模板
第六章 样本及抽样分布
PPT文档演模板
第六章 样本及抽样分布
PPT文档演模板
第六章 样本及抽样分布
PPT文档演模板
第六章 样本及抽样分布
•正态总体的样本均值与样本方差的分布
PPT文档演模板
第六章 样本及抽样分布
•定理1的证明
PPT文档演模板
第六章 样本及抽样分布
•总体、个体、样本、样本容量、样本值
•取的值是不同的。在试验中,抽取了若干个个体 就观察到了x的这样或那样的数值,因而这个数量 指标X是一个随机变量,而X的分布就完全描写了 总体中我们所关心的那个数量指标的分布状况。 由于我们关心的正是这个数量指标,因此我们以 后就把总体和数量指标X可能取值的全体组成的 集合等同起来,所谓总体的分布也就是指数量指 标x的分布。
第六章 样本及抽样分布
PPT文档演模板
2020/11/27
第六章 样本及抽样分布
•本章小结 概率论的基本概念
•习题
数理统计的基本概念 抽样分布
PPT文档演模板
•退出 第六章 样本及抽样分布 •返回
数理统计的基本概念
z 总体和样本 z 统计量 z 顺序统计量和经验分布函数
《统计学》(袁卫 第四版)课后答案.pptx
答:总体参数是固定的,未知的,置信区间是一个随机区间。置信水平为95%的置信区间的含义是指,在相同 条件下多次抽样下,在所有构造的置信区间里大约有95%包含总体参数的真值。
.简述样本容量与置信水平、总体方差、允许误差的关系
答:以估计总体均值时样本容量的确定公式为例:〃=卜“『
(3)个人对股票的选择,与其风险偏好等因素有关。
第四章
1.总体分布指某个变量在总体中各个个体上的取值所形成的分布,它是未知的,是统计推断的对象。从总体中随 机抽取容量为n的样本。,λ2,∙,王),它的分布称为样本分布。由样本的某个函数所形成的统计量/(3,λ2,,天),它的分布 称为抽样分布(如样本均值、样本方差的分布)
5对比率数据的平均,为什么采用几何平均?
答:比率数据往往表现出连乘积为总比率的特征,不同于一般数据的和为总量的性质,由此需采用几何平均。
6.简述众数、中位数和均值的特点和应用场合。
答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑 的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端 数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。
.简要说明统计数据的来源
答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域, 主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得 。
.简要说明抽样误差和非抽样误差
答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理 论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的 。
第六章 样本及抽样分布1精品PPT课件
二.样本
1.抽样: 从总体中抽取若干个体的过程。
2.样本: 从总体中抽取若干个体, 观察得随机变量的一组试验 数据(观测值), 样本中所含个体的数量称为样本容量。
从总体中抽取样本, 一般假设满足下述条件: (1) 随机性: 使总体中的每一个个体有同等机会被抽取到; (2) 独立性: 每次抽样的结果既不影响其他各次抽样的结果,
1
f
xn
b
1n
0
a xi b 其他
测试题B答案:
一.填空题。
1. 1)满足X1, X2 , … X n独立且同分布
2. 21) 2 n
n
2.
Xi p i1
n
1 p
n Xi
i1
,
E X p,
p 1 p DX
n
3. 5/8
二.计算题。
解: 因为X1, X2 , … X n来自均匀分布总体 N , 2 ,则X1, X2 , …
3. 简单随机样也本不:受由其随他机各的次, 独结立果的的抽影样响方;法得到的样本, 这 种随机的, 独立的抽样方法称为简单随机抽样。
注: 今后凡是提到抽样与样本, 都是简单随机抽样与简单随 机样本。
由于从总体中抽取容量为n的样本, 即是对代表总体的随 机变量X随机的,独立的进行n次试验, 每次试验结果可以看作 一个随机变量, n 次试验结果就是n个随机变量 X1, X2 , … X n , 它们相互独立且与总体X同分布。
则的联合概率密度为 。
二. 计算题。
1. 设X1, X2 , … X n是来自均匀分布总体U (a , b)的样本, 求样本 (X1, X2 , … X n)的联合概率密度。
第六章_抽样分布及总体平均数的推断
第四节 总体平均数的显著性检验
总体平均数的显著性检验是指对样本平 均数与总体平均数之间的差异进行的显著性 检验。若检验的结果差异显著,可以认为该 样本不是来自当前的总体,而来自另一个、 与当前总体存在显著差异的总体。即,该样 本与当前的总体不一致。
.
一、总体平均数显著性检验的原理
检验的思路是:假定研究样本是从平均 数为μ的总体随机抽取的,而目标总体的平 均数为μ0,检验μ与μ0之间是否存在差异。 如果差异显著,可以认为研究样本的总体不 是平均数为μ0的总体,也就是说,研究样本 不是来自平均数为μ0的总体。
Xt11 0.01
S n 1
Xt11 0.01
S n 1
2
2
2.9 9 1 3 .1 7 0 3 .9 62 6 2.9 9 1 3 .1 7 0 3 .9 62
1 1 2
1 1 2
2.6 240 3.3 594 .
③总体正态,σ未知,大样本
平均数的抽样分布接近于正态分布,
用正态分布代替t分布近似处理:
XZ
2
SnXZ 2
S n
(9.3)
.
例题3:从某年高考中随 机抽取102份作文试卷,算得 平均分数为26,标准差为1.5, 试估计全部考生作文成绩95 %和99%的置信区间。
.
解:学生高考分数假定是从正态总体 中抽出的随机样本,而总体的标准差σ未 知,样本平均数与总体平均数离差统计量 呈t分布。但是由于样本容量较大
从呈t分布。
于是需用t分布来估计该校三年级学生阅
读能力总体平均数95%和99%的置信区间。
.
由原始数据计算出样本统计量为
X 29.917
S3.926
当P=0.95时, t11 2.201 0.0 5
第6章抽样分布与参数估计
抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
★ 讨论题 为什么说抽样分布是抽样理论研究的对象,解释三种分布之 间的联系。
/3:22
《统计学教程》
第6章 抽样分布与参数估计
6.1 抽样分布
6.1.4 样本均值的抽样分布 1.大样本场合下的样本均值抽样分布
总体(Population)是指所研究的事物及其现象的全体,由该事物及 其现象的全部个体组成。
个体(Item Unit)是指构成总体的元素。 总体容量(Population Size)是指构成总体的全部个体的数量。
样本(Sample)是指从总体抽取的若干个体构成的集合。 抽样(Sampling)是指按照具体的抽样方法和抽样设计,从总体中抽 取若干个体的过程。 样本容量(Sample size)是指构成样本的全部个体的数量。
ln i mPnnA
PA
1
(6.1)
贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而 以严格的数学形式表述了频率的稳定性特征,即n当很大时,事件发生 的频率与概率之间出现较大的偏差的可能性很小。由此,在n充分大的 场合,可以用事件发生的频率来替代事件的概率。
/3:22
《统计学教程》
第6章 抽样分布与参数估计
在反复抽取容量相同的独立同分布样本条件下,所得到的样本均值的 概率分布称为样本均值的抽样分布。在样本容量充分大的情况下,即大 样本场合,样本均值依据中心极限定理趋于正态分布。
所谓独立同分布样本为从无限总体中随机抽取的等概样本,或从有限 总体中以放回方式,随机抽取的等概样本。
所谓大样本是指能够满足中心极限定理要求,使样本均值趋于正态分 布的样本容量。在统计实践中一般称样本容量大于30即为大样本这只是 一个粗略的经验数值。
应用统计学 第六章 抽样及抽样分布.
第六章 抽样与抽样分布
在重复选取容量为 n 的样本时, 由样本比例的所有可能取值形成 的相对频数分布
当样本容量很大时,样本比例的 抽样分布可用正态分布近似
( p ) N (0,1) p
(1 )
2 p
n
(1 )
N
n
n N 1
重复抽样 不重复抽样
2019年8月6日星期二4时44分52秒
1.简单随机抽样 2.分层抽样 3.系统抽样 4.整群抽样
第六章 抽样与抽样分布
保证样本的结构与总体的结构比较相近, 从而提高估计的精度
组织实施调查方便
应用统计学
2019年8月6日星期二4时44分52秒
1.简单随机抽样 2.分层抽样 3.系统抽样 4.整群抽样
提供了样本统计量长远而稳定的信息, 是进行推断的理论基础,也是抽样推断 科学性的重要依据
应用统计学
2019年8月6日星期二4时44分52秒
第六章 抽样与抽样分布
应用统计学
2019年8月6日星期二4时44分52秒
1.样本均值的抽样分 布
2.样本比例的抽样分 布
3.样本方差的抽样分 布
第六章 抽样与抽样分布
1
2
,
1(1 n1
1
)
2
(1 n2
2
)
应用统计学
2019年8月6日星期二4时44分52秒
第六章 抽样与抽样分布
1.样本均值之差的抽样 分布
2.样本比例之差的抽样 分布
3.样本方差比的抽样分 布
( x1 x2 )
N
概率论与数理统计第六章
例6.3(例6.l续)在例6.l中,若农户年收入以万元 计, 假定N户中收入X为以下几种取值:
0.5, 0.8, l, 1.2和1.5。 取这些值的农户个数分别为:n1, n2, n3, n4, n5, (这里n1+n2+n3+n4+n5=N)。
,
0, x x(1)
Fn
(
x)
k
/
n,
x(k ) x x(k1)
1,
x x(n)
对不同的样本值, 得到的 经验分布函数不同。但 当样本容量较大时, 经验 分布函数Fn(x)是总体分 布函数F(x)的良好近似。
统计量的分布称为抽样分布。数理统 计中常用到来自正态总体的三个分布:
2—分布、 t —分布和F—分布。
而在数理统计中的随机变量,它的分布是未知的 ,或者不完全知道,人们通过对所研究的随机变 量进行重复、独立的观察,得到许多观察值,对 这些数据进行分析,从而对随机变量的分布作出 种种判断。
现实世界中存在着形形色色的数据,分析这些数据 需要多种多样的方法。 因此,数理统计中的方法和支持这些方法的相应理 论是相当丰富的,概括起来可以归纳成两大类: 参数估计──根据数据,用一些方法对分布的未知 参数进行估计。 假设检验──根据数据,用一些方法对分布的未知 参数进行检验。 它们构成了统计推断的两种基本形式。这两种推断 渗透到了数理统计的每个分支。
n i 1
X
2 i
nX
2
)
它反映了总体 方差的信息
样本标准差 S S2 ,
第6章抽样与抽样分布2
PPT文档演模板
第6章抽样与抽样分布2
•该密度 函数的图 像是一只 取非负值 的偏态分 布
PPT文档演模板
第6章抽样与抽样分布2
•F 分布
•定义 设X1 2(m), X2 2(n), X1与X2独立,则称
F =(X1/m)/(X2/n) 的分布是自由度为 m 与 n • 的 F分布,记为F F(m, n),其中m 称为分子 自由度,n 称为分母自由度。
命中率 有关的信息,统计上将这种“样本加工
不损失信息”称为“充分性”。
•样本 x=(x1,x2,…,xn) 有一个样本分布F (x),
•这个分布包含了样本中一切有关的信息。
PPT文档演模板
第6章抽样与抽样分布2
•统计量T =T (x1,x2,…,xn) 也有一个抽样分 布FT(t) ,当我们期望用统计量T 代替原始
PPT文档演模板
第6章抽样与抽样分布2
• 自由度为1的 t 分布就是标准柯西分布, • 它的均值不存在; • n1时, t 分布的数学期望存在且为0;
• n2时,t 分布的方差存在,且为n/(n2);
• 当自由度较大 (如n30) 时, t 分布可以用 • 正态分布 N(0,1)近似。
PPT文档演模板
•当随机变量F F(m,n) 时,对给定 (01) ,称满足 P(F F1(m,n)) =1 的F1(m,n) 是 自由度为m 与 n 的F 分布的1 分位数。
•由 F 分布的构造知 F(n,m) = 1/F1(m,n)。
PPT文档演模板
第6章抽样与抽样分布2
•该密度函 数的图象也 是一只取非 负值的偏态 分布
1. 由简单随机抽样形成的样本 2. 从总体N个单位中随机地抽取n个单位作为
第六章 样本与抽样分布
定理 1 (样本均值的散布)
设X1, X2, … , Xn 是取自正态总体N ( , 2 )
的样本,则有:
X ~ N( , 2 )
n
X ~ N(0,1) n
E(
X
)
E(
1 n
n i1
Xi
)
1n
2
D( X ) D( n i1 Xi ) n
假定将样本观测值由小到大停止陈列为x(1)
那么 x(2) x(n)
x(1)
x(2) x(n)
称为有序样本 用有序样本定义如下函数:
0
Fn (x)
PX
x}
k
n
1
当x x(1)
当x(k ) x x(k 1)
当x(n) x
那么Fn (x) 是一非负又延续函数,且满足
Fn () 0 Fn () 1 称 Fn (x) 为阅历散布函数。
说明:对每一个x, Fn (x) 是样本中事情 " xi x" 发作的频率 当n固定时,Fn (x) 样本的函数,它是一个随机变量* 由伯努利达数定理:只需n相当大,Fn (x) 以概率收敛于F(x)
Glivenko定理: 设 X1, X 2 X n 是取自总体X散布函数为F(x)的样本,Fn (x)
n
(xi x) 0
i 1
样本中数据与样本均值 的偏向之和为0
定理: 设 X1, X 2,, X n 是来自某总体的样本,
为 X 样本均值。
(1)若总体分布为 N( μ,σ2), 则 的X 精确分 布为 N(μ, σ2/n ) ;
(2)若总体分布未知或不是正态分布, 则 X 的极限分布为 N(μ, σ2/n ) ;
F ~F ( n1 , n2 ) .
抽样及抽样分布
服从第一自由度为 n1 , 第二自由度为 n2 的 F分布。
定理:设若 和 X1,, Xn1 Y1,,Yn2 分别是来自正态 总体 N (1, 12 )和 N(2, 22 )的样本,且相互独立。 样本修正方差分别为
S *2 ( X X )2 /(n 1)1i1i1
S *2 2
按随机原则抽取样本;目的在于用样本 指标推断相应的总体指标进行估计、推断; 可以计算和控制抽样误差。
NEXT
总体参数— 描述总体数量特征的指标。总体是惟一的, 所以参数也是惟一的;
样本统计量— 描述样本数量特征的指标,由样本计算而 得。由于样本是随机的,所以样本统计量是随机变量。
总体参数
样本统计量 样本统计量公式
第一节 抽样法的概述
抽样法的概念与特点 总体参数与样本统计量 抽样的方法 非抽样误差和抽样误差
概念 抽样调查是一种非全面调查。它按随机的原则 从总体中抽出部分单位(简称样本)进行调查,以 获得有关的数据资料。 抽样推断是根据抽样调查所获得的样本信息, 对总体的数量特征做出具有一定可靠程度的估计和 推断。
NEXT
第三节 抽样的组织方式
简单随机抽样 分层抽样 等距抽样 整群抽样
多阶段抽样
简单随机抽样:简单随机抽样又称纯随机抽样, 是直接从总体中按随机的原则抽容量为 n 的样本, 每一个总体单位有相同的可能性被抽中。
特点:在差异较大的总体中,简单随机抽样的 样本不一定能保证样本的代表性。
NEXT
P1(1 P1) P2 (1 P2 )
n1
n2
NEXT
三、由正态分布导出的几个重要的分布
分布 2
t 分布
F分布
2 分布 :
抽样及抽样分布
抽样及抽样分布引言在统计学中,抽样是从总体中选择一部分个体进行研究的过程。
通过抽样可以获得总体的估计值,从而对总体进行推断。
抽样是统计学的基础,也是进行统计推断的前提。
本文将介绍抽样的基本概念和方法,以及抽样分布的概念和特性。
抽样方法进行抽样时,需要选择合适的抽样方法。
常见的抽样方法包括简单随机抽样、系统抽样、分层抽样和群组抽样等。
简单随机抽样简单随机抽样是最基本的抽样方法,每个个体被随机地选入样本,且每个个体被选入样本的概率相等。
这种方法可以确保样本具有代表性。
系统抽样系统抽样是按照一定的规则从总体中选取样本,例如每隔一定间隔选取一个个体。
这种方法简单实用,但需要注意规则的选择是否会引入偏差。
分层抽样分层抽样是将总体分成若干层,然后从每层中随机选取个体组成样本。
这种方法可以保证每个层次都有足够的代表性。
群组抽样群组抽样是将总体划分为若干群组,然后随机选取若干群组作为样本。
这种方法适用于总体中包含多个群组,但群组内个体相似的情况。
抽样分布抽样分布是指抽样统计量的分布。
统计量可以是样本均值、样本方差、样本相关系数等。
样本均值的抽样分布假设总体服从正态分布,样本均值的抽样分布也会服从正态分布。
根据中心极限定理,当样本容量足够大时,样本均值的抽样分布将变得更加接近正态分布。
样本方差的抽样分布样本方差的抽样分布是以总体方差为参数的分布,通常服从卡方分布。
样本容量的大小将影响样本方差的抽样分布形状。
样本相关系数的抽样分布样本相关系数的抽样分布通常是以总体相关系数为参数的分布。
样本容量的增加会使样本相关系数的抽样分布趋向于正态分布。
抽样误差与置信区间抽样误差是指样本统计量与总体参数之间的差异。
抽样误差的大小会受到样本容量和抽样方法的影响。
为了评估抽样结果的可靠性,可以构建置信区间。
置信区间是总体参数的一个区间估计,表示总体参数落在该区间的概率。
置信区间的宽度与置信水平、样本容量以及总体标准差等相关。
较高的置信水平会使置信区间变得更宽,而较大的样本容量和总体标准差会使置信区间变得更窄。
应用统计学第6章 抽样分布与参数估计
μx
6. 3抽样分布
多大是足够的大?
6. 3抽样分布
例子
假设总体的平均数μ = 8 且标准差σ = 3. 假 设选中容量n = 36随机样本。
样本平均数介于7.8和8.2之间的概率是多少?
第6章 6. 3抽样分布
例子
(续)
结论:
即使总体非正态分布, 中心极限定理可以应用 (n > 30)
6.2 抽样误差
样本统计量和对应的总体参数之间的差异,称之为抽 样误差。
抽样误差的产生是由于抽样的非全面性和随机性所引 起的,是偶然性误差。
非抽样误差
抽样框误差 系统性误差 测量误差 登记误差
6. 3抽样分布
6. 3抽样分布
6.3.1 样本均值的抽样分布
6. 3抽样分布
1.样本均值的均值
样)
6. 3抽样分布
p的抽样分布
近乎正态分布分布,如果:
n 5
P( ps)
抽样分布
.3
且
.2
.1
n(1 ) 5
0 0 . 2 .4 .6
p
81
μ 其中 p
π
且
π(1 π)
σp
n
(其中 π = 总体比例)
6. 3抽样分布
比例的Z值
使用公式将p标准化为Z值:
p
Z
σp
p (1 )
n
在判断样本中,我们得到预先选好的专家就主题 发表的意见。
6.1 抽样理由和抽样方法
样本类型:概率样本
在概率样本中, 样本中条目的选择基于已知的概率。
概率样本
简单 随机样本
系统样本
分层样本 群样本
6.1 抽样理由和抽样方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6.1 抽样的基本概念
6.1.1 抽样推断 6.1.2 抽样的方法 6.1.3 样本容量和样本个数 6.1.4 参数和样本统计量 6.15 抽样框 6.1.6 抽样的组织形式 6.1.7 抽样误差
抽样推断的含义
从研究现象总体的所有单位中,按照随机原 则抽取部分单位作为样本,然后以样本的观 测结果对总体的数量特征作出具有一定可靠 程度和精度的估计或推断的一种统计调查方 法。
不论总体服从何种分布,只要其数学期望和方差存在, 对这一总体进行重复抽样时,当样本量n充分大,就趋于 正态分布 该定理为均值的抽样推断奠定了理论基础。
中心极限定理
x n
一个任意 分布的总 体
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
抽样推断的内容
(一)参数估计 (二)假设检验
6.1 抽样的基本概念
6.1.1 抽样推断 6.1.2 抽样的方法 6.1.3 样本容量和样本个数 6.1.4 参数和样本统计量 6.15 抽样框 6.1.6 抽样的组织形式 6.1.7 抽样误差
6.1.2 抽样的方法
抽样的方法
重复抽样
A CM N B L P D J F KO E H I G
L
H
P D
样本容量
n n d n p nl n h
简单、方便,能节省人力、物力、财 力和时间,但其样本代表性可能较差
多阶段抽样
—— 指分两个或两个以上的阶段来完成抽 取样本单位的过程 例:在某省100多万农户抽取1000户调查 农户生产性投资情况。
例题分析
[例] 一个汽车电池的制造商声称其最好的电池 寿命的分布均值为54个月,标准差为6个月。 假设某一消费组织决定购买50个这种电池作为 样本来检验电池的寿命,以核实这一声明。 (1)假设这个制造商所言真实,试描述这50 个电池样本的平均寿命的抽样分布 (2)假设这个制造商所言真实,则消费组织的 样本寿命均值小于或等于52个月的概率是多少?
不重复抽样
重复抽样:也叫回置抽样。 特点:每个单位在每次抽中机会一样。 不重复抽样:也叫不回置抽样。 特点:每个单位在每次抽中机会不一样;每个 单位最多只能被抽中一次。 不重复抽样的抽样平均误差小于重复抽样的 抽样平均误差。
6.1.1 抽样推断 6.1.2 抽样的方法 6.1.3样本容量和样本个数 6.1.4 参数和样本统计量 6.15 抽样框 6.1.6 抽样的组织形式 6.1.7 抽样误差
6.1.4 参数和统计量 参数(parameter)
来描述总体数量特征的指标,又称总体指标。即对总体特征的 数量描述。参数已知,总体的分布特征就已知。
所关心的参数主要有总体均值()、标准差()、总体比例 (P/ )等
用 表示 参数的特点:参数的数值是客观存在的,总体一定,参数就唯
解: (1) 尽管对电池寿命的总体分布状态不知,仍可以根据中 心极限定理推断,电池平均寿命的抽样分布近似正态分布。
6 E(x)= =54(个月) x 0.85(个月) n 50 52 54 (2) P 52) P( z (x ) P( z 2.35) 1 0.990613 0.85 0.009387
6.15抽样框
抽样框:全部抽样单位的名单框架。抽样框的好坏通 常会直接影响到抽样调查的随机性和调查效果。有如 下几种抽样框形式: 名单抽样框:列出全部总体单位的名录一览表。如职 工名单,企业名单。 区域抽样框:按地理位置将总体范围划分为若干小区, 以小区为单位进行抽样。如市住房调查划分为街道、 区片。 时间抽样框:将总体全部单位按时间顺序排列,每隔 一定时间抽样。如流水线抽样进行产品质检。
第6章 抽样与抽样分布
第6章
6.1 6.2 6.3 6.4
抽样与抽样分布
抽样的基本概念 抽样分布基本理论 样本抽样分布 抽样误差的计算
学习目标
1. 2. 3. 4. 5. 了解抽样中的概率抽样方法 理解抽样分布的意义 了解抽样分布的形成过程 理解中心极限定理和大数定理 理解抽样分布的性质
第一阶段:从该省所有县中抽取5个县 第二阶段:从被抽中的5个县中各抽4个乡 第三阶段:从被抽中的20个乡中各抽5个村 第四阶段:从被抽中的100个村中各抽10户
样本n=100×10=1000(户)
抽样组织方式的选择 在实际工作中,选择适当的抽样组 织方式主要应考虑: 调查对象的性质特点 对调查对象的了解程度 抽样误差的大小 人力、财力和物力等条件的限制
简单随机抽样
(simple random sampling)
——对总体单位逐一编号,然后按随机原 则直接从总体中抽出若干单位构成样本
应用
仅适用于规模不大、内部各单位 标志值差异较小的总体
是最简单、最基本、最符合随机原则, 但同时也是抽样误差最大的抽样组织形式
抽签、随机数字表法
59079 48391 67072 86050 84426
x
中心极限定理
x 的分布趋 于正态分布 的过程
6.2.2正态分布的再生定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数 学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)
=10
n=4 x 5 n =16 x 2.5
6.1.3 样本容量和样本个数
样本容量:样本中的单位数,通常用字母n 表示。
通常,n≥30的样本称为大样本, n<30的样 本称为小样本。
样本个数:从总体中可能抽得的样本的数目
从总体N中随机抽取n个样本单 位共有多少种可能的抽选结果 样本的可能数目 与抽样方法和是否考虑顺序有 关。有以下四种组合: ⒈ 重复抽样考虑顺序 ⒉ 不重复抽样考虑顺序 3. 不重复抽样不考虑顺序 4 重复抽样不考虑顺序(不常用)
表示
总体
样本
参数
统计量
平均数 标准差 比例 x s p
( P)
6.1 抽样的基本概念
6.1.1 抽样推断 6.1.2 抽样的方法 6.1.3 本容量和样本个数 6.1.4 参数和样本统计量 6.15 抽样框 6.1.6 抽样的组织形式 6.1.7 抽样误差
一确定,但却是未知的。
f ( x)
1 e 2
( x )2 2
2
( x )
统计量(statistic)
又称样本指标或估计量,是根据样本数据计算出来的一 些量,用以推断总体参数(总体指标)的综合指标。 特点:是随样本不同而不同的随机变量,不含未知参数。 所关心的样本统计量有:样本均值(x)、样本标准差(s)、 样本比例(p)等 用
答:消费组织的样本寿命均值小于或等于52个月的概率是0.94%。
6.2.3 大数定律
大数定律是阐述大量同类随机现象的平均结果 的稳定性的一系列定理的总称。 1. 独立同分布大数定律 2. 贝努里大数定律
独立同分布大数定律
——设X1, X2, …是独立同分布的随机变量 序列,且存在有限的数学期望E(Xi)=μ和方 差D(Xi )=σ 2(i=1,2,…),则对任意小 的正数ε, 有:
68260 43880 82290 61467 98294
79820 08133 95922 51683 64512
91123 09898 96329 43833 19201
注意: 必须先对总体中的每一个单位进行编码或编号, 确定抽样框。 简单随机抽样适合于调查标志在各单位分布较均 匀的总体,一般情况下,简单随机抽样的效果相 对差些。
= 50
X
x 50
x
总体分布
抽样分布
例题分析
[例]某酒店电梯中质量标志注明最大载重为18人, 1350kg。假定已知该酒店旅客及其携带行李的平均重 量为70kg,标准差为6kg。试问随机进入电梯18人, 总重量超重的概率是多少?
解:已知人的体重服从正态分布,根据中心极限定理 18个人的平均体重也服从正态分布, ~ N (70, 6 2 /18) x 1350 75 70 P( x ) P( x 75) P( z ) P( z 3.535) 18 6 / 18 1 P( z 3.535) 1 0.999792 0.00021 答:随机进入18人,超重的概率为0.02%。
随机起点 半距起点 对称起点
·· ·· ··
(总体单位按某一标志排序) 按无关标志排队,其抽样效果相当于简单随机抽样; 按有关标志排队,其抽样效果相当于类型抽样。
整群抽样 (cluster sampling)
—— 将总体全部单位分为若干“群”,然后 随机抽取一部分“群”,被抽中群体的所有 单位构成样本 例:总体群数R=16 样本群数r=4
总体
随机样本
抽样推断方法的特点 1.在调查单位的抽取上遵循随机原则 2.以样本的数量特征去推断总体的数量特征 3.存在抽样误差,可计算并加以控制
抽样推断的作用
一、了解不能或难以采用全面调查的总体的 数量特征 二、与全面调查相结合,修正和补充全面调 查 三、在生产过程中进行质量控制 四、可以对总体的某种假设进行检验
46755 76486 33693 07331 40439
72348 60421 81976 89994 57595
69595 69414 68018 36265 37715
53408 37271 89363 62934 16639
92708 89276 39340 47361 06343
67110 07577 93294 25352 00144