管理统计学抽样分布与参数估计模板
抽样分布与参数估计
▪ 某电视台欲在95%的置信度水平下,对电
视节目的收视率作为有效的估计,试考 虑样本量应当为多少?
▪ 问题:若确定估计绝对误差为5%,则样
本为385户,是否可行?
▪ 若考虑估计相对误差为10%,则样本量应
当为多少?
统计学原理
其他样本量估计的情况
▪ 估计样本比例时样本量的确定 ▪ 估计两个总体均值之差时样本量的确定 ▪ 估计两个总体比例之差时样本量的确定 ▪ 以上问题,均可通过参数估计的公式进行
o 比例估计时,方差为:p(1-p) o 可知,p(1-p)的最大值为0.25。
统计学原理
比例估计时的样本量推算
在校园内估计学生拥有手机的比例,希 望在95%的置信水平下,估计的绝对误 差不超过5个百分点(5%),求样本量
n
1.962
0.052
2
, 取
2
Max
0.25
则有n 385
统计学原理
助记方法
统计学原理
统计学原理
一个总体参数—总体均值
▪ 正态总体,方差已知;
o 或非正态总体,大样本,方差已知。
z x ~ N (0,1) X n
置信区间:
(
x
za
2
X
n
,
x
za
2
X
n
)
注意:Z取a/2的原因在于此时置信 区间是最小的。
统计学原理
一个总体参数—总体均值
▪ 正态总体,方差未知
统计学原理
计算结果
▪ 计算样本平均数:X=39.5 ▪ 计算样本标准差:s=7.7736 ▪ 令:总体标准差=样本标准差,计算抽样误差为
1.2956
统计学 第 6 章 抽样与参数估计
第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值,样本比例,样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。
第六章抽样分布与参数估计PPT
6.1.3.3 抽样平均误差
对一个全及总体进行抽样调查时,可以抽出很多个样本。而每 一个样本都可以计算抽样的平均数和抽样成数,这样,样本的平均 数与总体的平均数,样本的成数与总体的成数之间的误差,也有多 种多样。因此,必须用抽样平均误差来反映抽样误差的一般水平。 抽样平均误差为抽样平均数(或抽样成数)对总体平均数(或 总体成数)的标准差。为了区别于通常的标准差,我们分别用 x 表 示抽样平均数的平均误差,用 p 表示抽样成数的平均误差。用M表 示样本的可能数目。则有:
6.1.2.4 重复抽样和不重复抽样
2、不重复抽样 不重复抽样是从全及总体中抽取第一个样本单位,记录该单位 有关标志表现后,这个样本单位不再放回全及总体中参加下一次抽 选。然后,从总体N-1个单位中随机抽选第二个样本单位,记录了 该单位有关标志表现以后,该单位也不再放回全及总体中去,再从 全及总体N-2单位中抽选第三个样本单位,照此下去直到抽选出n个 样本单位。 一般地说,要从总体N个单位中随机不重复抽取n个单位为: N(N-1)(N-2)…(N-n+1)=N!/(N-n)! 由此可见,在相同的样本容 量要求下,不重复抽样的样本总是比重复抽样的样本个数少. 可见,不重复抽样时,总体单位数在抽选过程中是逐渐减少 的,而且各单位没有重复被抽中可能。 两种抽样方法会产生三个差别:①抽取的样本可能数目不同; ②抽样误差的计算公式不同;③抽样误差的大小不同。
6.1.3.4 抽样极限误差
通常用Δ表示抽样极限误差,设Δx和Δp分别表示抽样平均数 和抽样成数的可能误差范围,则有: Δx=| x - X (6-7) Δp=|p - P| (6-8) 根据概率论数理统计原理,样本平均数和样本成数分别渐进地 2 服从于N(X, ux )和N(P,p(1-p))的正态分布。因此有: P{| x - X |≤2· x}=0.9545 P{|p - P|≤2· p}=0.9545 即抽样极限误差在2倍的抽样平均误差范围内的可能性为 95.45%。也就是说,我们有95.45%的可靠性程度来判断,样本指 标与总体指标之间的误差不超过2 x 或者2 p 。
统计学课件05第5章抽样与参数估计
反映样本数据的集中趋势和平均水平。
样本方差
定义
样本方差是每个样本数据与样本均值差的平方和的平均值,即 $s^2 = frac{1}{n} sum_{i=1}^{n} (x_i - overline{x})^2$。
计算方法
先计算每个样本数据与样本均值的差,然后将差平方,最后求和平 均。
作用
反映样本数据的离散程度和波动情况。
样本量的确定
根据调查目的和精度要求确定样 本量:精度要求越高,需要的样
本量越大。
根据总体规模和抽样方法确定样 本量:总体规模越大,需要的样 本量越大;分层或整群抽样较简 单随机抽样需要的样本量更大。
根据调查资源确定样本量:资源 有限时,需要在满足调查目的和 精度要求的前提下,合理确定样
本量。
02 参数估计
大数定律的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布函数F(x),则对于任意正实数ε,有 lim(n->∞)P(|X1+X2+...+Xn/n-E(X))/ε)=0,其中E(X)是随机变量X的期望值。
大数定律的实例
在抛硬币实验中,随着实验次数的增加,正面朝上的频率将趋近于0.5。
中心极限定理
中心极限定理定义
中心极限定理是指在大量独立同分布的随机变量中,不论 这些随机变量的分布是什么,它们的平均值的分布总是趋 近于正态分布。
中心极限定理的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布 函数F(x),则对于任意实数x,有lim(n->∞)P(∑Xi≤x)=∫(∞->x)F(t)dt。
样本分布的性质
无偏性
如果样本统计量的数学期 望等于总体参数,则该统 计量是无偏的。
第五章抽样分布与参数估计
第五章抽样分布与参数估计
•七、抽样调查中的几个基本概念
•(一)全及总体与样本总 体
•1.全及总体是指根据调查目的所确定的研究对象全体.简称 为总体.常用 N 表示总体单位数。
•2.样本总体是指根据随机原则从总体中抽取一部分单位所 组成的整体.常用 n 表示样本单位数(样本容量)。
•1.点估计
•点估计也叫定值估计,就是以所抽样本资料为依据, 直接根据所选择的估计量对总体指标作出一个确定值 的估计,同时表明估计的精度和概率保证程度。
•或
•2.区间估计
•区间估计就是以点估计为依据,用一个具有一定可靠 程度的区间范围来估计总体指标。
第五章抽样分布与参数估计
•对总体平均数的区间估计为:
•或 •对总体成数的区间估计为:
•或
第五章抽样分布与参数估计
•第三节 必要样本容量的确定
• 抽样调查理论中,样本容量 n 的确定具有 实实在在的意义。 n 过大,违背抽样调查的 宗旨, n 过小,则抽样误差偏大,无法作出 精确的估计。
第五章抽样分布与参数估计
•一、影响因素
•1.总体标志变动度
•各调查单位标志值之间的差异越 大•抽样分布越分散 •抽样误差越大 •若想满足一定的精度要求 , 则必要样本量就越多
•具体排队时又分
•按无关标志排队 •按有关标志排队
第五章抽样分布与参数估计
•5.多阶段随机抽样
• 多阶段随机抽样是将一次抽样后得到的样本当作总 体再次进行随机抽样,得到第二次抽样样本,然后再如 此进行下去的抽样方式。 •例如:我国农产量调查就采用五阶段抽样方式。省抽县、 县抽乡、乡抽村、村抽地块、地块抽样本点,对样本点进行 实割实测的调查方法。
04抽样分布与参数估计
中心极限定理
(central limit theorem)
中心极限定理:设从均值为,方差为 2的一个任意总 体中抽取容量为n的样本,当n充分大时,样本均值的抽 样分布近似服从均值为μ、方差为σ2/n的正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
二、样本均值的抽样分布
1.
在重复选取容量为n的样本时,由样本均 值的所有可能取值形成的相对频数分布 一种理论概率分布 推断总体均值的理论基础
2. 3.
1、样本均值抽样分布的数学特征
(数学期望与方差)
设总体有N个单位,其均值为的,方差为 取样本容量为n的样本
2 ,从中抽
样本均值的数学期望
总体参数 符号表示 样本统计量
均值
比率 方差
4.4 一个总体参数的区间估计
一、总体均值的区间估计 二、总体比率的区间估计 三、总体方差的区间估计
为什么要进行区间估计?
我从家到良乡校区的可能路径:
家 公交车站 六里桥东地铁站 9号线 房山 线 良乡大学城 出租车 家 公交车站 六里桥东公交站 832公交 步行至上课地 家 出租车 中关村校区 校车至良乡
4.
(x
i 1
n
i
x)2 ~ 2 ( n 1)
2
2分布
(性质和特点)
1.
2.
分布的变量值始终为正
分布的形状取决于其自由度 n 的大小,通常为不对 称的正偏分布,但随着自由度的增大逐渐趋于对称 期望为E(2)=n,方差为D(2)=2n(n为自由度) 可加性:若U和V为两个独立的服从2分布的随机变 量, U~2(n1) , V~2(n2), 则 U+V 这一随机变量服从 自由度为n1+n2的2分布
第5抽样分布与参数估计共72页文档
例:在某省100多万农户抽取1000户调查 农户生产性投资情况。
第一阶段:从省内部县中抽取5个县; 第二阶段:从抽中的5个县中各抽4个乡; 第三阶段:从抽中的20个乡中各抽5个村; 第四阶段:从抽中的100个村中各抽10户。
样本n=100×10=1000(户)
返回
七、抽样调查中的几个基本概念
抽样误差的范围,可以事先计算并控制
保证抽样推断的结果达到事先预定的 可靠程度。
返回
四、抽样调查的应用
抽样调查具有节省人力、物力、财力和时间等 优点,适用于以下几种情况:
对某些现象不可能或不必要进行全面调查, 而又要了解现象总体数量特征时采用抽样调 查方法;
应用抽样调查,可以检查全面调查资料的质 量,并对全面调查资料进行修订;
抽样比
同理可得:
p
p(1p) Nn n N1
当 N 很大时
p p(1np)1Nn
3. 抽样极限误差
抽样极限误差是指以样本估计总体在某种概率意义
下所允许的最大误差范围,是估计的精度。
通常用“”来表示xXx pPp
抽样极限误差与抽样平均误差之比的系数称 为抽样概率度 , 记为 t。样本容量较大时,t分布 与正态分布差别不大,用 u / 2 表示。
但是在客观实际中,总体并非都是正态 分布。对于从非正态分布的总体中抽取的样 本平均数的分布问题,需要由中心极限定理 来解决。
(三)中心极限定理
如果变量 X 的分布具有期望值 和标准差 , 从这个总体抽取容量为 n 的样本,则当 n 趋于无穷 大时,样本平均数 X 近似服从正态分布,其平均数
E( X ) 仍为 ,其标准差为 。
含义:又称分层抽样,是先将总体所有 单位按某些重要标志进行分类(层), 然后在各类(层)中独立地抽取样本单 位的一种抽样方式。
统计学复习(抽样分布、参数估计、假设检验)
两个样本均值之差的抽样分布 (1)如: ) 抽样
X1 − N(µ1,σ12 ), X2 − N(µ2 ,σ2 ),
2
则 x1 − x2 ) ~ N(µ1 − µ2 , (
σ12 σ22
n1 + n2
)
抽样
σ12 N1 − n1 σ22 N2 − n2 (x1 − x2 ) ~ N[(µ1 − µ2 , ( )+ ( )] n1 N1 −1 n2 N2 −1
对于无限总体, 对于无限总体, 一个估计 如果对任意 量如能完 ε>ˆ 0 满足条件 全地包含 LimP(|θn −θ |≥ ε ) = 0 未知参数 n→∞ 信息, 信息,即 则称 θˆ 是 θ 为充分量 的一致估计。 的一致估计。
点估计
常用的求点估计量的方法
用样本的数字特征 1.数字特征法: 1.数字特征法:当样本容量增大时 ,用样本的数字特征 数字特征法 去估计总体的数字特征。 去估计总体的数字特征。 例如,我们可以用样本平均数(或成数 和样本方差来估 例如,我们可以用样本平均数 或成数)和样本方差来估 或成数 计总体的均值(或比率 和方差。 或比率)和方差 计总体的均值 或比率 和方差。
样本均值的抽样分布(简称均值的分布) 样本均值的抽样分布(简称均值的分布) 抽样
均值µ=∑Xi/N 均值
均值 X = Σxi
n
样本均值是样本的函数, 故样本均值是一个统计量, 样本均值是样本的函数, 故样本均值是一个统计量, 统计量 统计量是一个随机变量 随机变量, 统计量是一个随机变量, 样本均值的概率分布称为 样本均值的抽样分布。 样本均值的抽样分布。
2
n
总体均值 (µ) )
X ± tα
2
( n −1 )
应用统计学第6章 抽样分布与参数估计
μx
6. 3抽样分布
多大是足够的大?
6. 3抽样分布
例子
假设总体的平均数μ = 8 且标准差σ = 3. 假 设选中容量n = 36随机样本。
样本平均数介于7.8和8.2之间的概率是多少?
第6章 6. 3抽样分布
例子
(续)
结论:
即使总体非正态分布, 中心极限定理可以应用 (n > 30)
6.2 抽样误差
样本统计量和对应的总体参数之间的差异,称之为抽 样误差。
抽样误差的产生是由于抽样的非全面性和随机性所引 起的,是偶然性误差。
非抽样误差
抽样框误差 系统性误差 测量误差 登记误差
6. 3抽样分布
6. 3抽样分布
6.3.1 样本均值的抽样分布
6. 3抽样分布
1.样本均值的均值
样)
6. 3抽样分布
p的抽样分布
近乎正态分布分布,如果:
n 5
P( ps)
抽样分布
.3
且
.2
.1
n(1 ) 5
0 0 . 2 .4 .6
p
81
μ 其中 p
π
且
π(1 π)
σp
n
(其中 π = 总体比例)
6. 3抽样分布
比例的Z值
使用公式将p标准化为Z值:
p
Z
σp
p (1 )
n
在判断样本中,我们得到预先选好的专家就主题 发表的意见。
6.1 抽样理由和抽样方法
样本类型:概率样本
在概率样本中, 样本中条目的选择基于已知的概率。
概率样本
简单 随机样本
系统样本
分层样本 群样本
6.1 抽样理由和抽样方法
05抽样分布与参数估计a共47页文档
x
2 (Nn)
n N1
• 2.样本平均数的分布规律
– (1)若总体服从正态分布,则无论样本容 量如何,样本均值服从正态分布;
– (2)若总体为非正态分布,样本为大样本 ( n≥30),样本均值近似服从正态分布
样本统计量的抽样分布
• (二)样本比例的抽样分布
– 当样本容量足够大时(np ≥5),样本比例 近似服从正态分布,其数学期望为总体比例 P
1 概率 x t2 下 sn : x t2
1 概率 xZ 2 下 n: xZ 2n
抽样极限误差
(二)总体方差未知
样本平均数服从正态分布,但要用样本方差代替 总体方差。此时其标准化后的样本统计量
x
服从自由度为n-1的t分布(大样本时可以正S x态分布近似
处理)。则有:
做不等式的等价P 变( 换t 后2(得n :1 )xS xt2(n 1 ) )1
二、抽样推断的有关概念
• (一)总体和样本
• 1、总体(N)
– 所要认识对象的全体。有限总体 和 无限总体
• 2、样本(n)
– 所抽取的一部分单位。
– (1)大样本(n>30) – (2)小样本(n≤30)
(二)样本容量与样本个数
• 1.样本容量
– 是一个样本中所包含的单位数。
• 2.样本个数
– 即样本可能数目。是指从一个总体中可能抽取 多少个样本。与抽样方法有关。
• 方法:
–抽签法
–随机数表法
2、类型抽样(分层抽样、分类抽样)
• (1)概念:将总体全部单位按某个标志分成 若干个类型组,然后从各类型组中采用简单
随机抽样方式或其它方式抽取样本单位。
• (2)样本单位数在各类型组中的分配方式
第6章 抽样分布与参数估计.
通过对样本均值的标准化处理,在用样本均值估计总体均值时,可以 使用标准正态分布来计算抽样误差出现的概率。
2019年7月28日/上午2时26分
《统计学教程》
第6章 抽样分布与参数估计
6.1 抽样分布
例6.1 在一次研究某一企业职工收入情况的调查中,准备从该企业随 机抽取100个职工个人的收入状况数据构成样本,以此推断该企业职工 平均月收入。
《统计学教程》
第6章 抽样分布与参数估计
第6章 抽样分布与参数估计
6.1 抽样分布 计
6.3 单一总体参数的区间估
6.1.1 总体、个体和样本
6.3.1 总体均值的区间估计
6.1.2 大数定律和中心极限定理
6.3.2 总体比例的区间估
6.1.3 三种分布
6.3.3 总体方差的区间估计
6.1.4 样本均值的抽样分布 计
从正态分布的特征。中心极限定理是大样本推断的理论基础。
独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机
变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,
则
lim n
Fn
x
lim
n k 1
X
k
n
n n
x
x
中心极限定理(Central Limit Theorem)反映了随机变量近似地服
从正态分布的特征。中心极限定理是大样本推断的理论基础。
独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机
变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,
则
lim n
FnБайду номын сангаас
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 抽样分布与参数估计
• 样本平均数 • 样本方差 • 样本标准差
n
Xi
x i1
n
n
(Xi x)2
s2 i1 n 1
s
• 样本比率(样本成数)
p n1 n
第三章 抽样分布与参数估计
• 样本统计量经常被用作估计总体参数。 • 点估计就是运用样本数据值计算出一个样本统计量的
值,将其作为总体参数的估计值。
第三章 抽样分布与参数估计
• (1) P(X 7.5) P( X 7 7.5 7) P( X 7 1.28) 0.1
0.39 0.39
0.39
•
(2) P(X
7.2)
P(
X 7 0.39
7.2 7) 0.39
P( X 7 0.39
0.51)
0.69
• (3)
P(7.2 X 7.5) P(7.2 7 X 7 7.5 7) P(0.51 Z 1.28) 0.21 0.39 0.39 0.39
X
10
5
8
7
10
10
5
8
7
10
{10,10} 10
{5,10} 7.5
{8,10} 9
{7,10} 8.5
{10,10} 10
{10,5 } 7.5
{5,5} 5
{8,5} 6.5
{7,5} 6
{10,5} 7.5
{10,8} 9
{5,8} 6.5
{8,8} 8
{7,8} 7.5
{10,8} 9
{10,7} 8.5
第三章 抽样分布与参数估计
• 抽样分为概率抽样与非概率抽样 • 其中概率抽样分为:
纯随机抽样、等距抽样、分层抽样、整群抽样
第三章 抽样分布与参数估计 常用的总体参数
• 总体平均数 • 总体方差 • 总体标准差
N
XI
I 1
N
N
(XI X )2
2 I 1
N
• 总体比率(总体成数)
P N1 N
第三章 抽样分布与参数估计 样本均值的抽样ቤተ መጻሕፍቲ ባይዱ布
• 一个总体10,5,8,7,10 ,
频率
3 2 1 0
5
直方图
150.00% 100.00% 50.00% 0.00% 7 9 11 其他 接收
频率 累积 %
第三章 抽样分布与参数估计
• 有放回(with replacement)抽样
{Xi, X j}
• 从一个给定的总体中抽取(不论是否有放回)容量 (或大小)为n的所有可能的样本,对于每一个样本, 计算出某个统计量(如样本均值或标准差)的值,不 同的样本得到的该统计量的值是不一样的,由此得到 这个统计量的分布,称之为抽样分布。
• 样本统计量是一个随机分布量。
第三章 抽样分布与参数估计
• 设由四个同学组成的总体, • 样本总体N=4。 • 随机变量X表示某个学生的年龄 • X的所在取值为18,20,22,24。
• 如用 x 5去0估计
• 问题是不同的样本提供不同的估计值 • 样本越大,估计的性质越好,但成本也越高 • 了解估计的性质有多好
• 解决办法:以样本的抽样分布作为理论基础。
第三章 抽样分布与参数估计
抽样分布
• 从一个总体中随机抽出容量相同的各种样本,从这些 样本计算出的某统计量所有可能值的概率分布,称为 这个统计量的抽样分布。
第三章 抽样分布与参数估计
• 例:在北京一居室的房租平均为每月1500元, 房租的分布并不服从正态分布,随机抽取容量 为50的样本,样本的标准差是200元,请问样 本均值至少为1600元的概率是多少?
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
• 3.1 抽样分布 • 3.2 点估计 • 3.3 区间估计
第三章 抽样分布与参数估计
3.1 抽样分布
为什么要抽样? 为了收集必要的资料,对所研究对象(总体)的
全部元素逐一进行观测,往往不很现实。
元素多,搜集数据费
抽 样
时、费用大,不及时而 使所得的数据无意义
总体庞大,难以对总 体的全部元素进行 研究
• (1)计算样本均值大于7.5的概率, • (2)计算样本均值小于7.2的概率, • (3)计算样本均值在7.2和7.5之间的概率。
第三章 抽样分布与参数估计
• 样本容量大于30,由中心极限定理可知,样本均值 x的分
布近似均值为
7,
标准差
=
X
n
=
2.2 31
=0.39的正态分布
即
X ~ N (7,0.392 )
原
因
检查具有破坏性
炮弹、灯管、砖等
第三章 抽样分布与参数估计
统计学基本概念
• 总体 (全体) Population • 所有感兴趣的对象
• 样本Sample • 总体的一部分
• 总体参数Parameter • 关于总体的概括性度量
• 统计量Statistic • 关于样本的概括性度量
• 抽样 • 从所研究的对象中随机取出一部分进行观察,由此获 得有关总体的信息。
50.00%
0
0.00%
6
7
8
9
10 其他
频率
累积
%
频率
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
总体分布
正态分布
样本均值 分布(n=2)
样本均值 分布(n=10)
样本均值 分布(n=30)
指数分布
均匀分布
第三章 抽样分布与参数估计
{5,7} 6
{8,7} 7.5
{7,7} 7
{10,7} 8.5
{10,10} 10
{5,10} 7.5
{8,10} 9
{7,10} 8.5
{10,10} 10
第三章 抽样分布与参数估计
• 一个样本统计量的概率分布被称为该统计量的抽样分 布
样本均值抽样分布 直方图
10
150.00%
100.00% 5
中心极限定理的作用
• 建立起 Z值与样本均值之间的数值关系.
• 不论该总体服从何种分布,只要当样本容量足够大
( n 3)0 ,样本均值的分布都大致服从正态分布。
X
~
N (,
2
)
n
第三章 抽样分布与参数估计
• 例:某高校在研究生入学体检后对所有结果进 行统计分析,得出其中某一项指标的均值是7, 标准差2.2。从这个总体中随机选取一个容量 为31的样本。
• 总体均值和总体方差各为多少? 21 2.236
• 总体概率分布?
第三章 抽样分布与参数估计
• 所有样本容量为2的样本
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
总体分布与样本抽样分布的关系
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计