最新概率统计教案3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章统计量及其分布
一、教材说明
本章内容包括:总体与样本,样本数据的整理与显示,统计量及其分布,三大抽样分布。本章的基本概念和重要结论是学习数理统计的基础。
1、教学目的与教学要求
1)掌握数理统计的总体、样本、样本经验分布函数、统计量及常用统计量等基本概念。
2)掌握三大分布的定义,并能熟练应用来求随机变量的分布。
3)牢记Fisher定理的内容及其三大推论。
4)使学生了解数理统计研究问题的方法与概率论研究问题方法的不同。
5)了解如何对样本数据进行整理与现实。
2、本章重点与难点
本章重点是数理统计的基本概念、三大分布的定义、Fisher定理及其推论。难点是Fisher 定理结合三大分布来求随机变量的分布。
二、教学内容
本章共分总体与样本、样本数据的整理与显示、统计量及其分布、三大抽样分布等4节来讲述本章的基本内容。
§5.1总体与样本
一、总体与样本
在一个统计问题中,把研究对象的全体称为总体,构成总体的每个成员称为个体。对于实际问题,总体中的个体是一些实在的人或物。比如,我们要研究某大学的学生身高情况,则该大学的全体学生构成问题的总体,而每一个学生即是一个个体。事实上,每一个学生有许多特征:性别、年龄、身高、体重等等,而在该问题中,我们关心的只是该校学生的身高如何,对其他的特征暂不考虑。这样,每个学生(个体)所具有的数量指标——身高就是个体,而所有身高全体看成总体。这样,抛开实际背景,总体就是一堆数,这堆数中有大有小,有的出现机会多,有的出现机会小,因此用一个概率分布去描述和归纳总体是合适的,从这个意义上说:
总体就是一个分布,而其数量指标就是服从这个分布的随机变量。
例5.1.1考察某厂的产品质量,将其产品分为合格品和不合格品,并以0记合格品,以1记不格品,若以p表示不合格品率,则各总体可用一个二点分布表示:
不同的p反映了总体间的差异。
在有些问题中,我们对每一研究对象可能要观测两个或更多个指标,此时可用多维随机向量及其联合分布来描述总体。这种总体称为多维总体。
若总体中的个体数是有限的,此总体称为有限总体;否则称为无限总体。实际中总体中的个体数大多是有限的,当个体数充分大时,将有限总体看作无限总体是一种合理抽象。
二、样本与简单随机样本 1、样本
为了了解总体的分布,从总体中随机地抽取n 个个体,记其指标值为 n x x x ,,,21 , 则n x x x ,,,21 称为总体的一个样本,n 称为样本容量或简称为样本量,样本中的个体称为样品。当30 n 时,称n x x x ,,,21 为大样本,否则为小样本。
首先指出,样本具有所谓的二重性:一方面,由于样本是从总体中随机抽取的,抽取前无法预知它们的数值,因此样本是随机变量,用大写字母 n X X X ,,,21 表示;另一方面,样本在抽取以后经观测就有确定的观测值,因此样本又是一组数值,此时用小写字母
n x x x ,,,21 表示。简单起见,无论是样本还是其观测值,本书中均用n x x x ,,,21 表示,
从上下文我们能加以区别。
每个样本观测值都能测到一个具体的数值,则称该样本为完全样本,若样本观测值没有具体的数值,只有一个范围,则称这样的样本为分组样本。从而知道分组样本与完全样本相比在信息上总有损失,但在实际中,若样本量特别大,用分组样本既简明扼要,又能帮助人们更好地认识总体。
例5.1.4 略。
2、简单随机样本
从总体中抽取样本可有不同的抽法,为了能由样本对总体作出较可靠的推断就希望样本能很好地代表总体。这就需要对抽样方法提出一些要求,最常用的有如下两个要求:
1)样本具有随机性:要求每一个个体都有同等机会被选入样本,这便意味着每一样品
i x 与总体X 有相同的分布。
2)样本要求有独立性:要求每一样品的取值不影响其它样品的取值,这便意味着
n x x x ,,,21 相互独立。
若样本n x x x ,,,21 是n 个相互独立的具有同一分布的随机变量,则称该样本为简单随机样本,简称为样本。
注(1)若总体X 的分布函数为F (x ),则其样本的联合分布函数为)(1i n
i x F
(2)若总体X 的密度函数为p (x ),则其样本的联合密度为)(1
i n
i x p
(3)若总体X 的分布列为 )(i x p ,则其样本的联合分布列为)(1
i n
i x p
(4)对有限总体不放回抽样,若总体中有几个个体,抽取样本容量为n ,当n < 1.0 N n )时,不放回抽样得到的样本可认为是简单随机样本。 例5.1.5 设有一批产品共N 个,需进行抽样检验以了解其不合格品率p ,现从中抽出n 个逐一检查它们是否是不合格品,记合格品为0,不合格品为1。则总体为一个二点分布:P(X =1)=p ,P (X =0)=1-p 。设 1,...,n x x 为该总体的一个样本,采用不放回抽样得到。这时, 第二次抽到不合格品的概率依赖于第一次抽到的是否是不合格品: 11 )11(12 N Np x x P 1 )01(12 N Np x x P 但当N 很大时,上述两个概率近似都等于p ,所以当N 很大,而n 不大时,不放回抽样得到的样本可近似看成简单随机样本。 §5.2样本数据的整理与显示 一、经验分布函数 1、定义 设n x x x ,,,21 是取自总体分布函数为F(x)的样本,若将样本观测值从小到 大进行排列为)()2()1(,,,n x x x ,则)()2()1(n x x x 为有序样本,如下函数 (1)()(1)() 0,(),,1,2,,11,n k k n x x k F x x x x k n n x x L 当当当 称为经验分布函数。 例5.2.1某食品厂生产听装饮料,现从生产线上随机抽取5听饮料,称得其净重为:351 347 355 344 351,求此样本的经验分布函数。 略。 2、经验分布函数的性质 01 对每一个固定的x ,)(x F n 是事件“X x ”发生的频率,当n 固定时,)(x F n 是样 本的函数,是一个随机变量,且)()(x F x F P n 。 02(格里纹科定理)定理5.2.1:设n x x x ,,,21 是取自总体分布函数为F (x )的样本, )(x F n 是经验分布函数,有 1)0)()(sup lim ( x F x F P n x n 。 注 此定理表明,当n 相当大时,经验分布函数是总体分布函数的一个良好的近似。 二、频数频率分布表 样本数据的整理是统计研究的基础,整理数据的最常用方法之一是给出其频数分布表或 频率分布表,其基本步骤是: 1、对样本进行分组:首先确定组数k ,作为一般性原则,组数通常在5-20个。对容量较小的样本,通常将其分为5组或6组,容量为100左右的样本可分7到10组,容量在200左右的样本可分9~13组,容量为300左右级以上的样本可分12到20组。 2、确定每组组距:每组组距可以相同也可以不同。但实际中常选用长度相同的区间,以d 表示组距。