统计分布及参数检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计分布及参数检验

第五章统计量及其分布

§5.1总体与样本

一、总体与样本

在一个统计问题中,把研究对象的全体称为总体,构成总体的每个成员称为个体。对于实际问题,总体中的个体是一些实在的人或物。比如,我们要研究某大学的学生身高情况,则该大学的全体学生构成问题的总体,而每一个学生即是一个个体。事实上,每一个学生有许多特征:性别、年龄、身高、体重等等,而在该问题中,我们关心的只是该校学生的身高如何,对其他的特征暂不考虑。这样,每个学生(个体)所具有的数量指标——身高就是个体,而所有身高全体看成总体。这样,抛开实际背景,总体就是一堆数,这堆数中有大有小,有的出现机会多,有的出现机会小,因此用一个概率分布去描述和归纳总体是合适的,从这个意义上说:

总体就是一个分布,而其数量指标就是服从这个分布的随机变量。

例5.1.1考察某厂的产品质量,将其产品分为合格品和不合格品,并以0记合格品,以1记不格品,若以p表示不合格品率,则各总体可用一个二点分布表示:

X p 0 1 1-p p

不同的p反映了总体间的差异。

在有些问题中,我们对每一研究对象可能要观测两个或更多个指标,此时可用多维随机向量及其联合分布来描述总体。这种总体称为多维总体。

若总体中的个体数是有限的,此总体称为有限总体;否则称为无限总体。实际中总体中的个体数大多是有限的,当个体数充分大时,将有限总体看作无限总体是一种合理抽象。

二、样本与简单随机样本1、样本

为了了解总体的分布,从总体中随机地抽取n个个体,记其指标值为x1,x2,?,xn, 则

x1,x2,?,xn 称为总体的一个样本,n称为样本容量或简称为样本量,样本中的个体称为样品。当n?30时,称x1,x2,?,xn为大样本,否则为小样本。

首先指出,样本具有所谓的二重性:一方面,由于样本是从总体中随机抽取的,抽取前无法预知它们的数值,因此样本是随机变量,用大写字母X1,X2,?,Xn 表示;另一方面,样本在抽取以后经观测就有确定的观测值,因此样本又是一组数值,此时用小写字母x1,x2,?,xn 表示。简单起见,无论是样本还是其观测值,本书中均用x1,x2,?,xn 表示,从上下文我们能加以区别。

每个样本观测值都能测到一个具体的数值,则称该样本为完全样本,若样本观测值没有具体的数值,只有一个范围,则称这样的样本为分组样本。从而知道分组样本与完全样本相比在信息上总有损失,但在实际中,若样本量特别大,用分组样本既简明扼要,又能帮助人们更好地认识总体。

例5.1.4 略。

2、简单随机样本

1

从总体中抽取样本可有不同的抽法,为了能由样本对总体作出较可靠的推断就希望样本能很好地代表总体。这就需要对抽样方法提出一些要求,最常用的有如下两个要求:1)样本具有随机性:要求每一个个体都有同等机会被选入样本,这便意味着每一样品xi与总体X有相同的分布。2)样本要求有独立性:要求每一样品的取值不影响其它样品的取值,这便意味着x1,x2,?,xn相互独立。若样本x1,x2,?,xn是n个相互独立的具有同一分布的随机变量,则称该样本为简单随机样本,简称为样本。注(1)若总体X的分布函数为F(x),则其样本的联合分布函数为?F(xi)

i?1n(2)若总体X的密度函数为p(x),则其样本的联合密度为?p(xi)

i?1n(3)若总体X的分布列为p(xi),则其样本的联合分布列为?p(xi)

i?1n(4)对有限总体不放回抽样,若总体中有几个个体,抽取样本容量为n,当n0。

1、性质

1? 可加性若X~?2(n),Y~?2(m)且X与Y独立,则。X?Y~?2(m?n)

证明略。

2? 若X~?2(n), 则EX=n, VarX=2n。

3??2分布的分位数

定义若?~2?2(n),对给定的?,0???1,称满足

P(?2??12??(n))?1??

2的?1??(n)是自由度为n的

??2分布的1??分位数。

注1 要会查?分位数。

22? t—分布、F—分布仍有相应的分位数定义。

二、F—分布

5

相关文档
最新文档