概率论第6章样本及抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体
寿命 X 可用一概率 (指数)分布来刻划
某批 灯泡的寿命
寿命总体是指数分布总体
鉴于此,常用随机变量的记号 或用其分布函数表示总体. 如 说总体X或总体F(x) .
§1 随机样本
类似地,在研究某地区中学生的营养状况时 , 若关心的数量指标是身高和体重,我们用X 和Y 分 别表示身高和体重,那么此总体就可用二维随机变 量(X,Y)或其联合分布函数 F(x,y)来表示.
§1 随机样本
例如:
某公路上行驶车辆的速度服从什么分布是未知的;
电视机的使用寿命服从什么分布是未知的; 产品是否合格服从两点分布,但参数——合格率p是 未知的;
数理统计的任务则是以概率论为基础,根据试验 所得到的数据,对研究对象的客观统计规律性做出合 理的推断。
§1 随机样本 一、总体与个体
1.总体
例2 某工厂10月份生产的灯泡寿命所组成的总 体中, 个体的总数就是10月份生产的灯泡数, 这是 个有限总体; 而该工厂生产的所有灯泡寿命所组成 的总体是一个无限总体, 它包括以往生产和今后生 产的灯泡寿命.
§1 随机样本
例3 在考察某大学一年级男生的身高这一试 试验中,若一年级男生共2 000人,每个男生的身高 是一个可能观察值,所形成的总体中共含2 000个 可能观察值,是一个有限总体.
试验的全部可能的观察值称为总体.
2.个体
总体中的每个可能观察值称为个体.
例1 在研究2 000名学生的年 龄时,这些学生的年龄的全体 就构成一个总体,每个学生的 年龄就是个体.
§1 随机样本
3.容量
总体中所包含的个体的个数称为总体的容量.
4.有限总体和无限总体
容量为有限的称为有限总体. 容量为无限的称为无限总体.
它们的观察值 x1, x2, , xn 称为样本值, 又称 为X 的 n 个独立的观察值.
§1 随机样本
2. 简单随机抽样的定义
获得简单随机样本的抽样方法称为简单随机抽样.
若X1, X2, , Xn为F 的一个样本, 则X1,X2, ,
X n相互独立,且 它 们 的 分 布 函 数 都 是 F,所以
由于每个个体的出现是随机的,所以相应的数量 指标的出现也带有随机性 . 从而可以把这种数量指 标看作一个随机变量X ,因此随机变量X的分布就 是该数量指标在总体中的分布.
总体就可以用一个随机变量及其分布来描述.
因此在理论上可以把总体与概率分布等同起来.
§1 随机样本
例如:研究某批灯泡的寿命时,关心的数量指标 就是寿命,那么,此总体就可以用随机变量X表示, 或用其分布函数F(x)表示.
( X1, X2, , Xn ) 是来自总体的样本, 求样本
( X1, X2, , Xn ) 的概率密度.
解 总体 X 的概率密度为
ex ,
f (x)
0,
x 0, x 0,
因为 X1, X2, , Xn 相互独立, 且与X 有相同的分布,
所以 ( X1, X2, , Xn )的概率密度为
fn( x1, x2 , , xn )
概率论与数理分析
第六章 样本及抽样分布
§1 随机样本 §2 直线图和箱线图 §3 抽样分布
§1 随机样本
引言
随机变量及其所伴随的概率分布全面描述了随机 现象的统计性规律。
概率论的许多问题中,随机变量的概率分布通常 是已知的,或者假设是已知的,而一切计算与推理都 是在这已知是基础上得出来的。
但实际中,情况往往并非如此,一个随机现象所 服从的分布可能是完全不知道的,或者知道其分布概 型,但是其中的某些参数是未知的。
( X1,
X 2,
,
X
n
)
的
分
布
函
数
为 n
F *( x1, x2, , xn ) F ( xi ).
i 1
又若X具有概率密度 f, 则( X1, X2, , Xn ) 的
概率密度为 n
f *( x1, x2, , xn ) f ( xi ).
i 1
§1 随机样本
例7 设总体 X 服从参数为 ( 0) 的指数分布,
例4 考察某一湖泊中某种鱼的含汞量, 所得 总体也是有限总体.
§1 随机样本
有些有限总体,它的容量很大, 我们可以认为 它是一个无限总体.
例5 考察全国正在使用的某种型号灯泡的寿 命所形成的总体, 由于可能观察值的个数很多,就 可以认为是无限总体.
§1 随机样本
5. 总体分布
我们关心的是总体中的个体的某项指标(如人的 身高、灯泡的寿命,汽车的耗油量…) .
统计中,总体这个概念的要旨是: 总体就是一个随机变量(向量)或一个概率分布.
§1 随机样本
X 的分布函数和数字特征就称为总体的分布 函数和数字特征. 今后将不区分总体与相应的随机 变量.
例如,我们检验自生产线出来的零件是次品还
是正品,以0表示产品是正品,以1表示产品为次品. 设出现次品的频率为 p(常数),那么总体是由一 些“0”和一些“1”所组成,这一总体对应于一个具有 参数为p的(0-1)分布:
§1 随机样本 二、随机样本的定义
1.样本的定义
设 X 是具有分布函数 F 的随机变量, 若 X1, X 2 , , Xn 是具有同一分布函数F、相互独立的 随机变量, 则称 X1, X2 , , Xn 为从分布函数 F (或总体 F、或总体 X ) 得到的容量为 n 的简单 随机样本 , 简称样本 .
n
f
(
xi
)
ne
n
i 1
xi
,
i 1
0,
xi Hale Waihona Puke Baidu0, 其他.
§1 随机样本
例8 设总体 X 服从两点分布B(1, p),其中0 p 1, ( X1, X2, , Xn )是来自总体的样本, 求样本 ( X1, X2 , , Xn ) 的分布律. 解 总体 X 的分布律为
P{ X i} pi (1 p)1i (i 0, 1)
P{X x} px(1 p)1 x, x 0,1
的随机变量.
§1 随机样本
在数理统计中,人们都是通过从总体中抽取 一部分个体, 根据获得的数据来对总体分布得出 判断的. 被抽出的部分个体叫做总体的一个样本.
所谓从总体抽取一个个体, 就是对总体X 进行 一次观察并记录其结果.
当n次观察一经完成,我们就得到一组实数 x1, x2 , , xn , 它们依次是随机变量X1, X 2 , , X n 的观察值,称为样本值 .