统计量及其分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
布情况时,济南市的全体男大学生组成了总体, 济南市的每个男大学生都是个体。
但是在数理统计中,由于我们关心的不是 每个个体的所有具体特性,而仅仅是它的某一 项或某几项的数量指标X(可以是向量)和该数 量指标在总体中的分布情况。
上述例子中X是表示灯泡的寿命或男大学生的身高 和体重,就此数量指标而言,每个个体所取值是不同的。 在试验中抽取了若干个个体,就观察到了X的这样或那 样的数值,因而这个数量指标X就是一个随机变量(或 向量)。而X的分布就完全描述了总体中我们所关心的
这是一个容量为10的样本的观测值, 对应的总体为该厂生产的瓶装啤酒的净含量。 这样的样本称为完全样本。
例1.4 考察某厂生产的某种电子元件的 寿命,选了100只进行寿命试验,得到 如下数据:
表1.2
寿命范围 ( 0 24] (24 48] (48 72] (72 96] (96 120] (120 144] (144 168] (168 192] 元件数 4 8 6 5 3 4 5 4
表1.2中的样本观测值没有具体的数值, 只有一个范围,这样的样本称为分组样本。
样本的要求:简单随机样本
要使得推断可靠,对样本就有要求,使样本能很 好地代表总体。通常有如下两个要求: 随机性: 总体中每一个个体都有同等机会 被选入样本 -- xi 与总体X有相同的分布。 独立性: 样本中每一样品的取值不影响其 它样品的取值 -- x1, x2, …, xn 相互独立。
那个数量指标的分布情况。由于我们关心的正是这个 数量指标,因此我们以后就把总体和数量指标X 可能 取值的的全体组成的集合等同起来。 所谓总体的分布也就是指数量指标X 的分布。 以后说从“总体中抽样”与“从某分布中抽样”是同一个 意思。
总体的三层含义:
• 研究对象的全体; • 数据; • 分布
例1.1 考察某厂的产品质量,以0记合格品,以1记 不合格品,则 总体 = {该厂生产的全部合格品与不合格品} = {由0或1组成的一堆数} 若以 p 表示这堆数中1的比例(不合格品率),则该 总体可由一个二点分布表示:
注意:样本(x1, x2, … , xn)独立同分布有时记为
x1, x2, … , xn
iid
iid : independent identity distribution
~
X
用简单随机抽样方法得到的样本称为简单随机样本, 也简称样本。
于是,样本 x1, x2, …, xn 可以看成是独立同分 布( iid ) 的随机变量,其共同分布即为总体分布。 设总体X具有分布函数F(x), x1, x2, …, xn 为取 自该总体的容量为n的样本,则样本联合分布 函数为
X P
0 1p
1 p
比如:两个生产同类产品的工厂的产品的总体分布:
X p X p 0 0.983 0 0.915 1 0.017 1 0.085
可见:第一个工厂的产品质量优于第二个工厂 但是:在实际中,分布中的不合格品率是未知的, 所以也面临对其进行估计的问题. 例1.2
我们对每一个研究对象可能要观测两个 甚至更多个指标,此时可用多维随机向量及 其联合分布来描述总体,这种总体称为多维 总体。 一维和二维总体是基本的。本书主要研究 一维总体,某些地方也会涉及二维总体。 总体分为有限总体与无限总体
样品:样本中的个体
样本具有两重性 • 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1, X2, …, Xn 表示;
• 另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1, x2, …, xn 表示是恰当的。
统计量及其分布
§1 总体与样本 §2 样本数据的整理与显示
§3 统计量及其分布
§4 三大抽样分布
§5 充分统计量
§1
总体:
总体与样本
• 研究对象的全体;
个体:而把组成总体的每个元素称为个体。
例1 在研究某批灯泡的寿命时,该批灯泡的全 体就组成了总体,而其中每个灯泡就是个体。 例2 在研究济南市男大学生的身高和体重的分
简单起见,无论是样本还是其观测值,样本一般 均用 x1, x2,… xn 表示,应能从上下文中加以区别。
例1.3 啤酒厂生产的瓶装啤酒规定净含量为640 克。由于随机性,事实上不可能使得所有的啤酒 净含量均为640克。现从某厂生产的啤酒中随机 抽取10瓶测定其净含量,得到如下结果:
641, 635, 640, 637, 642, 638, 645, 643, 639, 640
例1.5 设有一批产品共N个,需要进行抽样检 验以了解其不合格品率p。现从中采取不放回 抽样抽出2个产品,这时,第二次抽到不合格 品的概率依赖于第一次抽到的是否是不合格 品,如果第一次抽到不合格品,则 P(x2 = 1 | x1 = 1) = (Np1)/(N1) 而若第一次抽到的是合格品,则第二次抽到不合 格品的概率为 P(x2 = 1 | x1 = 0) = (Np)(N1)
100只元件的寿命数据
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184] 元件数 6 3 3 5 5 3 5 1 寿命范围 (384 408] (408 432] (432 456] (456 480] (480 504] (504 528] (528 552] >552 元件数 4 4 1 2 2 3 1 13
实际中总体中的个体数大多是有限的。当 个体数充分大时,将有限总体看作无限总体是 一种合理的抽象。 本书以无限总体作为主要研究对象。
1.2 样本
样品、样本、样本量:
随机抽样:按照随机的方式 ,从总体X中抽取部分个体, 进行观测或测试的过程。简称抽样。
ห้องสมุดไป่ตู้
样本:从总体X中抽取n个个体,则它们的
指标值x1, x2 , ……,xn, 称为总体的一个样本 样本容量:样本所含个体的个数——n
F ( x1 , ..., x n )
F ( x ).
i i 1
n
总体分为有限总体与无限总体
实际中总体中的个体数大多是有限的。当个体 数充分大时,将有限总体看作无限总体是一种 合理的抽象。 对无限总体,随机性与独立性容易实现,困难 在于排除有意或无意的人为干扰。 对有限总体,只要总体所含个体数很大,特别 是与样本量相比很大,则独立性也可基本得到 满足。