概率论与数理统计 第6章 数理统计基础
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【质量控制问题】
某食盐厂用包装机包装的食盐,每袋重量500g, 通常在包装机正常的情况下,袋装食盐的重量X服 从正态分布,均值为500g,标准差为25g.为进行 生产质量控制,他们每天从当天的产品中随机抽 出 30 袋进行严格称重,以检验包装机工作是否正 常.某日,该厂随机抽取30袋盐的重量分别为:
475 500 485 454 504 439 492 501 463 461
464 494 512 451 434 511 513 490 521 514
从这些数据看,包装机的工作正常吗?
449 467 499 484 508 478 479 499 529 480
第6章 数理统计基础
6.1 总体和样本
【数理统计简史】
社会统计学派始于 19 世纪末,首创人物是德国 的克尼斯(K. G. A. Knies),他认为统计学是一 个社会科学,是研究社会现象变动原因和规律性 的实质性科学.各国专家学者在社会经济统计指 标的设定与计算、指数的编制、统计调查的组织 和实施、经济社会发展评价和预测等方面取得了 一系列的重要成果.德国统计学家恩格尔 (C.L.E.Engel,1821-1896)提出的“恩格尔”系 数,美国经济学家库兹涅茨和英国经济学家斯通 等人研究的国民收入和国内生产总值的核算方法 等,都是伟大的贡献.
则X1,X2,X3,X4的联合概率密度为:
f ( x1 , x2 , x3 , x4 ) f ( x1 ) f ( x2 ) f ( x3 ) f ( x4 )
2 xi 16e i 1 , xi 0, i 1,2,3,4 其它 0,
4
6.1.2 样本与抽样
6.1.2 样本与抽样
【例 6.1】设总体 X服从均值为 1/2 的指数分布, X1, X2,X3,X4为来自X的样本,求X1,X2,X3,X4的 联合概率密度和联合分布函数.
其分布函数为
2e 2 x , 解:X的概率密度为 f ( x ) 0, x0 x0
1 e 2 x , x 0 F ( x) x0 0,
第6章 数理统计基础
在数理统计中,我们所研究的随机变量的分布 往往是未知的,通过对随机变量进行多次独立重 复的试验和观测,获取数据,利用实际观测数据 研究随机变量的分布,对其分布函数、数字特征 等进行估计和推断. 本章作为数理统计基础,学习总体、样本、统 计量与抽样分布等有关概念,以及有关正态总体 的重要的抽样分布定理.
例如,在质量检验中,随机抽出 n 件产品,测 得的数据 x1 , x2 , ... , xn ,就称它们是样本观测 值.
在抽样前,不知道样本观测值究竟取何值,应 该把它们看作为随机变量,记作 X1 , X2 , ... , Xn , 称其为容量为n的样本. (在不会混淆的情况下,有时我们也将观测数据 x1,x2,...,xn称为样本,如“质量控制问题”中 的 30 个数据 ,也可以说成是一个容量为 30 的样 本).
例如,在研究某高校学生生活消费状况时,关 心的可能是学生们每月的生活消费额,在研究某 厂生产的灯泡的质量时,关心的可能是这些灯泡 的寿命和光亮度等.
这时总体指一个或多个数量指标,这些数量指 标对我们来说是不了解或者说是未知的,我们可 以用一个或多个随机变量来表示它们.
6.1.1
总体与个体
因此,总体可以是一维随机变量,也可以是多 维随机变量. 例如,在研究某高校学生生活消费状况时,可 以用X表示月生活消费额,在研究某厂生产的灯泡 的质量时,可以分别用 X, Y表示灯泡的寿命和光 亮度,那么,对上面两个问题的研究就转化为对 总体X和总体(X,Y)的研究了.
通过样本来进行研 究.,Xn相互独立. 由这两个特性可知,若 X 的分布函数为 F(x) ,则 X1 , X2,...,Xn的联合分布函数为
F(x1,x2,…,xn) = F(x1)F(x2)…F(xn)
若X具有概率密度为 f(x),则X1,X2,...,Xn的联合概 率密度为 f(x1,x2,…,xn) = f(x1) f(x2)…f(xn)
6.1.1
总体与个体
根据总体中包含个体的数量,可以将总体分为 有限总体和无限总体,当总体中包含个体的数量 很大时,我们可以把有限总体看成是无限总体.
例如,某厂某天生产的灯泡可以看作是有限总 体,而该厂生产的全部灯泡就可以看作为无限总 体,因为它包含过去和将来生产的灯泡的全部.
6.1.2
样本与抽样
实际应用中,为了研究总体的特性,总是从总 体中抽出部分个体进行观察和试验,根据观察或 试验得到的数据推断总体的性质. 我们把从总体中抽出的部分个体称为样本, 把样本中包含个体的数量称为样本容量, 把对样本的观察或试验的过程称为抽样,
把观察或试验得到的数据称为样本观测值(观测 数据),简称样本值.
6.1.2 样本与抽样
【数理统计简史】
1. 近代统计学时期
18 世纪末到 19 世纪,是近代统计学时期.这一 时期的重大成就是大数定律和概率论被引入统计 学.之后最小二乘法、误差理论和正态分布理论 等相继成为统计学的重要内容.这一时期有两大 学派:数理统计学派和社会统计学派.
【数理统计简史】
数理统计学派始于19世纪中叶,代表人物是比 利时的凯特莱( A.Quetelet , 1796-1874 ),著有 《概率论书简》《社会物理学》等,他主张用研 究自然科学的方法研究社会现象,正式把概率论 引入统计学,并最先用大数定律证明了社会生活 中随机现象的规律性,提出了误差理论.凯特莱 的贡献,使统计学的发展进入个了一 个新的阶 段.
6.1.1 总体与个体
总体或母体指我们研究对象的全体构成的集合, 个体指总体中包含的每个成员. 例如,在研究某高校学生生活消费状况时,该 校全体学生就是一个总体,其中每一个学生是一 个个体;在人口普查中,总体是某地区的全体人 口,个体就是该地区的每一个人.
6.1.1
总体与个体
我们研究总体时,所关心的往往是总体某方面 的特性,这些特性又常常可以用一个或多个数量 指标来反映.
36
6.1 总体和样本
6.1.3
直方图与经验分布函数
如前所述,数理统计所研究的实际问题(总体) 的分布一般来说是未知的,需要通过样本来推 断.但如果对总体一无所知,那么,做出推断的 可信度一般也极为有限.在很多情况下,我们往 往可以通过具体的应用背景或以往的经验,再通 过观察样本观测值的分布情况,对总体的分布形 式有个大致了解.观察样本观测值的分布规律, 了解总体 X 的概率密度和分布函数,常用直方图 和经验分布函数.
第6章 数理统计基础
【数理统计简史】
相对于其它许多数学分支而言,数理统计是一 个比较年轻的数学分支.多数人认为 20 世纪 40 年 代克拉美( H.Carmer)的著作《统计学的数学方 法》,使得 1945 年以前 25 年间英、美统计学家在 统计学方面的工作与法、俄数学家在概率论方面 的工作结合起来,从而形成数理统计这门学 科.数理统计有很多分支,但其基本内容为采集 样本和统计推断两大部分.发展到今天的现代数 理统计学,已经历了各种历史变迁.
第6章 数理统计基础
6.1 总体和样本 6.2 统计量与抽样分布
第6章 数理统计基础
前五章我们学习了概率论的基本知识,从本章 开始将学习数理统计的基本知识、理论和方 法.数理统计是以对随机现象观测所取得的资料 (数据)为出发点,以概率论为基础来研究随机 现象的一门学科. 概率论中,往往是在已知随机变量分布的条件 下,去研究它的性质、特点和规律性,比如求随 机变量取某些特定值的概率、求随机变量的数字 特征、研究多个随机变量之间的关系等.
由于X的分布函数为
1 e 2 x , x 0 F ( x) x0 0,
X1,X2,X3,X4的联合分布函数为
F ( x1 , x2 , x3 , x4 ) F ( x1 )F ( x2 )F ( x3 )F ( x4 )
4 (1 e 2 xi ) xi 0, i 1, 2, 3,4 i 1 其它 0,
i 1 36
5 D(Y ) D( X i ) 36D( X ) 36 45 4 i 1
36
又因为n = 36较大,依中心极限定理, Y X i 近似 i 1 服从正态分布 N (54,45) ,所以
50.4 54 Y 54 64.8 54 P{50.4 Y 64.8} P 45 45 45 (1.61) (0.54) 0.9463 1 0.7054 0.6517
6.1.2 样本与抽样
在应用中,我们从总体中抽出的个体必须具有代 表性,样本中个体之间要具有相互独立性,为保证 这两点,一般采用简单随机抽样.
定义6.1 一种抽样方法若满足下面两点,称其为 简单随机抽样:
(1) 总体中每个个体被抽到的机会是均等的;
(2) 样本中的个体相互独立.
由简单随机抽样得到的样本称为简单随机样本.
【数理统计简史】
18世纪到 19世纪初期,高斯从描述天文观测的 误差而引进正态分布,并使用最小二乘法作为估 计方法,是近代数理统计学发展初期的重大事件, 对社会发展有很大的影响.
【数理统计简史】
用正态分布描述观测数据的应用是如此普遍,以 至 在 19 世 纪 相 当 长 的 时 期 内 , 包 括 高 尔 顿 ( Galton )在内的一些学者,认为这个分布可用 于描述几乎是一切常见的数据.直到现在,有关 正态分布的统计方法,仍占据着常用统计方法中 很重要的一部分.最小二乘法方面的工作,在 20 世纪初以来,经过一些学者的发展,如今成了数 理统计学中的主要方法.
如果没有特殊说明 , 以后所说样本均指简单随机样 本.
6.1.2 样本与抽样
设 X1 , X2 , ..., Xn 是从总体 X 中抽出的简单随机样 本,由定义可知,X1,X2,...,Xn有下面两个特性:
(1) 代表性:X1,X2,...,Xn均与X同分布,即若 往往是未知或不完 全知道的,是需要 X F(x),则对每一个Xi都有 Xi F(xi),i = 1,2,…,n
6.1.2 样本与抽样
【例6.2】已知总体X的分布为P{X = i} = 1/4,
i = 0,1,2,3,抽取n=36的简单随机样本X1,X2,...,X36,
求 Y X i 大于50.4小于64.8的概率.
解:总体X的均值和方差分别为
1 3 E ( X ) ( 0 1 2 3) 4 2
【数理统计简史】
2. 现代统计学时期
从 19 世纪末到现在,是现代统计学时期.这一 时期的显著特点是数理统计学由于同自然科学、 工程技术科学紧密结合并被广泛应用于各个领域 而获得迅速发展.各种新的统计理论和方法、尤 其是推断统计理论与方法得以大量涌现.
【数理统计简史】
例如英国统计学家卡尔 . 皮尔逊( K.Pearson , 1857-1936 ) 的 2 分 布 理 论 , 统 计 学 家 戈 赛 特 ( W.S.Gosset,1876-1937)的小样本t分布理论, 统计学家费歇尔(R.A.Fisher,1890-1962)的F分 布理论和试验设计方法,波兰统计学家尼曼 ( J.Neyman ) 和 英 国 统 计 学 家 皮 尔 逊 ( E.S.Pearson, 1895-1980)的置信区间理论和假 设检验理论,以及非参数统计法、序贯抽样法、 多元统计分析法、时间序列跟踪预测法都应运而 生,并逐步成为现代统计学的主要内容.
通常的做法是将产品质量的特征绘制在控制图上然后观察这些值随时间如何波图616质量控制图质量控制问题解答例如可以把不同时间的样本均值绘制在图616上图中的两条平行线分别为上控制限和下控制限他们距中间的总体均值限过程均值限均相距如果落在上下控制限的外面则有充分的理由说明目前的生产线工作不正常即生产过程失控应停产检修生产设备
i 1
36
1 2 2 3 2 2 2 2 D( X ) E( X ) E( X ) (0 1 2 3 ) 4 2 5 4
2
6.1.2 样本与抽样
由于X1,X2,...,X36均与总体X同分布,且相互独 立,所以,Y的均值和方差分别为
E (Y ) E ( X i ) 36E ( X ) 54,
【数理统计简史】
现代统计学时期是数理统计发展的辉煌时期, 数理统计不仅在理论上取得重大进展,其方法在 生物、农业、医学、社会、经济、工业和科技等 方面得到愈来愈广泛的应用.另外,计算机的应 用对统计学的产生了巨大的影响,需要大量计算 的统计方法,有了计算机,这一切都不成问题.
第6章 数理统计基础