《概率论与数理统计》第六章 数理统计
概率论与数理统计 第6章 数理统计基础
【质量控制问题】
某食盐厂用包装机包装的食盐,每袋重量500g, 通常在包装机正常的情况下,袋装食盐的重量X服 从正态分布,均值为500g,标准差为25g.为进行 生产质量控制,他们每天从当天的产品中随机抽 出 30 袋进行严格称重,以检验包装机工作是否正 常.某日,该厂随机抽取30袋盐的重量分别为:
475 500 485 454 504 439 492 501 463 461
464 494 512 451 434 511 513 490 521 514
从这些数据看,包装机的工作正常吗?
449 467 499 484 508 478 479 499 529 480
第6章 数理统计基础
6.1 总体和样本
【数理统计简史】
社会统计学派始于 19 世纪末,首创人物是德国 的克尼斯(K. G. A. Knies),他认为统计学是一 个社会科学,是研究社会现象变动原因和规律性 的实质性科学.各国专家学者在社会经济统计指 标的设定与计算、指数的编制、统计调查的组织 和实施、经济社会发展评价和预测等方面取得了 一系列的重要成果.德国统计学家恩格尔 (C.L.E.Engel,1821-1896)提出的“恩格尔”系 数,美国经济学家库兹涅茨和英国经济学家斯通 等人研究的国民收入和国内生产总值的核算方法 等,都是伟大的贡献.
则X1,X2,X3,X4的联合概率密度为:
f ( x1 , x2 , x3 , x4 ) f ( x1 ) f ( x2 ) f ( x3 ) f ( x4 )
2 xi 16e i 1 , xi 0, i 1,2,3,4 其它 0,
4
6.1.2 样本与抽样
6.1.2 样本与抽样
【例 6.1】设总体 X服从均值为 1/2 的指数分布, X1, X2,X3,X4为来自X的样本,求X1,X2,X3,X4的 联合概率密度和联合分布函数.
概率论与数理统计第6章(公共数学版)
Xi
1 n (X1
X2
Xn)
S 2
1 n
n i 1
(Xi
X )2
显然
S 2
1 n
n
[
X
2 i
i 1
2Xi
X
(X )2]
1n [
n i1
X
2 i
2X
n i 1
Xi
n( X )2 ]
1 n
n i 1
X
2 i
2X
X
(X )2
S 2
1 n
n i 1
X
2 i
(X )2
16
样本均方差
样本标准差
4
Yi 2
i 1
4
Yi
2
i1 4
4
Yi
2
4
i1 2
32
T 4( X 2) 4 Yi 2 i 1
X 2
4
Yi
2
i1 4
X 2
~ t(4),
4
Yi
2
4
i1 2
即 T 服从自由度为 4 的 t 分布: T ~ t(4). 由 P{| T | t0 } 0.01.
t0 t0.995 (4) 4.6041.
设( X1, X2,, Xn )为来自总体X的一个样本
则( X1, X2,, Xn )为一个随机向量 X为一个随机变量 X1, X2,, Xn相互独立,且具有和总体X同样的分布
样本的同分布性和相互独立性
11
三、统计量 对所研究的对象收集了有关样本的数据
后,还要对数据进行加工和提炼,将样本的有关 信息,利用数学的工具进行加工.
S
S2
概率论与数理统计 第六章--数理统计的基本概念
F分布性质2 若X ~t(n),则X2~F(1,n)
例4.设X1,X2, …,Xn是来自正态总体N(0,1) 的样本,试问c=( )统计量
c
2 X i 3 i 1 n
X
i 4
2 i
服从F分布?
抽样分布的分位点
设α为给定的常数,且0<α<1.若存在χα2(n)使
P ( n)
分位点的性质
(1) u1 u (2)
t1 (n) t (n)
1 (3) F (m, n) F1 (n, m)
回顾1. 设X1 ,X2 ,X3, X4是来自总体N(0,4)的简单 随机样本,X=a(X1-2 X2)2+b(3X3 -4X4)2,问当 a,b为何值时,统计量X服从 2分布 .
Max=1572, Min=738, 组数=6 组距=(Max-Min)/6=139140 取a0=735, 则分组区间及相关数据如下
组序 1 2 分区区间 (735,875] (875,1015] 频数 6 8 频率 0.2 0.27 累计频率 0.2 0.47
3
4 5 6 合计
(1015,1155]
2
所服从的分布为自由度为 n 的 分布 记为
2
~ (n)
2 2
分布的密度函数为
2
n x 1 1 n2 x2 e 2 f ( x; n ) 2 ( n 2 ) 0
x0 x0
其中伽玛函数 ( x )通过积分
( x ) e t dt, x 0 0 来定义.
(1155,1295] (1295,1435] (1435,1575]
9
4 2 1 30
0.3
概率论与数理统计(叶慈南 刘锡平 科学出版社)第6章 数理统计的基本概念教程
3.样本k阶(原点)矩 Ak = 样本k阶中心矩
Bk =
1 n k ∑ X i 反映总体k阶矩E(Xk)的信息 n i =1 P E ( X k ) = k , k = 1, 2, L →
反映总体k
9
1 n P → ∑ ( X i X )k E {[ X E ( X )]k } = mk n i =1 k=1,2,…
1o
X ~ N ( ,
σ2 ) n
即
X ~ N (0,1) σ/ n
2o 3o
(n 1) S 2 ~ χ 2 ( n 1) σ2 X 与 S 2 相互独立 4o X ~ t ( n 1) S/ n
23
24
4
1o
X ~ N ( , X=
σ2 ) n
即
X ~ N ( 0, 1) σ/ n
4o
正态总体的抽样分布定理
例 设 X1,…,X10 是取自N(0,0.32)的样本,求
P{∑ X i > 1.44}
2 i =1 10
定理一,二,三
2 2 设 X 1 ,..., X n 是来总体 N ( , σ ) 的样本, X , S 分别为样
本均值和样本方差,则
例 设 X 1 , X 2 , L , X 15 是来自总体 N (0,1)的一个简单随 2 2 X 12 + X 2 + L + X 10 机样本, Y= 则 服从 分布. 2 2 2 2( X 11 + X 12 + L + X 15 )
4
个体:组成总体的元素(如:某一个灯泡的寿命)
每个可能的观察值
有限总体 无限总体 如:考察某大学大一2000名男生的身高 如:考察某大学大一2000名男生的身高 如:测量一湖泊任一地点的深度
概率论与数理统计课程电子版教材
第六章 数理统计的基本概念第一节 基本概念1、概念网络图正态总体下的四大分布统计量样本函数样本个体总体数理统计的基本概念→⎪⎪⎪⎭⎪⎪⎪⎬⎫⎪⎪⎪⎩⎪⎪⎪⎨⎧ 2、重要公式和结论例6.1:从正态总体)6,4.3(2N 中抽取容量为n 的样本,如果要求其样本均值位于区间(1.4, 5.4)内的概率不小于0.95,问样本容量n 至少应取多大?第二节 重点考核点统计量的分布第三节 常见题型1、统计量的性质例6.2:设),,,(721X X X 取自总体)5.0,0(~2N X ,则=⎪⎭⎫⎝⎛>∑=7124i i X P。
例6.3:设总体X 服从正态分布),(21σμN ,总体Y 服从正态分布),(22σμN ,1,,21n X X X 和 2,,21n Y Y Y 分别是来自总体X 和Y 的简单随机样本, 则=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡-+-+-∑∑==2)()(21212121n n Y Y X X E n j j n i i .2、统计量的分布例6.4:设),,,(21n X X X 是来自正态总体),(2σμN 的简单随机样本,X 是样本均值,记,)(111221∑=--=ni i X X n S,)(11222∑=-=ni i X X n S,)(111223∑=--=ni i X n S μ,)(11224∑=-=ni i X n S μ则服从自由度为n-1的t 分布的随机变量是 (A ).1/1--=n S X t μ(B ).1/2--=n S X t μ(C )./3nS X t μ-=(D )./4nS X t μ-=[ ]例6.5:设总体X ~N (0,12),从总体中取一个容量为6的样本),,,(621X X X ,设26542321)()(X X X X X X Y +++++=,试确定常数C ,使随机变量CY 服从2χ分布。
第四节 历年真题数学一:1(98,4分) 从正态总体)6,4.3(2N 中抽取容量为n 的样本,如果要求其样本均值位于区间(1.4, 5.4)内的概率不小于0.95,问样本容量n 至少应取多大? [附表]:dt eZ t Z2221)(-∞-⎰=Φπ990.0975.0950.0900.0)(33.296.1645.128.1Z Z Φ2(01,7分) 设总体)0)(,(~2>σσμN X ,从该总体中抽取简单随机样本)2(,,,221≥n X X X n ,其样本的均值∑==ni i X n X 21,21求统计量∑=+-+=ni i n i X X X Y 12)2(的数学期望E (Y )。
概率论与数理统计第六章总结
概率论与数理统计第六章总结概率论与数理统计是数理学科中的重要分支,其应用广泛,涉及到许多领域,如工程、物理、自然科学、医学、经济学等等。
第六章主要讲述了离散型随机变量的概率分布、期望值、方差及其应用。
首先我们了解到离散型随机变量是指取值有限或者可以无限但是可以和自然数一一对应的随机变量,即不连续的随机变量。
其中概率分布的概念是很重要的,它告诉我们每种随机变量取值的可能性大小,从而可以计算一些重要的数值。
比如期望值,期望值是随机变量取值的平均值,它可以用概率分布函数计算得到。
期望值可以给我们一个随机变量所处于某个状态的平均位置,或者它对某个事件发生的平均贡献。
方差也是一个非常重要的概念,它是随机变量值与其期望值之差的平方的期望值。
方差表示了随机变量的分布范围,也就是它们取值的变化程度。
方差越大,代表随机变量距离其期望值越远,该随机变量取值的范围也相应较大。
求期望值和方差的过程中有一些公式会显著提高计算效率,比如线性变换的公式、缩放变换的公式、Chebyshev不等式等等。
这些公式的应用有助于简化计算,并且能帮助我们更容易地理解问题。
我们还讨论了一些常见离散型随机变量的概率分布,比如伯努利分布、二项分布、泊松分布等等。
这些分布的出现在实际问题中都有着很重要的意义,比如伯努利分布描述了实验只有两种可能结果的概率分布,比如是/否、头/尾等等。
而二项分布则描述了实验中成功的概率和试验次数的关系,给我们解决实际问题提供了基础。
除了离散型随机变量,我们还可以研究连续型随机变量的概率分布以及相应的数学理论。
这些知识在实际应用中也具有重要意义。
比如在统计财务账目时,需要研究一些连续型随机变量的概率分布,以便预测下一期客户付款时间的分布情况。
又比如在流量预测中,需要研究一些连续型随机变量的概率分布,以便预测某个时间段内的网络流量。
总之,离散型随机变量理论是概率论的核心内容,对于理解整个概率论课程和进行实际应用都有着重要的意义。
概率论与数理统计第六章总结
概率论与数理统计第六章总结一、概述在概率论与数理统计的第六章中,主要介绍了随机变量的概率分布以及常见的概率分布模型。
本章内容是概率论与数理统计的重点和难点之一,对于理解和应用概率统计的基本理论和方法具有重要意义。
二、随机变量的概率分布1. 随机变量及其概率分布的概念•随机变量是对随机试验结果的数值化描述,它的取值不仅依赖于随机试验的结果,还受到机会因素的影响。
•概率分布描述了随机变量可能取值的概率大小。
常用的概率分布有离散型和连续型两种。
2. 离散型随机变量及其概率分布•离散型随机变量的取值是有限或可列的,它的概率分布可以用概率质量函数来描述。
•常见的离散型随机变量包括伯努利随机变量、二项分布、泊松分布等。
3. 连续型随机变量及其概率分布•连续型随机变量的取值是无限的,它的概率分布可以用概率密度函数来描述。
•常见的连续型随机变量包括均匀分布、正态分布等。
三、常见概率分布模型1. 二项分布•二项分布是指在 n 重伯努利试验中,成功的次数服从的概率分布。
其概率质量函数为二项式系数与成功概率的乘积。
•二项分布在实际应用中常用于描述成功次数的分布情况,如抽样调查中的样本中某一特征出现的次数。
2. 泊松分布•泊松分布是定义在非负整数集上的概率分布,它描述了在一段时间或空间内事件发生的次数。
其概率质量函数为事件发生率与时间(或空间)长度的乘积。
•泊松分布常用于描述罕见事件发生的次数,如单位时间内电话呼叫次数、一段时间内事故发生次数等。
3. 正态分布•正态分布是最重要的连续型概率分布模型之一,也称为高斯分布。
它的概率密度函数呈钟形曲线,对称于均值。
•正态分布在实际应用中广泛存在,如身高体重、测量误差、考试成绩等符合正态分布的情况较多。
4. 指数分布•指数分布是定义在非负实数集上的连续型概率分布,它描述了连续时间间隔或空间间隔内事件发生的情况。
其概率密度函数呈指数下降曲线。
•指数分布在实际应用中常用于描述无记忆性随机事件的发生情况,如设备失效时间、极端天气事件的间隔等。
《概率论与数理统计》第六章
既然总体是随机变量X,自然就有其概率分布。
我们把X的分布称为总体分布。
总体的特性是由总体分布来刻画的。因此,常 把总体和总体分布视为同义语。
第六章 样本及抽样分布 ‹#›
例2
在例1中,假定物体真实长度为(未知)。一般 说来,测量值X就是总体,取 附近值的概率要大一 些,而离 越远的值被取到的概率就越小。
k=1,2,…
第六章 样本及抽样分布 ‹#›
它反映了总体k 阶矩的信息
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶 中心矩的信息
第六章 样本及抽样分布 ‹#›
统计量的观察值
1 n
x n i1 xi;
s2
1 n 1
n i1
(xi
x )2
s
1 n 1
n i1
(xi
x
)2
第六章 样本及抽样分布 ‹#›
实际上,我们真正关心的并不一定是总体或个
体本身,而真正关心的是总体或个体的某项数量指 标。
如:某电子产品的使用寿命,某天的最高气温, 加工出来的某零件的长度等数量指标。因此,有时也
将总体理解为那些研究对象的某项数量指标的全
体。
第六章 样本及抽样分布 ‹#›
为评价某种产品质量的好坏,通常的做法是: 从全部产品中随机(任意)地抽取一些样品进行观测(检
样本X1,X2,…,Xn 既被看成数值,又被看成随机变量, 这就是所谓的样本的二重性。
随机样本
例 4 (例2续) 在前面测量物体长度的例子中,如果我们 在完全相同的条件下,独立地测量了n 次,把这 n 次测 量结果,即样本记为
X1,X2,…,Xn .
概率论与数理统计第6章
以分组区间为底,以
Yj
Wj X j1 X j
Wj 5
为高
作频率直方图
23
从频率直方图可看到:靠近两个极端的数据出现比 较少,而中间附近的数据比较多,即中间大两头小的分 布趋势,——随机变量分布状况的最粗略的信息。
在频率直方图中, 每个矩形面积恰好等于样本值 落在该矩形对应的分组区间内的频率,即
S j
Wj X j1
Xj
X j1 X j
Wj
频率直方图中的小矩形的面积近似地反映了样本数
据落在某个区间内的可能性大小,故它可近似描述X的
分布状况。
24
12
第二.计算样本特征数
1.反映集中趋势的特征数:样本均值、中位数、众数等 样本均值MEAN 中位数MEDIAN 众数
X 90.3
91
91, 94
代表性——即子样( X1, X2 ,
,
X
)的每个分量
n
X
与
i
总体 X 具有相同的概率分布。
独立性——即 X1, X2, , Xn 是相互独立的随机变量。
满足上述两点要求的子样称为简单随机子样.获得简 单随机子样的抽样方法叫简单随机抽样.
从简单随机子样的含义可知,样本 X1, X2 , , Xn 是来自总体 X、与总体 X具有相同分布的随机变量.
2分布 t 分布 数理统计的三大分布(都是连续型). F分布 它们都与正态分布有密切的联系.
在本章中特别要求掌握对正态分布、 2分布、 t分布、F分布的一些结论的熟练运用. 它们
是后面各章的基础.
31
一、 2分布
定义 设总体 X ~ N 0,1 , X1, X2,..., Xn 是 X
概率论与数理统计PPT课件(共8章)第六章 数理统计的基本概念
代表性
每个样本Xi(i=1,2,…,n)与 总体X具有相同的分布
独立性
各个样本X1,X2,…,Xn的取 值互不影响,即X1,X2,…,Xn是 相互独立的随机变量.
6.1.3 样本的联合分布
若 X1 ,X2 , ,Xn 为总体 X 的一个样本, X 的分布函数为 F(x) ,则 X1 ,X2 , ,Xn
n
n
xi
n xi
p i1 (1 p) i1 ,
概
率
论
与
数 理
6.2
统
计
统计量与抽样分布
6.2.1 统计量
定义 6.2 不含任何未知参数的样本 X1 ,X2 , ,Xn 的连续函数 g(X1 ,X2 , ,Xn )
称为统计量.
下面列出一些常用的统计量.
(1)样本均值
X
1 n
n i1
Xi
(2)样本方差
概
率
论
与
数
理 统 计
数理统计的基本概念
第六章
概
率
论
与
数
理 统
壹 总体与样本
计
贰 统计量与抽样分布
目录
概
率
论
与
数 理
6.1
统
计
总体与样本
总体与个体
6.1.1 总体
在数理统计中,通常把研究对象的全体称为总体,把构 成总体的每个研究对象称为个体.
总体分布
为了便于数学上的处理,我们将总体定义为随机变量, 记作.随机变量的分布称为总体分布.
N
(1
,12
)
与
N
(2
,
2 2
)
的样本,且这两个样本相互独立.设
概率论:第六章 数理统计的基本概念
简单区分方法: 在抽样之前或理论研究时, (X1, X2 , , Xn ) 为 n 维随机变量.
在抽样之后或实际应用时, (x1, x2 , , xn ) 为观察值.
二、统计量
1.统计量的概念
定义 1.3 设 (X1, X2, , Xn ) 为来自总体 X 的一个样本, g(x1, x2 , , xn ) 为一个 n 元函数,且不依赖总体 X 中的任 何未知参数,就称随机变量 g( X1, X 2 , , X n ) 为一个统计 量.如果 (x1, x2 , , xn ) 为样本观察值,也称 g(x1, x2 , , xn )
.
例 1.5 设总体 X 的数学期望 EX ,方差 DX 2 , ( X1, X2 , , Xn ) (n 1) 为来自总体 X 的一个样本,则
E X , DX 2 , E(S2) 2 .
n
(此例实为结论,务必记住!)
⑵ 顺序统计量
定义 1.5 设 ( X1 , X2 , , Xn ) 为来自总体 X 的一个样本,
而在实际问题中,对于不同的个体,其数量指标 X 的取值是不同的,因此数量指标 X 是一个随机变量.
随机变量 X 的分布称为总体的分布,总体的特征是
由总体的分布刻画的.为此,常把总体与总体分布视为
等同,并称总体 X .
例 1.1 考察某产品的次品率,令总体
1, 产品为次品, X 0, 产品为正品, 因此总体 X 的取值为1和 0 ,总体 X 为有限总体,也 是离散型总体,如果记该产品的次品率为 p ,则总体
本,求 X1 X 2 所服从的分布.
X3 X4
解
利用正态分布的性质, X1 X 2
概率论与数理统计第六章 数理统计的基本概念精品教案
第六章数理统计的基本概念一、内容提要数理统计学是数学的一个分支,它的任务是研究怎样用有效的方法去收集和使用带有随机性的数据,建立数学方法,去揭示所研究问题的统计规律性。
它的主要内容是由样本来推断总体。
(一)基本概率1. 总体、个体与样本:研究对象的全体称为总体,用X、Y等表示。
组成总体的每个元素称为个体或单元。
从总体中按一定的规律抽出一些个体就称为抽样,所抽及的个体称为样本,用X1,X2,…,X n表示。
一般样本容量小于50的样本称为小样本,样本容量大于等于50的样本称为大样本,但在样本不易实现时,样本容量大于30的样本可看作大样本。
包含有限个个体的总体称为有限总体,包含无限个个体的总体称为无限总体。
2. 简单随机抽样与简单随机样本:如果总体中各个个体被抽到的机会是均等的,并且在抽取一个个体后总体的成分不变,那么,抽得的一些个体就能很好地反映总体的情况,基于这种想法抽取个体的方法称为简单随机抽样。
抽得的这些个体构成一个样本,用(X1,X2,…,X n)表示,n为样本容量,X1,X2,…,X n应是n个相互独立的且与总体X同分布的随机变量,并将这种样本称为简单随机样本,简称样本。
本书所讨论的样本,如无特别声明,均指简单随机样本。
样本(X1,X2,…,X n)是n个相互独立的且与总体同分布的随机变量,而一次抽取之后,12(X 1,X 2,…,X n )又是n 个具体的数据x 1,x 2…,x n ,即样本的一组观测值,在不致引起混淆的情况下,样本和样本值都用(X 1,X 2,…,X n )表示,这就是样本的二重性。
3. 样本分布函数(或经验分布函数):设样本(X 1,X 2,…,X n )的观测值按由小到大次序排列后为:**2*1n x x x ≤≤≤Λ定义()()*1**1*0,,,,1,2,,11,.n k k n x x kF x x x x k n n x x +⎧⎪⎪=≤<=-⎨⎪⎪≥⎩p L ,为样本分布函数对于样本的不同观测值(x 1,x 2…,x n ),我们将得到不同的F n (x ),所以F n (x )是一个随机变量。
概率论与数理统计第六章数理统计的基本概念
第六章数理统计的基本概念前面五章我们讲述了概率论的基本内容,随后的五章将讲述数理统计.数理统计是以概率论为理论基础的一个数学分支.它是从实际观测的数据出发研究随机现象的规律性.在科学研究中,数理统计占据一个十分重要的位置,是多种试验数据处理的理论基础.数理统计的内容很丰富,本书只介绍参数估计、假设检验、方差分析及回归分析的部分内容.本章中首先讨论总体、随机样本及统计量等基本概念,然后着重介绍几个常用的统计量及抽样分布.第一节随机样本假如我们要研究某厂所生产的一批电视机显像管的平均寿命.由于测试显像管寿命具有破坏性,所以我们只能从这批产品中抽取一部分进行寿命测试,并且根据这部分产品的寿命数据对整批产品的平均寿命作一统计推断.在数理统计中,我们将研究对象的某项数量指标值的全体称为总体(Population),总体中的每个元素称为个体(Individual).例如上述的一批显像管寿命值的全体就组成一个总体,其中每一只显像管的寿命就是一个个体.要将一个总体的性质了解得十分清楚,初看起来,最理想的办法是对每个个体逐个进行观察,但实际上这样做往往是不现实的.例如,要研究显像管的寿命,由于寿命试验是破坏性的,一旦我们获得实验的所有结果,实用文档这批显像管也全烧毁了,我们只能从整批显像管中抽取一部份显像管做寿命试验,并记录其结果,然后根据这部份数据来推断整批显像管的寿命情况.由于显像管的寿命在随机抽样中是随机变量,为了便于数学上处理,我们将总体定义为随机变量.随机变量的分布称为总体分布.一般地,我们都是从总体中抽取一部分个体进行观察,然后根据所得的数据来推断总体的性质.被抽出的部分个体,叫做总体的一个样本.所谓从总体抽取一个个体,就是对总体X进行一次观察(即进行一次试验),并记录其结果.我们在相同的条件下对总体X进行n次重复的、独立的观察,将n次观察结果按试验的次序记为X1,X2,…,X n.由于X1,X2,…,X n是对随机变量X观察的结果,且各次观察是在相同的条件下独立进行的,于是我们引出以下的样本定义.定义6.1设总体X是具有分布函数F的随机变量,若X1,X2,…,X n是与X具有同一分布F(x),且相互独立的随机变量,则称X1,X2,…,X n为从总体X得到的容量为n的简单随机样本(Random sample),简称为样本.当n次观察一经完成,我们就得到一组实数x1,x2,…,x n.它们依次是随机变量X1,X2,…,X n的观察值,称为样本值.对于有限总体,采用放回抽样就能得到简单样本,当总体中个体的总数N比要得N≥10时),在实际中可将不放回抽样近似地当作到的样本的容量n大得多时(一般当n放回抽样来处理.实用文档实用文档若X 1,X 2,…,X n 为总体X 的一个样本,X 的分布函数为F (x ),则X 1,X 2,…,X n 的联合分布函数为F *(x 1,x 2,…,x n )=∏=ni i x F 1)(.又若X 具有概率密度f ,则X 1,X 2,…,X n 的联合概率密度为f *(x 1,x 2,…,x n )=∏=ni i x f 1)(.我们在搜集资料时,如果未经组织和整理,通常是没有什么价值的,为了把这些有差异的资料组织成有用的形式,我们应该编制频数表(即频数分布表).例6.1 某工厂的劳资部门为了研究该厂工人的收入情况,首先收集了工人的工资资料,表6-1记录了该厂30名工人未经整理的工资数值:表6-1以下,我们以例6.1为例介绍频数分布表的制作方法.表6-1是30个工人月工资的原始资料,这些数据可以记为x1,x2,…,x30,对于这些观测数据,第一步确定最大值x max和最小值x min,根据表6-1,有x max=640,x min=420.第二步分组,即确定每一收入组的界限和组数,在实际工作中,第一组下限一般取一个小于x min的数,例如,我们取400,最后一组上限取一个大于x max的数,例如取650,然后从400元到650元分成相等的若干段,比如分成5段,每一段就对应于一个收入组.表6-1资料的频数分布表如表6-2所示.表6-2实用文档600~650230图6-1为了研究频数分布,我们可用图示法表示.直方图直方图是垂直条形图,条与条之间无间隔,用横轴上的点表示组限,纵轴上的单位数表示频数.与一个组对应的频数,用以组距为底的矩形(长条)的高度表示,表6-2资料的直方图如图6-1所示.上述方法我们对抽取数据加以整理,编制频数分布表,作直方图,画出频率分布曲线,这就可以直观地看到数据分布的情况,在什么范围,较大较小的各有多少,在哪些地方分布得比较集中,以及分布图形是否对称等等,所以,样本的频率分布是总体概率分布的近似.样本是总体的反映,但是样本所含的信息不能直接用于解决我们所要研究的问题,而需要把样本所含的信息进行数学上的加工使其浓缩起来,从而解决我们的问题.针对不同的问题构造样本的适当函数,利用这些样本的函数进行统计推断.定义6.2设X1,X2,…,X n是来自总体X的一个样本,g(X1,X2,…,X n)是X1,X2…,X n的函数,若g中不含任何未知参数,则称g(X1,X2,…,X n)是一个统计量(Statistic).实用文档实用文档设x 1,x 2,…,x n 是相应于样本X 1,X 2,…,X n 的样本值,则称g (x 1,x 2,…,x n )是g (X 1,X 2,…,X n )的观察值.下面我们定义一些常用的统计量.设X 1,X 2,…,X n 是来自总体X 的一个样本,x 1,x 2,…,x n 是这一样本的观察值.定义样本平均值∑==ni i X n X 11;样本方差S 2=2221111()11n ni i i i X X X nX n n ==⎡⎤-=-⎢⎥--⎣⎦∑∑; 样本标准差S =∑=--=n i iX X n S 122)(11; 样本k 阶(原点)矩A k =∑=n i ki X n 11,k =1,2,…;样本k 阶中心矩B k =∑=-ni k i X X n 1)(1,k =1,2,….它们的观察值分别为∑==ni i x n x 11;实用文档s 2=2221111()11n n i i i i x x x nx n n ==⎡⎤-=-⎢⎥--⎣⎦∑∑ s =∑=--ni i x x n 12)(11; a k =∑=n i ki x n 11, k =1,2,…;b k =11()nk i i x x n =-∑, k =1,2,….这些观察值仍分别称为样本均值、样本方差、样本标准差、样本k 阶矩、样本k 阶中心矩.第二节 抽样分布统计量是样本的函数,它是一个随机变量.统计量的分布称为抽样分布.在使用统计量进行统计推断时常需知道它的分布.当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说是困难的.本节介绍来自正态总体的几个常用的统计量的分布.1.χ2分布设X 1,X 2,…,X n 是来自总体N (0,1)的样本,则统计量2χ=X 12+X 22+…+X n 2所服从的分布称为自由度为n 的2χ分布(2χdistribution ),记为2χ~)(2n χ.实用文档)(2n χ分布的概率密度函数为f (y )=⎪⎩⎪⎨⎧>--.,0,0,)2(212122其他y y n y n n e Γf (y )的图形如图62所示.图622χ分布具有以下性质:(1) 如果21χ~)(12n χ,22χ~)(22n χ,且它们相互独立,则有)(~2122221n n ++χχχ.这一性质称为2χ分布的可加性. (2) 如果2χ~)(2n χ,则有E (2χ)=n ,D (2χ)=2n .证 只证(2)因为X i ~N (0,1)故E (X i 2)=D (X i )=1,D (X i 2)=E (X i 4)E (X i 2)]2=31=2,i =1,2,…,n .于是,)()()(12122n X E X E E ni i ni i ===∑∑==χ图63.2)()()(12122n X D X D D ni i n i i ===∑∑==χ对于给定的正数α,0<α<1,称满足条件实用文档{}⎰∞==>)(222)()(n y y f n P αχααχχd的点)(2n αχ为)(2n χ分布的上α分位点(Percentile of α),如图63所示,对于不同的α,n ,上α分位点的值已制成表格,可以查用(见附表),例如对于α=0.05,n =16,查附表得)16(205.0χ=26.296.但该表只详列到n =45为止.当n >45时,近似地有)(2n αχ≈2)12(21-+n z α,其中z α是标准正态分布的上α分位点.例如)50(205.0χ≈12(1.645+99)2=67.221.2.t 分布设X ~N (0,1),Y ~2()n χ,并且X ,Y 独立,则称随机变量t =nYX服从自由度为n 的t 分布(t distribution ),记为t ~t (n ).t (n )分布的概率密度函数为h (t )=[]2/)1(21)2/(2/)1(+-⎪⎪⎭⎫⎝⎛++n n t n n n ΓΓπ, ∞<t <∞.(证略). 图64中画出了当n =1,10时h (t )的图形.h (t )的图形关于t =0对称,当n充分大时其图形类似于标准正态变量概率密度的图形.但对于较小的n ,t 分布与N (0,1)分布相差很大(见附表).实用文档图6 4 图65对于给定的α,0<α<1,称满足条件P (t >t α(n ))=⎰∞)()(n t t t h αd =α的点t α(n )为t (n )分布的上α分位点(见图65).由t 分布的上α分位点的定义及h (t )图形的对称性知t 1α(n )=t α(n ).t 分布的上α分位点可从附表查得.在n >45时,就用正态分布近似:t α(n )≈z α.3.F 分布设U ~)(12n χ,V ~)(22n χ,且U ,V 独立,则称随机变量F =21//n V n U 服从自由度为(n 1,n 2)的F 分布(F distribution ),记F ~F (n 1,n 2).F (n 1,n 2)分布的概率密度为[][]⎪⎩⎪⎨⎧>++=+-.,0,0,)/(1)2/()2/()/(2/)()(2/)(21211)2/(2/21212111其他y n y n n n y n n n n y n n n n ΓΓΓψ (证略).实用文档)(y ψ的图形如图66所示.图6 6 图67F 分布经常被用来对两个样本方差进行比较.它是方差分析的一个基本分布,也被用于回归分析中的显著性检验.对于给定的α,0<α<1,称满足条件P {F >F α(n 1,n 2)}=⎰∞),(21)(n n F y y αψd =α的点F α(n 1,n 2)为F (n 1,n 2)分布的上α分位点(图67).F 分布的上α分位点有表格可查(见附表).F 分布的上α分位点有如下的性质:F 1α(n 1,n 2)=),(112n n F α.这个性质常用来求F 分布表中没有包括的数值.例如由附表查得F 0.05(9,12)=2.80,则可利用上述性质求得F 0.95(12,9)=1/F 0.05(9,12)=12.80=0.357. 4.正态总体的样本均值与样本方差的分布设正态总体的均值为μ,方差为σ2,X 1,X 2,…,X n 是来自正态总体X 的一个简单实用文档样本,则总有E (X )=μ, D (X )=σ2/n ,X ~N (μ,σ2/n ).对于正态总体N (μ,σ2)的样本方差S 2, 我们有以下的性质.定理6.1 设X 1,X 2,…,X n 是总体N (μ,σ2)的样本,X ,S 2分别是样本均值和样本方差,则有(1))1(~)1(222--n S n χσ;(2)X 与S 2独立. (证略).定理6.2 设X 1,X 2,…,X n 是总体N (μ,σ2)的样本,X ,S 2分别是样本均值和样本方差,则有)1(~/--n t nS X μ.证 因为)1,0(~/N nX σμ-,)1(~)1(222--n S n χσ且两者独立,由t 分布的定义知实用文档)1(~)1()1(//22----n t n S n nX σσμ. 化简上式左边,即得)1(~/--n t nS X μ.定理6.3 设X 1,X 2,…,1n X 与Y 1,Y 2,…,2n X 分别是来自具有相同方差的两正态总体N (μ1,σ2),N (μ2,σ2)的样本,且这两个样本相互独立.设∑==1111n i i X n X ,∑==2121n i i Y n Y 分别是这两个样本的均值.S 12=∑=--1121)(11n i i X X n ,S 22=∑=--2122)(11n i i Y Y n 分别是这两个样本的样本方差,则有:)2(~/1/1)()(212121-++---n n t n n S Y X W μμ,其中 S W 2=)2()1()1(21222211-+-+-n n S n S n .(证略).本节所介绍的三个分布以及三个定理,在下面各章中都起着重要的作用.应注意,它们都是在总体为正态总体这一基本假定下得到的.例6.2 设总体X 服从正态分布N (62,100),为使样本均值大于60的概率不小于0.95,问样本容量n 至少应取多大?解 设需要样本容量为n ,则)1,0(~/N n X nX ⋅-=-σμσμ,实用文档P (X >60)=⎭⎬⎫⎩⎨⎧⋅->⋅-n n X P 1062601062.查标准正态分布表,得Φ(1.64)≈0.95.所以0.2n ≥1.64,n ≥67.24.故样本容量至少应取68.小 结在数理统计中往往研究有关对象的某一项数量指标,对这一数量指标进行试验和观察,将试验的全部可能的观察值称为总体,每个观察值称为个体.总体中的每一个个体是某一随机变量X 的值,因此一个总体对应于一个随机变量X ,我们笼统称为总体X .随机变量X 服从什么分布就称总体服从什么分布.若X 1,X 2,…,X n 是相同条件下,对总体X 进行n 次重复独立的观察所得到的n 个结果,称随机变量X 1,X 2,…,X n 为来自总体X 的简单随机样本,它具有两条性质.1.X 1,X 2,…,X n 都与总体具有相同的分布;2.X 1,X 2,…,X n 相互独立.我们就是利用来自样本的信息推断总体,得到有关总体分布的种种结论.完全由样本X 1,X 2,…,X n 所确定的函数g =g (X 1,X 2,…,X n )称为统计量,统计量是一个随机变量.它是统计推断的一个重要工具.在数理统计中的地位相当重要,相当于随机变量在概率论中的地位.实用文档样本均值 ∑==ni i X n X 11和样本方差 S 2=∑=--n k k X X n 12)(11是两个最重要的统计量,统计量的分布称为抽样分布,读者需要掌握统计学中三大抽样分布:2χ分布,t 分布,F 分布.读者学习后续内容还需要掌握以下重要结果:1.设总体X 的一个样本为X 1,X 2,…,X n .且X 的均值和方差存在. 记μ=EX ,σ2=DX .则E (X )=μ, D (X )=σ2/n , ES 2=σ2.2.设总体X~N (μ,σ2),X1,X2,…,Xn 是X 的一个样本,则 (1) X ~N (μ,σ2/n ); (2))1(~)1(222--n S n χσ;(3) X 和S 2相互独立; (4))1(~/--n t nS X μ.3.定理6.3的结果. 重要术语及主题总体 样本 统计量实用文档2χ分布、t 分布、F 分布的定义及它们的密度函数图形上的α分位点.习 题 六1.设总体X ~N (60,152),从总体X 中抽取一个容量为100的样本,求样本均值与总体均值之差的绝对值大于3的概率.2.从正态总体N (4.2,52)中抽取容量为n 的样本,若要求其样本均值位于区间(2.2,6.2)内的概率不小于0.95,则样本容量n 至少取多大?3.设某厂生产的灯泡的使用寿命X ~N (1000,σ2)(单位:小时),随机抽取一容量为9的样本,并测得样本均值及样本方差.但是由于工作上的失误,事后失去了此试验的结果,只记得样本方差为S 2=1002,试求P (X >1062).4.从一正态总体中抽取容量为10的样本,假定有2%的样本均值与总体均值之差的绝对值在4以上,求总体的标准差.5.设总体X ~N (μ,16),X 1,X 2,…,X 10是来自总体X 的一个容量为10的简单随机样本,S 2为其样本方差,且P (S 2>a )=0.1,求a 之值.6.设总体X 服从标准正态分布,X 1,X 2,…,X n 是来自总体X 的一个简单随机样本,试问统计量Y =∑∑==-ni ii i XX n 62512)15(,n >5实用文档服从何种分布?7.求总体X ~N (20,3)的容量分别为10,15的两个独立随机样本平均值差的绝对值大于0.3的概率.8.设总体X ~N (0,σ2),X 1,…,X 10,…,X 15为总体的一个样本.则Y =()21521221121022212X X X X X X ++++++ 服从 分布,参数为 . (2001研考)9.设总体X ~N (μ1,σ2),总体Y ~N (μ2,σ2),X 1,X 2,…,1n X 和Y 1,Y 2,…,2n X 分别来自总体X 和Y 的简单随机样本,则⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-+-+-∑∑==2)()(21121221n n Y Y X X E n j j n i i = . (2004研考) 10.设总体X ~N (μ,σ2),X 1,X 2,…,X 2n (n ≥2)是总体X 的一个样本,∑==ni i X n X 2121,令Y =∑=+-+ni i n iX X X12)2(,求EY . (2001研考)11. 设总体X 的概率密度为f (x )=x-e21 (-∞<x <+∞),X 1,X 2,…,X n 为总体X 的简单随机样本,其样本方差为S 2,求ES 2. (2006研考)。
概率论与数理统计第六章
Ch 6 数理统计的基本概念§6.1 基本概念 一、总体与样本1、总体——研究对象的全体,记为X 。
2、个体——构成总体的每一个对象,记为i X 。
3、总体容量——总体中包含的个体的个数。
有限总体——容量有限;无限总体——容量无限。
为推断总体X 的分布,从总体中抽取n 个个体,则对应n 个r.v.n X X X .....2,1——来自于总体X 的一个样本。
n X X X ......,21的取值((n x x x ,.....,21)--观测结果)称为样本的观测值,简称为样本值,整个抽取过程称之为抽样。
抽取的目的是根据样本的取值情况推断总体情况,因此应尽可能的使抽取的样本能反映总体的状况,故要求抽取的样本具有以下性质:文档收集自网络,仅用于个人学习⑴ 代表性:样本中每个r.v.i X 与总体X 具有相同的分布。
文档收集自网络,仅用于个人学习⑵ 独立性:n X X X ......,21相互独立。
——简单的随机抽样所得的样本称为简单的随机样本;若总体X 的分布函数为F (x ),则样本n X X X .....2,1的联合分布函数)().....,(121*i ni n x F x x x F =∏=。
文档收集自网络,仅用于个人学习若X 为连续型,且d.f 为f(x),且联合p.d.f 为:)()....,(121*i ni n x f x x x f =∏= 若X 为离散型,且分布律为:....2,1,)(===k p x X P k k 则联合分布律:in i i in n i i p p p x X x X x X P ....).....,(212211⋅⋅====。
...2,1.....3,2,1=in i i i 二、统计量Def:不含有任何未知数的关于样本空本空间的函数称为统计量。
e.g.1 设总体X~),(2σμN ,其中2,σμ未知,(n X X X .....2,1)为取自总体X 的一个样本,则:∑∑==--==n i i n i i X X n S X n X 1221)(11,1均为统计量。
概率论与数理统计 第6章
6.1 基本概念 6.2 抽样分布 习题 6
数理统计是具有广泛应用的一个数学分支,它以概率论 为基础,根据试验或观察得到的数据来研究随机现象,对研 究对象的客观规律性作出种种合理的估计和判断。数理统计 的内容包括:如何收集、整理数据资料;如何对所得的数据
资料进行分析、研究,从而对所研究的对象的性质、特点作
设总体 X 的分布律为 P ( X = x ) = p ( x ), X 1 , X
2
,…, X n为来自总体 X 的一个样本,则 X 1 , X 2 ,…, , X 2 ,…, X n)的联合分布律为
X n的分布律都是 P ( X i = x ) = p ( x ),从而 n 维随机变量(X
1
设总体 X 的概率密度为 f ( x ), X 1 , X 2 ,…, X n为 来自总体 X 的一个样本,则 X 1 , X 2 ,…, X n的概率密度 都是 f ( x ),从而 n 维随机变量(X 1 , X 2 ,…, X n)的联合 概率密度为
( n ) ,则称函数
为总体 X 的经验分布函数。
需要指出的是,若在 F n (x )的定义中将样本值换成对 应的样本,则当 n 固定时,它是一个随机变量,此时仍称之 为总体 X 的经验分布函数。所以用样本值定义的 F n (x )其 实是经验分布函数的观察值,在不致混淆的情况下统称为总 体 X 的经验分布函数。
出推断。数理统计的重要分支有统计推断、试验设计、多元 分析等,其具体方法甚多,应用相当广泛,已成为各学科从
事科学研究及生产、经济等部门进行有效工作的必不可少的
数学工具。
本章从数理统计的基本概念开始,讨论抽样分布及其重 要定理,这些抽样分布及其重要定理在概率论中尚未提到,
概率论与数理统计第6章
, xi
解
f x1 , x2 , , x6 ; e
x
1
x1 !
e
x
2
x2 !
e
x
6
x6 !
e
6
6
xi
i 1
n
x !
i 1 i
, x , x ,, x
1 2
6
0,1,2,
二、样本
第6章 统计量和抽样分布
14
例5
设总体 X ~ U (0, ) , ( X1 , X 2 ,L , X n ) 是取自上均匀分布总体 X 的一个样本, 0 未知, 求样本( X1 , X 2 ,
⑵当总体 X 是连续型随机变量时, 定义总体分布为
f x; θ ˆ f X x; θ , 即为总体 X 的概率密度函数.
一、总体
第6章 统计量和抽样分布
6
例1 解
设总体
X ~ B 1 ,p ,试写出总体分布律 f x; p .
,n
f ( x; p) P( X x) (1 p)1 x p x , x 0,1, 2,
二、样本
第6章 统计量和抽样分布
11
⑵ 设 X 为连续型随机变量, 概率密度函数为 f x; θ ,
则样本
X1 , X 2 ,
, X n 的联合概率密度函数为:
,Xn
f x1 , x2 ,
, xn ; θ ˆ f X1 , X 2
x1 , x2 ,
, xn
f X1 x1 f X2 x2 f x1; θ f x2 ;θ
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 n s ( xi x ) 2 n 1 i 1 1 n ( xi 2 nx 2 ) n 1 i 1
s 1 n ( xi x ) 2 n 1 i 1
样本标准差 S S
2
1 n ( X i X )2 n 1 i 1
1 n k 样本 k 阶(原点)矩 Ak X i , k 1, 2, n i 1 1 n 样本 k 阶中心矩 Bk ( X i X )k , k 2,3, n i 1
§6.3 正态总体的抽样分布
§6.1 §6.2§6.3
第六章 数理统计学的基本概念
§6.3 常用的统计分布
统计量是样本的函数,它是一个随机变 量。统计量的分布,叫做 “抽样分布” .
下面介绍数理统计学中重要的三大分布:χ2
分布,t分布,F分布
第六章 数理统计学的基本概念
§6.3 常用的统计分布
i 1
n
第6章 数理统计学的基本概念
§6.2 统计量
§6.1 §6.2§6.3
第六章 数理统计学的基本概念
§6.1 总体与样本
一. 统计量
1.样本是进行统计推断的依据。 2.处理方法:不直接使用样本,而是针对不同的问题构造样本的适 当函数,利用这些样本函数进行行统计推断。
定义 设 X 1 , X 2 ,, X n 是来自总体 X 的一个样本, g ( X1 , X 2 ,, X n ) 是 X 1 , X 2 ,, X n 的函数 , 若 g 中不含未 知参数,则称 g ( X1 , X 2 ,, X n ) 是该样本的统计量.
1 n k ak xi , k 1, 2, n i 1
1 n bk ( xi x )k , k 2, 3, n i 1
第六章 数理统计学的基本概念
§6.2 统计量
例 设 X 1 , X 2 ,, X n 是来自二项分布总体 B(n, p) 的 简单随机样本, X , S 2 分别为样本均值和样本方差, 记 统计量 T X S ,则 E (T ) =
则
X Y ~ (n1 n2 )
2
第二章 随机变量
§2.3 连续型随机变量及其分布
4.标准正态分布(P40页)
设随机变量 X ~ N (0,1) ,对给定的 , 0 1 ,称满足 条件
P{ X z } ( x)dx
Za
( x)
,
的点 z 为标准正态分布的上 分位点,如图所示.
2
np2
第六章 数理统计学的基本概念
§6.2 统计量
例
设总体 X ~ N (1 , ) , Y ~ N (2 , ) 的正态分
2 2
布 , X 1, X 2 ,, X n1 和 Y1, Y2 ,, Yn 2 分 别 是 来 自 总 体
X , Y 的简单随机样本,则
n2 n1 2 2 ( X i X ) (Y j Y ) i 1 j 1 = E n1 n2 2
第6章 数理统计的基本概念
§6.1 总体与样本
§6.2 统计量 §6.3 正态总体的抽样分布
§6.1 §6.2§6.3
第六章 数理统计学的基本概念
概率论: 概率分布已知.计算概率
例如:已知 X ~ N ( , 2 ) ,计算 P{1 X 3}
数理统计:已知: X 服从正态分布 未知: 或者 2 解决问题:如何估计出 或者 。
§6.3 常用的统计分布
一. 数理统计学三大分布
2 1. 分布
(1)构成: 定义设 X 1 , X 2 ,, X n 是独立同分布,且都服从 来 N (0,1) ,则称统计量
Y X12 X 22 X n 2
服从自由度为 n 的 2 分布,记为 Y ~ 2 (n) .此处,自由度是 指式右端包含的独立变量的个数. 显然,若 X 1 , X 2 ,, X n 为来自总体 N (0,1) 的样本,则 统计量 X i2 ~ 2 (n)
O
由 ( x) 图形的对称性知, z1 z .后边统计中会用到。
z
x
由关系式 ( z ) 1 ,对于给定的 的值,反查标准正态分布表 可得 z 的值.
第六章 数理统计学的基本概念
2 (4) 分布的分位点
§6.3 常用的统计分布
设 2 ~ 2 (n) ,对于给定的正数 (0 1) ,称满足条件
F ( x1 , x2 ,, xn )=F ( xi ) .
i 1 n
2.特别地,若总体是连续型随机变量,其概率密度为 f ( x) ,
(X1 , X 2 ,, X n) 则样本 的概率密度(联合概率密度)为
f ( x1 , x2 ,, xn )= f ( xi ) .
i 1
n
第六章 数理统计学的基本概念
1.总体 X ~ N ( , ) ,则称该总体为正态总体.
2
2.统计量:样本的函数,对总体的分布中参数做估 计和检验.
3.统计量的分布称作抽样分布.
4.三大分布: 分布, t 分布, F 分布.
2
5.三大分布掌握内容: 1)分布的构成形式. 2)大致图像 3)上 分位点 4)性质
第六章 数理统计学的基本概念
i 1 n
第六章 数理统计学的基本概念
2 (2) 分布图像
§6.3 常用的统计分布
由图可知,n越大图形越对称。
f (x)
0.40 0.30 0.20 0.10
n2 n 1 n4 n6 n 11
x
O
2
4 6 8 10 12 14 16
第六章 数理统计学的基本概念
2 (3) 分布的性质
F ( x) P{ X x} P{ X
/ n
x
/ n
} {
x
/ n
}
第六章 数理统计学的基本概念
§6.2 统计量
例 6.2.3 某公司用机器向瓶子里灌装液体洗洁剂,规 定每瓶装 毫升,但实际灌装总量总有一定波动, 假定灌 装量的方差 2 1 。如果每箱装 25 瓶这样的洗洁剂,试 问这 25 瓶洗洁剂的平均每瓶灌装量与标定值 相差不 过 0.3 毫升的概率是多少?
2
第六章 数理统计学的基本概念
§6.2 统计量
定理 6.2.1 假设 X 1 , X 2 ,, X n 为来自均值 、方差
2 的总体的一组样本,当 n 充分大时,近似的有, 样本的
均值 X
X ~ N ( ,
2
n
),
定理表明: 不管总体的具体分布如何,只要均值 、方差 2 , 那么这个总体抽取的样本的均值 X 就近似的服从正态分 布。
第六章 数理统计学的基本概念
§6.2 统计量
二. 常用统计量
统计量
它反映了总体均值 的信息
观测值
1 n x xi n i 1
1 n 样本均值 X X i n i 1
它反映了总体方差 的信息
2
样本方差
1 n 2 1 n 2 2 X nX S ( X X ) i i n 1 n 1 i 1 i 1
P (n)
2 2
2 (n)
f ( x)dx
2 ( n) 为 2 (n) 分布的上 分位点,如图所示. 的点
f ( x)
O
2 ( n)
x
第六章 数理统计学的基本概念
2 (5) 分布的例题
§6.3 常用的统计分布
例:设 X 1 , X 2 , X 3 , X 4 是来自总体 N (0, 22 ) 的简单随机样本,
2
处理方法:对随机变量X进行多次观测,利用观测 所得到的数据,推断X的分布规律。 ———统计的 任务。
第6章 数理统计学的基本概念
§6.1 总体与样本
§6.1 §6.2§6.3
第六章 数理统计学的基本概念
§6.1 总体与样本
一. 总体和个体
个体:总体的每个元素。 例如:某工厂生产的灯泡寿命的全体是一个总体。 每一个灯泡的寿命就是一个个体; 总体中包含的个体的数量,分为有限总体和无限总体。
总体:研究对象的某项数量指标X取值的全体称为总体。
有限总体:某工厂10月生产的灯泡寿命。
无限总体:这个工厂生产的所有灯泡的寿命。
第六章 数理统计学的基本概念
§6.1 总体与样本
X的分布函数、数字特征分别称为总体的分布函数 和数字特征。以后不再区分总体和相应的随机变量。 从总体中抽取一部分个体进行观查,然后根据所 得数据来推断总体的性质。被抽出的部分个体,叫做 总体的一个样本。
解 记一箱中 25 瓶洗洁剂灌装量为 X 1 , X 2 ,, X 25 ,他们 是来自均值为 、方差为 1 的总体的样本。 我们计算事件 { X 0.3} 的概率。 根据定理 6.2.1:
第六章 数理统计学的基本概念
§6.2 统计量
解
P{ X 0.3} P{.03 X 0.3} P{ .03 0.3 0.3 X
§6.1 总体与样本
三. 样本的概率分布
3.若总体是离散型随机变量,其分布律为
P{ X xi } pi , i 1, 2,,
(X1 , X 2 ,, X n) 则样本 的分布律(联合分布律)为
P{X1 x1 , X 2 x2 ,, X n xn }=P{X i xi } .
/ n / n