概率统计简明教程 第六章 数理统计的基础知识
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章数理统计的基础知识
从本章开始,我们将讨论另一主题:数理统计.数理统计是研究统计工作的一般原理和方法的数学学科,它以概率论为基础,研究如何合理地获取数据资料,并根据试验和观察得到的数据,对随机现象的客观规律性作出合理的推断.
本章介绍数理统计的基本概念,包括总体与样本、经验分布函数、统
计量与抽样分布,并着重介绍三种常用的统计分布:2 分布、t分布和F 分布.
§1 总体与样本
1.1 总体
在数理统计中,我们把所研究对象的全体称为总体,总体中的每个元素称为个体.例如,研究某班学生的身高时,该班全体学生构成总体,其中每个学生都是一个个体;又如,考察某兵工厂生产炮弹的射程,该厂生产的所有炮弹构成总体,其中每个炮弹就是一个个体.
在具体问题的讨论中,我们关心的往往是研究对象的某一数量指标(例如学生的身高),它是一个随机变量,因此,总体又是指刻画研究对象某一数量指标的随机变量X.当研究的指标不止一个时,可将其分成几个总体来研究.今后,凡是提到总体就是指一个随机变量.随机变量的分布函数以及分布律(离散型)或概率密度(连续型)也称为总体的分布函数以及分布律或概率密度,并统称为总体的分布.
总体中所包含的个体总数叫做总体容量.如果总体的容量是有限的,则称为有限总体;否则称为无限总体.在实际应用中,有时需要把容量很大的有限总体当做是无限总体来研究.
1.2随机样本
在数理统计中,总体X的分布通常是未知的,或者在形式上是已知
182
183
的但含有未知参数.那么为了获得总体的分布信息,从理论上讲,需要对总体X 中的所有个体进行观察测试,但这往往是做不到的.例如,由于测试炮弹的射程试验具有破坏性,一旦我们获得每个炮弹的射程数据,这批炮弹也就全部报废了.所以,我们不可能对所有个体逐一加以观察测试,而是从总体X 中随机抽取若干个个体进行观察测试.从总体中抽取若干个个体的过程叫做抽样,抽取的若干个个体称为样本,样本中所含个体的数量称为样本容量.
抽取样本是为了研究总体的性质,为了保证所抽取的样本在总体中具有代表性,抽样方法必须满足以下两个条件:
(1)随机性 每次抽取时,总体中每个个体被抽到的可能性均等. (2)独立性 每次抽取是相互独立的,即每次抽取的结果既不影响其它各次抽取的结果,也不受其它各次抽取结果的影响.
这种随机的、独立的抽样方法称为简单随机抽样,由此得到的样本称为简单随机样本.
对于有限总体而言,有放回抽样可以得到简单随机样本,但有放回抽样使用起来不方便.在实际应用中,当总体容量N 很大而样本容量n 较小时(一般当10N n ≥时),可将不放回抽样近似当作有放回抽样来处理. 对于无限总体而言,抽取一个个体不会影响它的分布,因此,通常采取不放回抽样得到简单随机样本.以后我们所涉及到的抽样和样本都是指简单随机抽样和简单随机样本.
从总体X 中抽取一个个体,就是对总体X 进行一次随机试验.重复做n 次试验后,得到了总体的一组数据12(,,,)n x x x ,称为一个样本观测值.由于抽样的随机性和独立性,每个(1,2,,)i x i n = 可以看作是某个随机变量(1,2,,)i X i n = 的观测值,而(1,2,,)i X i n = 相互独立且与总体
X 具有相同的分布.习惯上称n 维随机变量12(,,,)n X X X 为来自总体X 的简单随机样本.
定义1.1 设总体X 的分布函数为()F x ,若随机变量12,,,n
X X X 相互独立,且都与总体X 具有相同的分布函数,则称12,,,n X X X 是来自
184
总体X 的简单随机样本,简称为样本,n 称为样本容量.在对总体X 进行一次具体的抽样并作观测之后,得到样本12,,,n X X X 的确切数值
12,,,n x x x ,称为样本观测值,简称为样本值.
若总体X 的分布函数为()F x ,12,,,n X X X 是总体X 的容量为n 的样本,则由样本的定义知,12,,,n X X X 的联合分布函数为:
1
12*
).(,,,)(n
i n i
F F x x x x ==
∏ (1.1)
若总体X 是离散型随机变量,其分布律为{}i i p P X x ==(1,2,i = ),则12,,,n X X X 的联合分布律为:
{}
1122,,,n n P X x X x X x === 1
1
()n
i i n
i i i
P X x p ===
==
∏
∏
. (1.2)
若总体X 是连续型随机变量,其概率密度为()f x ,则12,,,n X X X 的联合概率密度为:
121
*
(,,,)()n
n i i f x x x f x ==
∏
. (1.3)
例1.1 设总体X 服从正态分布2
(,)N μσ,其概率密度为
2
2()21()x f x μσ
--
=
,x -∞<<+∞.
则样本12,,,n X X X 的联合概率密度为:
{}
2
1
12*
1
exp 1()2(,,,)n
i i n x f x x x μσ=--=
∏
{}2
2
1
11
exp()
2
,
n
n
i
i
xμ
σ=
=--
∑
,1,2,,.
i
x i n
-∞<<+∞= .
例 1.2设总体(,)
X B N p
,
12
,,,
n
X X X
为来自总体X的样本,
求
12
,,,
n
X X X
的联合分布律.
解
12
,,,
n
X X X
相互独立,并且(,)
i
X B N p
,1,2,,
i n
= .
因此,
i
X的分布律为
{}C(1),
i i i
x x N x
i i N
P X x p p-
==-0,1,2,,;1,2,,
i
x N i n
==
所以
12
,,,
n
X X X
的联合分布律为
{}
1122
,,,
n n
P X x X x X x
===
{}
1
i i
n
i
P X x
=
=
=∏
11
1
C)(1)
(.
i
n n
i i
i i
n
x
N
i
x nN x
p p
==
=
-
-
∑∑
=∏0,1,2,,;1,2,,.
x N i n
i==
1.3经验(样本)分布函数
设总体X的分布函数为()
F x,从总体X中抽取容量为n的样本
12
,,,
n
X X X
,样本值为
12
,,,
n
x x x
.假设样本值
12
,,,
n
x x x
中有k 个不相同的值,按由小到大的顺序依次记作:
()
(1)(2)k
x x x
≤≤≤
,
并假设
()i
x出现的频数为
i
n,那么
()i
x出现的频率为
i
i
n
f
n
=,1,2,,,
i k k n
=≤
,
显然有
185