第四章 数理统计的基本概念
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 数理统计的基本概念
一、教学要求
㈠ 理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本 方差及样本矩的计算.
㈡ 了解 2 c 分布、t 分布和F 分布的定义及性质,了解分位数的概念并会查表 计算.
㈢ 掌握正态总体的某些常用统计量的分布.
二、内容提要
㈠ 总体、样本与统计量
1. 总体 在数理统计中,把所研究对象的全体称为总体.总体中每一个元素称 为个体.这里我们不是研究对象的所有特性,而是研究它的一个(或某几个)特性及 其分布.从数学上说,总体就是一个随机变量 .
X 2. 样本 在总体X 中随机抽取n 个个体 12 ,,, n X X X L 称为来自总体X 的一 个样本,n 为样本容量.
若 12 ,, n X X X L 相互独立且与总体X 有相同分布,则称 12 ,, n X X X L 为来自总 体X 的一个简单随机样本(简称样本).
12 ,, n X X X L 的观察值 12 ,, n x x x L 称为总体的一个样本值.
3. 统计量 设 12 ,, n X X X L 为来自总体X 的一个样本, 12 (,,,) n g x x x L 为一n 元连续函数,如果 12 (,,,) n g X X X L 中不含任何未知参数,则称 12 (,,,) n g X X X L 为 统计量.
4. 常用统计量 设 12 ,, n X X X L 为来自总体X 的一个样本,定义: 1
1 n
i i X X n = = å 为样本均值;
2
2
22 11
11 ()() 11 n n i i i i S X X X nX n n == =-=- -- åå 为样本方差; 2
1
1 () 1 n i i S X X n = =
- - å 为样本标准差; 1
1 (1,2,) n k
k i i m X k n = == å L 样本k 阶原点矩;
1 1 ()(1,2,) n
k k i i M X X k n = =-= å L 为样本k 阶中心矩.
显然有 1 .
m X = 若记 22 2 1 1 (), n i i S M X X n = ==- å % 则 22 1 . n S S n
- = % 5. 性质 设总体X 的期望为 , m 方差为 2 , s 又 12 ,, n X X X L 为来自总体X 的 一个样本, 则
⑴ ()(). E X E X m == ⑵ 2
() ().
D X D X n n s == ⑶ 22 ()().
E S D X s == ⑷ X 与 2 S 相互独立.
注 ⑴, ⑵说明,对任意总体X , 当n 较大时, 近似地有 2 ~(,), X N n m s 即 (0,1). X N n
m
s - : ㈡ 统计中的几个常用分布 1. 2 c 分布
⑴ 定义 设 12 ,,, n X X X L 相互独立, 且都服从 (0,1) N 分布, 则称统计量
2
1 n
i i U X = = å 为服从自由度为n 的 2 c 分布, 记为 2 ~().
U n c ⑵ 2 () n c 分布的概率密度 2 () n c 分布的概率密度为
1 2
2 2 1
,0; ()2 2 0,0. n x
n
x e x n f x x -- ì > ï ï æö =G í ç÷
èø ï ï £ î
其中 1 0
()d x x e x a a +¥
-- G = ò 为G 函数.
() f x 的图形如下所示,其形状与n 有关(如图41所示).
() f x 的表达不简洁,直接用它计算概率较困难,为方便计,根据
22 {()()}(01)
P n n a c c a a >=<< 造成 2 c 分布表供查阅.
⑶ 2 () n c 分布的上a 分位数 设 2 ~(), U n c 对于给定的正数a (01 a << ), 称满足条件
{}()d P U f y y l
l a
+¥
>== ò 的数l 为 2 () n c 分布的上a 分位数,记为 2
(). n
a l c = 它与自由度n 及a 有关. ⑷ 2 () n c 的性质
① 2 c 分布与G 分布的关系 设随机变量X 的密度函数为
1 (),0; () () 0,0. x X x e x f x x a b b
b a -- ì > ï
G = í ï £ î
则称X 服从参数为(,) a b 的G 分布, 记作
~(,).
X a b G 因此, 2 1 (),, 22 n n c æö =G ç÷ èø 特别地, 2 11 (1),.
22 c æö
=G ç÷ èø
2
() n
a c O
()
f x 2
()
() n f x dx a c a
+¥
= ò
x
a
图 41
② 2 () n c 的数字特征
若 2 (), U n c : 则 ();()2. E U n D U n == ③ 2 () n c 的再生性
设 22 (),(), X m Y n c c :: 且X 与Y 相互独立,则
2 ().
Z X Y m n c =++ : 这是 2 () n c 分布对参数 n 具有可加性.一般地,设 12 ,,, k Y Y Y L 相互独 立, 2 (),1,2,,, i i Y n i k c = :L 则
2
11 . k
k i i i i Y n c == æö
ç÷ èø
åå : 注 设 12 ,,, n X X X L 相互独立,且都服从正态分布 2 (,) N m s ,则统计量
2 2
2 2
1 ()
(). n
i i X n m c c s = - = å : ④查表计算 2 () n c 的分位数
对于 0.005,0.01,0.025,0.05,0.01,0.25, a = 当 45 n £ 时可直接查 2 () n c 分布表得
2
(), n
a c 即满足 22
{()()} P n n a c c a
>= 的数;当 45 n > 时,由 2 2() n c 近似服从 (21,1) N n - 可以查正态分布表求出 , u a 然 后有
22 1
()(21). 2
n u n a a c »
++ 2. t 分布
⑴ 定义 设 2 (0,1),(), X N Y n c :: 且X 与Y 相互独立,则称统计量
X
T Y n
=
为服从自由度为n 的t (student )分布,记为 ().
T t n : ⑵ () t n 分布的概率密度 () t n 分布的概率密度为