统计三大分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
若
2 n
~
2 (n)
,则
E
2 n
n
,D
2 n
2n
.
(2)可加性. 若X1 ~ 2(n1) X2 ~ 2(n2) 且 X 1与X 2 独立,则 .X1 X2 ~ 2(n1 n2) (6-10)
为便于今后的应用,现在我们引入上侧分
位数的概念. 所谓一个分布的 -上侧分位数
就是指这样一个数,它使相应分布的随机
,
0,
x 0,
x0
(6-17)
图6.4是四组不同参数下该密度函数的图像.
1.0
n1 20, n2 10
0.8
n1 5, n2 10
0.6
n1 5, n2 5
0.4
n1 1, n2 5
0.2
0.0
0
1
2
3
4
5x
图 6.4 F 分布的概率密度函数
另外,由定义6.3,立即有以下结论:
若 这分F个~位结F(n数论1,n2可)F,用(则n于1, nF1计2 )~. 算具F(n分体2,n1布地) 说F1.~,F(我n2,n们1)的有 -上侧
n (1)(近似标准正态) 当
时,fn(x) (x)
1
x2
e2
2
这就是说,当n充分大时,t -分布t(n)近似于
标准正态分布 N(0,1) ,但如果n较小,这两
个分布的差别还是比较大的,见图6.3,
其中粗虚线是 N(0,1) 的密度函数 (x) . 我们
看到,所有的t -分布密度函数值在 x 0附近 均未超过的值,而在两边的尾部均超过(x)
.
F (n1 , n2 )
1 F1a (n2 , n1 )
事侧实分上位,数由的F定~义F(可n1推, n2出)、
1 F
(6-18)
~ F (n2 , n1 )
以及上
P F
1
F1
(n2
,
n1
)
P
1 F
F1
(n2
,
n1
)
1 P
1 F
F1
(n2
,
n1
)
1 (1)
故(6-18)式成立.
三、F -分布
定义6.3 设 X ~ 2 (n1), Y ~ 2 (n2 )且X与Y独立,则称
(6-16) F X / n1
所服从的分布Y /是n2自由度为 (n1, n2 ) 的F-分布,
记作F ~ F(n1,n2) ,这是为纪念英国著名统计学家费歇 (R.A. Fisher,1890-1962)而命名的.F-分布也 是数理统计的一个重要分布.
根据独立随机变量商的密度公式(3-32),
可以证明(过程从略):(6-13)中的
Tn
概率密度函数为
根据独立随机变量商的密度公式(3-32),可
以证明(过程从略):(6-13)中 Tn 的概率
密度函数为
, x . fn(x)
Γ(
n1 2
)
n
Γ(
n 2
)
1
x2 n
n1 2
(6-14)
另外,t -分布具有以下性质:
注意到(6-16)的商结构,则根据随机变量商的
密度计算公式(3-34)可求得F-分布 F(n1,n2 )
的概率密度函数为(过程从略,详见[3, 4])
f n1,n2 (x)
Γ(
Γ(
n1 2
n1 n2 2
)Γ(
)
n2 2
)
Baidu Nhomakorabea
n1 n2
n1 n2
n1 1
2 x 1
n1 n2
x
n1 n2 2
对较小的 (如0.1、0.05、0.025等),F (n1,n2 )
的数值可由附表5查得. 但附表5并未给出较 大时的数值,此时,可用公式(6-18)求出
F (n1, n2 ) .
了的值. 这就是统计学中所谓的“重尾” (Heavy Trails)现象.
0.4 f n ( x)
0.3
N(0,1) n = 10 n=5 n=2 n=1
0.2
0.1
0-3
-2
-1
0
1
2 x3
图 6.3 t-分布的概率密度函数
(2)(数字ET特n 征0, )DT若n Tnnn~2
t .
(n)
,n
2
(x)
2
n 2
1 Γ(
n 2
)
x
e n 1 x
2
2
,
x0
,(6-9)
0,
x0
其中Γ(x)是Γ -函数,定义见第四章附录2. 图
6.1是 2-变量的概率密度函数(6-9)在几种不
同参数下的图像.
特别地,当
n
2
时,
2 2
服从参数
1 2
的指数
分布. 此外, 2 -分布具有以下性质:
(1)数字特征.
变量不小于该数的概率为 . 比如,若记 2-
变量
2 n
的
-上侧分位数为,则满足(见图
6.2).
fn (x)
2 (n)
x
图 6.2
对不太大的n,如
n
60,可用附表3查
2
(n)
的
值,而对较大的n,则可用(6-11)近似计
算
2 (n) n 2n U , (6-12)
其中U 是标准正态分布N(0,1)的 -上侧分位
数,可通过附表2查出.
二、t -分布
定则 自义称由6.2度T为设n nX的Y~XtN/ -n(0分,1)布,Y,(6~记-123作()n)所,Tn 服X~ t与从(n)Y的.独t分-立分布,布是
也称为学生分布,是英国统计学家戈塞特 (Goset,1876-1937)在1908年“Student”
的笔名首次发表的,这个分布在数理统计 中也占有重要的地位.
记为
2 n
~ 2 (n) ,称
为 2
n
2-变量.
为纪念英国著
名统计学家皮尔(K.Pearson,1857-1936)
- 2分布也称为皮尔逊 2 -分布. 这是数理统计中 一个十分重要的概率分布.
根据独立随机变量和的密度公式(3-27)和数学
归纳法,可以证明: 2(n)-分布的概率密度函
数为(详见[5]) fn
§6.2 三大统计分布
本节介绍数理统计中的三个著名分布,
它们在参数估计和假设检验等统计推断问 题中有广泛应用.
一、X平方-分布
定义6.1 分布 N
设随机变量X1
(0,1),则称
2 n
,
X
n
2
, ,
X
2 i
Xn
独立且服从相同
X
2 1
X
2 2
X
2 n
(6-8)
所服从的分布是自由i1度为n的 2 -分布,
,则
顺便指出,自由度为1的t -分布也称为柯西
(Cauchy)分布,它以其数学期望和方差
均不存在而闻名(见例4.3).
记t -分布t(n) 的 -上侧分位数为t (n),附表4
给出了不同n和 所对应的t (n) 数值. 另外,
由性质(1)知,对较大的n(比如 n 60)
,可用下式近似
.
t (n) U (6-15)