统计三大分布 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

根据独立随机变量商的密度公式(3-32)，
可以证明（过程从略）：(6-13)中的
Tn
概率密度函数为
根据独立随机变量商的密度公式(3-32)，可
以证明（过程从略）：(6-13)中 Tn 的概率
密度函数为
, x . fn(x)
Γ(
n1 2
)
n
Γ(
n 2
)
1
x2 n
n1 2
(6-14)
另外，t -分布具有以下性质：
变量不小于该数的概率为 . 比如，若记 2-
变量
2 n
的
-上侧分位数为，则满足（见图
6.2）.
fn (x)
2 (n)
x
图 6.2
对不太大的n，如
n
60，可用附表3查
2
(n)
的
值，而对较大的n，则可用（6-11）近似计
算
2 (n) n 2n U , (6-12)
其中U 是标准正态分布N(0,1)的 -上侧分位
数，可通过附表2查出.
二、t -分布
定则自义称由6.2度T为设n nX的Y~XtN/ -n(0分,1)布，Y，(6~记-123作()n)所，Tn 服X~ t与从(n)Y的.独t分-立分布，布是
也称为学生分布，是英国统计学家戈塞特（Goset，1876-1937）在1908年“Student”
的笔名首次发表的，这个分布在数理统计中也占有重要的地位.
，则
顺便指出，自由度为1的t -分布也称为柯西
（Cauchy）分布，它以其数学期望和方差
均不存在而闻名（见例4.3）.
记t -分布t(n) 的 -上侧分位数为t (n)，附表4
给出了不同n和所对应的t (n) 数值. 另外，
由性质（1）知，对较大的n（比如 n 60）
，可用下式近似
.
t (n) U (6-15)
(x)
2
n 2
1 Γ(
n 2
)
x
e n 1 x
2
2
,
x0
，（6-9）
0,
x0
其中Γ(x)是Γ -函数，定义见第四章附录2．图
6.1是 2-变量的概率密度函数(6-9)在几种不
同参数下的图像.
特别地，当
n
2
时，
2 2
服从参数
1 2
的指数
分布. 此外， 2 -分布具有以下性质：
（1）数字特征.
若
2 n
~
2 (n)
，则
E
2 n
n
，D
2 n
2n
.
（2）可加性. 若X1 ~ 2(n1) X2 ~ 2(n2) 且 X 1与X 2 独立，则 .X1 X2 ~ 2(n1 n2) (6-10)
为便于今后的应用，现在我们引入上侧分
位数的概念. 所谓一个分布的 -上侧分位数
就是指这样一个数，它使相应分布的随机
,
0,
x 0,
x0
(6-17)
图6.4是四组不同参数下该密度函数的图像.
1.0
n1 20, n2 10
0.8
n1 5, n2 10
0.6
n1 5, n2 5
0.4
n1 1, n2 5
0.2
0.0
0
1
2
3
4
5x
图 6.4 F 分布的概率密度函数
另外，由定义6.3，立即有以下结论：
若这分F个~位结F(n数论1,n2可)F，用(则n于1, nF1计2 )~. 算具F(n分体2,n1布地) 说F1.~，F(我n2,n们1)的有 -上侧
了的值. 这就是统计学中所谓的“重尾” （Heavy Trails）现象.
0.4 f n ( x)
0.3
N(0,1) n = 10 n=5 n=2 n=1
0.2
0.1
0-3
-2
-1
0
1
2 x3
图 6.3 t-分布的概率密度函数
（2）（数字ET特n 征0, ）DT若n Tnnn~2
t .
(n)
，n
2
§6.2 三大统计分布
本节介绍数理统计中的三个著名分布，
它们在参数估计和假设检验等统计推断问题中有广泛应用.
一、X平方-分布
定义6.1 分布 N
设随机变量X1
(0,1)，则称
2 n
,
X
n
2
, ,
X
2 i
Xn
独立且服从相同
X
2 1
X
2 2
X
2 n
(6-8)
所服从的分布是自由i1度为n的 2 -分布，
n （1）（近似标准正态）当
时，fn(x) (x)
1
x2
e2
2
这就是说，当n充分大时，t -分布t(n)近似于
标准正态分布 N(0,1) ，但如果n较小，这两
个分布的差别还是比较大的，见图6.3，
其中粗虚线是 N(0,1) 的密度函数 (x) . 我们
看到，所有的t -分布密度函数值在 x 0附近均未超过的值，而在两边的尾部均超过(x)
三、F -分布
定义6.3 设 X ~ 2 (n1), Y ~ 2 (n2 )且X与Y独立，则称
(6-16) F X / n1
所服从的分布Y /是n2自由度为 (n1, n2 ) 的F-分布，
记作F ~ F(n1,n2) ，这是为纪念英国著名统计学家费歇（R.A. Fisher，1890-1962）而命名的．F-分布也是数理统计的一个重要分布.
对较小的（如0.1、0.05、0.025等），F (n1,n2 )
的数值可由附表5查得. 但附表5并未给出较大时的数值，此时，可用公式(6-18)求出
F (n1, n2 ) .
记为
2 n
~ 2 (n) ，称
为 2
n
2-变量.
为纪念英国著
名统计学家皮尔（K.Pearson，1857-1936）
- 2分布也称为皮尔逊 2 -分布. 这是数理统计中一个十分重要的概率分布.
根据独立随机变量和的密度公式(3-27)和数学
归纳法，可以证明： 2(n)-分布的概率密度函
数为（详见[5]） fn
注意到(6-16)的商结构，则根据随机变量商的
密度计算公式（3-34）可求得F-分布 F(n1,n2 )
的概率密度函数为（过程从略，详见[3, 4]）
f n1,n2 (x)
ห้องสมุดไป่ตู้
Γ(
Γ(
n1 2
n1 n2 2
)Γ(
)
n2 2
)
n1 n2
n1 n2
n1 1
2 x 1
n1 n2
x
n1 n2 2
.
F (n1 , n2 )
1 F1a (n2 , n1 )
事侧实分上位，数由的F定~义F(可n1推, n2出)、
1 F
(6-18)
~ F (n2 , n1 )
以及上
P F
1
F1
(n2
,
n1
)
P
1 F
F1
(n2
,
n1
)
1 P
1 F
F1
(n2
,
n1
)
1 (1)
故(6-18)式成立.