三大抽样分布及常用统计量的分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
( n )
2 的点 (n)为 2 (n)分布的上侧 分位点。
其几何意义见图5-5所示.
f(x )
其中f(x)是 2分布的概率密度。
显然,在自由度n取定以后, O 图5-5
2
(n) x
(n) 的值只与 有关。
2
例如:当 n = 21,
2 0.05
= 0.05 时,由附表3可查得,
2
~ 2 ( n2 1)
2 且S12与S 2 相互独立,由 2分布的性质知
( n1 1) S12
2
2 ( n2 1) S 2
2
~ 2 ( n1 n2 2)
再由定义3知 X Y ( 1 2 ) T ~t (n1 n 2 2) 1 1 Sn n1 n2
t分布的密度函数的图象相似于标准正态分布的密度
函数。当n较大时, t 分布近似于标准正态分布。
F分布
定义5.5 设随机变量X~ 2(n1)、Y~ 2(n2),且 X 与
X n1 Y 相互独立,则称随机变量 F Y n2
记作
服从第一自由度为n1,第二自由度为n2的F分布,
F~F(n1,n2).
n=1 n=4 n=10
图5-4
其图形随自由度 n 的不同而有所改变. x
0 1 3 5 7 9 11 13 15 17
性质1: 2分布的数学期望与方差
设 X ~ n ,则E( X ) = n,D( X ) = 2n.
2
性质2: 2分布的可加性
设 X1 ~ (n1), X 2 ~ (n2), 且 X1 , X 2 相互独立,
2 1 n X X i ~ N , n i 1 n
2 —分布
定义 设总体 X ~ N 0,1 , X1, X 2 ,..., X n 是 X
2 2 的一个样本, 则称统计量 2 X12 X 2 服从自 X n
2 2 2 由度为 n 的 分布,记作 ~ (n) .
( n 1) 2 t 2 f(t) (1 ) n n ( n) 2
n1 2
,
( t )
定理4
设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则统计量
X T ~t (n 1) S/ n 证: 由于 X 与S 2相互独立,且 2 X ( n 1) S 2 U ~ N(0,1), ~ (n 1) 2 n
由定义3得
X n X T ~ t(n 1) 2 S n (n 1)S (n 1) 2
定理5
分别是来自正态总体N(1 ,2) 和 N(2 ,2)的样本, 且它们相互独立,则统计量
设(X1,X2,…,Xn1) 和 (Y1,Y2,…,Yn2)
X Y (1 2) T ~ t(n1 n2 2) Sn 1 1 n1 n2
其中Sn
(5.10)
2 (n1 1)S1
2 2 S1、S2 分别为两总体的样本方差。
n1 n2 2
2 (n2 1)S2
,
证明:由例知 ( n1 1) S12
X Y ( 1 2 )
2
n1
2
~N (0,1)
2
~ 2 ( n1 1),
n2 2 ( n2 1) S 2
第四节 三大抽样分布及常用统计量的分布
数理统计中常用的分布除正态分布外,还有 三个非常有用的连续型分布,即
2分布
t 分布
F分布
数理统计的三大分布(都是连续型). 它们都与正态分布有密切的联系.
在本章中特别要求掌握对正态分布、 2 分布、
t 分布、F 分布的一些结论的熟练运用。
三大抽样分布是后面各章的基础。
(X X ) X nX =0
i 1
的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1
项是独立的.所以(4.1)式的自由度是n-1.
定理3:
设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则 2相互独立; (1) 样本均值 X 与样本方差 S n
对于给定的 (0< <1),称满足条件 P T t(n) f(t)dt t (n)
t 分布的上侧分位点
பைடு நூலகம்
的点t(n)为 t 分布的上分位点。 其几何意义见图5-7.
f(t)
O 图5-7
t(n) t
t 分布的双侧分位点
由于t分布的对称性,称满足条件
P T t 2(n)
从表面上看,
n
2 i 1 i
(n 1)S 2
2
(X X )
i 1 i
2
2
~ (n 1)
2
(4.1)
(X X ) 是n个正态随机变量 Xi X 的平方和,
n i i 1 i
但实际上它们不是独立的,它们之间有一种线性约束关系:
这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下
(n1) n1 ~ F n1, n2 2 (n2) n2
2
例1 设总体X~N(0,1), X1,X2,…,Xn为简单 随机样本,试问下列统计量各服从什么分布? 3
自由度是指独立随机变量的个数, df
n
n 个相互独立的标准正态分布之平方和服从自由度
为 n 的 分布。
2
t— 分布
定义5.4
Y ~ 2(n) ,且 X 设随机变量 Y ~N(0, 1),
Y n
与 Y 相互独立,则称统计量 T X
服从自由度为n的t分布或学生分布,记作 T~t(n).
N 0,1 ~ t(n) 2 (n) n
2
(21) 32.67,即 P (21) 32.67 0.05.
二、 t 分布
定义3: 设随机变量X~N(0,1),Y~ 2(n) ,且
X与Y相互独立,则称统计量 T X Y n
服从自由度为 n 的 t 分布, 记作 T~t(n). t分布的概率密度函数为
其图象如图 5-6 所示,其形状类似于标准正态分布 的概率密度函数的图象。 当 n 较大时, t 分布近似于标准正态分布。
(2)
(n 1)S 2
2
(X X )
i 1 i
2
2
~ (n 1)
2
(4.1)
与以下补充性质的结论比较: 性质 设(X1,X2,…,Xn)为取自正态总体
X~N( , 2)的样本,则
(X i ) i 1
n
2
2
~ (n)
2
2分布的上侧分位点
定义2:设 X ~ (n), 对于给定的正数(0 1 )称 , 满足条件 2 P X (n) 2 f ( x)dx
Xi i 1
2 n
2
(X i ) i 1
n
2
2
~ (n).
2
定理3 :
设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则 2相互独立; (1) 样本均值 X 与样本方差 S n (2)
(4.1)式的自由度为什么是 n- 1 ? n
定义5.5
与相互独立,则称随机变量 F
X n1 Y n2 服从第一自由度为n1,第二自由度为n2的F分布,
记作
三、F分布 设随机变量X~ 2(n1)、Y~ 2(n2),且
F~F(n1,n2),
其概率密度函数为:
n1 n1 n2 1 Ay 2 (1 n1 y) 2 , y 0 f(y) n2 y0 0, n1 n2 ( ) n n1 2 其中 A ( 1 ) 2 , 其图形见图5-9 (P108)。 n1 n2 n2 ( )( ) 2 2
定理1 设(X1,X2,…,Xn)为取自正态总体X~N( , 2)
的样本,则
(X i ) i 1
n
2
2
~ (n)
2
证明: 由已知,有
Xi X i 则 ~ N(0, 1) ,且各 相互独立,
由定义1 :得
Xi ~ N( , 2)且X1,X2,…,Xn相互独立,
2 2
则
X1 X 2 ~ 2(n1 n2)
性质3:设 X ~ n , 则对任意实数 x 有 t2 x 1 X n 2 lim P x e dt n 2 2n
2
这个性质说明当 n 很大时,自由度为 n 的 2分布趋 于正态分布N (n, 2n) .
其中f (y)是F分布的概率密度。 O 图5-7
F(n1, n2) x
F 分布的上侧分位点 F(n1, n2)的值可由F 分布表查得. 附表5、6、7(P258~P266 )分 =0.1、 =0.05、 =0.01给出了F分布的上分位数.
查表时应先找到相应的 值的表.
当时n1=2, n2=18时,有 F
2 称统计量 X X X 服从自由度为 n 的 分 2 2 布,记作 ~ (n).
2 2 1 2 2 2 n
其中(t )
0
xt 1e x dx(t 0)为函数。
注:自由度是指独立随机变量的个数,df
2
n
n 分布密度函数的图形
f(y)
0.5 0.4 0.3 0.2 0.1
其几何意义如图5-8所示.
(5.12)
f(t)
的数t/2(n)为t分布的双侧分位点。
/2 - t/2(n)
/2
O t/2(n) 图5-8
t
在附表4 (P256)中给出了t分布的临界值表。
例如,当n=15,=0.05时,查t分布表得,
t0.05(15) =1.753 , t0.05/2(15) = 2.131 其中t0.05/2(15)可由P{t(15) ≥ t0.025(15)}=0.025查得。 但当n>45时,如无详细表格可查,可以用标准 正态分布代替t分布查t(n)的值. 即 当 n>45时, t(n) u 一般的t分布临界值表中,详列至n=30,当 n>30就用标准正态分布N(0, 1)来近似.
0.01(2,
18)= 6.01
在附表5、6、7中所列的值都比较小,当 较大 时,可用下面公式 F1(n1, n2)
1 F(n2, n1) 1 1 例如, F0.99(18, 2) ≈0.166 F0.01(2,18) 6.01
量和样本方差; 且两个样本相互独立,则统计量
2 2 定理5.4 设 n1, S1 为正态总体 N( 1, 1 ) 的样本容 2 2 量和样本方差;n2, S2 为正态总体 N( 2 , 2 )的样本容
S S
证明 由已知条件知
2 (n1 1)S1 2 1
2
2 1 2 1
2 2 2 2
~ F(n1 1, n2 1)
2 (n2 1)S2 2 2
~ (n1 1),
(n1 1) (n2 1)
2 S1 2 1
~ (n2 1)
2
且相互独立,由F分布的定义有
性质:若X~F(n1,n2),则 1 ~F(n2,n1)。
X
一、F分布的上侧分位点 对于给定的 (0< <1),称满足条件
P F(n1, n2) F(n1, n2)
F (n1, n2)
f(y)dy
的数F (n1,n2)为F分布的上侧分位点。
其几何意义如图5-7所示。 f (y)
2 (n1 1)S1 2 1 2 (n2 1)S2 2 2
2 S2 2 2
~ F(n1 1, n2 1)
U—分布 正态总体样本均值的分布
设总体 X ~ N ,
2
, X , X ,..., X 是 X 的一
1 2 n
个样本, 则样本均值服从正态分布
1 n Xi X n i 1 U ~ N 0,1 n n
2(卡方) — 分布
定义1: 设总体 X ~ N 0, 1 , X1, X 2 , ... , X n 是 X 的
2 2 2 2 X X X 一个样本,则统计量 1 2 n
的概率密度函数为
n x 1 1 x 2 e 2 x 0 n f ( x ) 2 2 ( n ) 2 x0 0
( n )
2 的点 (n)为 2 (n)分布的上侧 分位点。
其几何意义见图5-5所示.
f(x )
其中f(x)是 2分布的概率密度。
显然,在自由度n取定以后, O 图5-5
2
(n) x
(n) 的值只与 有关。
2
例如:当 n = 21,
2 0.05
= 0.05 时,由附表3可查得,
2
~ 2 ( n2 1)
2 且S12与S 2 相互独立,由 2分布的性质知
( n1 1) S12
2
2 ( n2 1) S 2
2
~ 2 ( n1 n2 2)
再由定义3知 X Y ( 1 2 ) T ~t (n1 n 2 2) 1 1 Sn n1 n2
t分布的密度函数的图象相似于标准正态分布的密度
函数。当n较大时, t 分布近似于标准正态分布。
F分布
定义5.5 设随机变量X~ 2(n1)、Y~ 2(n2),且 X 与
X n1 Y 相互独立,则称随机变量 F Y n2
记作
服从第一自由度为n1,第二自由度为n2的F分布,
F~F(n1,n2).
n=1 n=4 n=10
图5-4
其图形随自由度 n 的不同而有所改变. x
0 1 3 5 7 9 11 13 15 17
性质1: 2分布的数学期望与方差
设 X ~ n ,则E( X ) = n,D( X ) = 2n.
2
性质2: 2分布的可加性
设 X1 ~ (n1), X 2 ~ (n2), 且 X1 , X 2 相互独立,
2 1 n X X i ~ N , n i 1 n
2 —分布
定义 设总体 X ~ N 0,1 , X1, X 2 ,..., X n 是 X
2 2 的一个样本, 则称统计量 2 X12 X 2 服从自 X n
2 2 2 由度为 n 的 分布,记作 ~ (n) .
( n 1) 2 t 2 f(t) (1 ) n n ( n) 2
n1 2
,
( t )
定理4
设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则统计量
X T ~t (n 1) S/ n 证: 由于 X 与S 2相互独立,且 2 X ( n 1) S 2 U ~ N(0,1), ~ (n 1) 2 n
由定义3得
X n X T ~ t(n 1) 2 S n (n 1)S (n 1) 2
定理5
分别是来自正态总体N(1 ,2) 和 N(2 ,2)的样本, 且它们相互独立,则统计量
设(X1,X2,…,Xn1) 和 (Y1,Y2,…,Yn2)
X Y (1 2) T ~ t(n1 n2 2) Sn 1 1 n1 n2
其中Sn
(5.10)
2 (n1 1)S1
2 2 S1、S2 分别为两总体的样本方差。
n1 n2 2
2 (n2 1)S2
,
证明:由例知 ( n1 1) S12
X Y ( 1 2 )
2
n1
2
~N (0,1)
2
~ 2 ( n1 1),
n2 2 ( n2 1) S 2
第四节 三大抽样分布及常用统计量的分布
数理统计中常用的分布除正态分布外,还有 三个非常有用的连续型分布,即
2分布
t 分布
F分布
数理统计的三大分布(都是连续型). 它们都与正态分布有密切的联系.
在本章中特别要求掌握对正态分布、 2 分布、
t 分布、F 分布的一些结论的熟练运用。
三大抽样分布是后面各章的基础。
(X X ) X nX =0
i 1
的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1
项是独立的.所以(4.1)式的自由度是n-1.
定理3:
设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则 2相互独立; (1) 样本均值 X 与样本方差 S n
对于给定的 (0< <1),称满足条件 P T t(n) f(t)dt t (n)
t 分布的上侧分位点
பைடு நூலகம்
的点t(n)为 t 分布的上分位点。 其几何意义见图5-7.
f(t)
O 图5-7
t(n) t
t 分布的双侧分位点
由于t分布的对称性,称满足条件
P T t 2(n)
从表面上看,
n
2 i 1 i
(n 1)S 2
2
(X X )
i 1 i
2
2
~ (n 1)
2
(4.1)
(X X ) 是n个正态随机变量 Xi X 的平方和,
n i i 1 i
但实际上它们不是独立的,它们之间有一种线性约束关系:
这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下
(n1) n1 ~ F n1, n2 2 (n2) n2
2
例1 设总体X~N(0,1), X1,X2,…,Xn为简单 随机样本,试问下列统计量各服从什么分布? 3
自由度是指独立随机变量的个数, df
n
n 个相互独立的标准正态分布之平方和服从自由度
为 n 的 分布。
2
t— 分布
定义5.4
Y ~ 2(n) ,且 X 设随机变量 Y ~N(0, 1),
Y n
与 Y 相互独立,则称统计量 T X
服从自由度为n的t分布或学生分布,记作 T~t(n).
N 0,1 ~ t(n) 2 (n) n
2
(21) 32.67,即 P (21) 32.67 0.05.
二、 t 分布
定义3: 设随机变量X~N(0,1),Y~ 2(n) ,且
X与Y相互独立,则称统计量 T X Y n
服从自由度为 n 的 t 分布, 记作 T~t(n). t分布的概率密度函数为
其图象如图 5-6 所示,其形状类似于标准正态分布 的概率密度函数的图象。 当 n 较大时, t 分布近似于标准正态分布。
(2)
(n 1)S 2
2
(X X )
i 1 i
2
2
~ (n 1)
2
(4.1)
与以下补充性质的结论比较: 性质 设(X1,X2,…,Xn)为取自正态总体
X~N( , 2)的样本,则
(X i ) i 1
n
2
2
~ (n)
2
2分布的上侧分位点
定义2:设 X ~ (n), 对于给定的正数(0 1 )称 , 满足条件 2 P X (n) 2 f ( x)dx
Xi i 1
2 n
2
(X i ) i 1
n
2
2
~ (n).
2
定理3 :
设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则 2相互独立; (1) 样本均值 X 与样本方差 S n (2)
(4.1)式的自由度为什么是 n- 1 ? n
定义5.5
与相互独立,则称随机变量 F
X n1 Y n2 服从第一自由度为n1,第二自由度为n2的F分布,
记作
三、F分布 设随机变量X~ 2(n1)、Y~ 2(n2),且
F~F(n1,n2),
其概率密度函数为:
n1 n1 n2 1 Ay 2 (1 n1 y) 2 , y 0 f(y) n2 y0 0, n1 n2 ( ) n n1 2 其中 A ( 1 ) 2 , 其图形见图5-9 (P108)。 n1 n2 n2 ( )( ) 2 2
定理1 设(X1,X2,…,Xn)为取自正态总体X~N( , 2)
的样本,则
(X i ) i 1
n
2
2
~ (n)
2
证明: 由已知,有
Xi X i 则 ~ N(0, 1) ,且各 相互独立,
由定义1 :得
Xi ~ N( , 2)且X1,X2,…,Xn相互独立,
2 2
则
X1 X 2 ~ 2(n1 n2)
性质3:设 X ~ n , 则对任意实数 x 有 t2 x 1 X n 2 lim P x e dt n 2 2n
2
这个性质说明当 n 很大时,自由度为 n 的 2分布趋 于正态分布N (n, 2n) .
其中f (y)是F分布的概率密度。 O 图5-7
F(n1, n2) x
F 分布的上侧分位点 F(n1, n2)的值可由F 分布表查得. 附表5、6、7(P258~P266 )分 =0.1、 =0.05、 =0.01给出了F分布的上分位数.
查表时应先找到相应的 值的表.
当时n1=2, n2=18时,有 F
2 称统计量 X X X 服从自由度为 n 的 分 2 2 布,记作 ~ (n).
2 2 1 2 2 2 n
其中(t )
0
xt 1e x dx(t 0)为函数。
注:自由度是指独立随机变量的个数,df
2
n
n 分布密度函数的图形
f(y)
0.5 0.4 0.3 0.2 0.1
其几何意义如图5-8所示.
(5.12)
f(t)
的数t/2(n)为t分布的双侧分位点。
/2 - t/2(n)
/2
O t/2(n) 图5-8
t
在附表4 (P256)中给出了t分布的临界值表。
例如,当n=15,=0.05时,查t分布表得,
t0.05(15) =1.753 , t0.05/2(15) = 2.131 其中t0.05/2(15)可由P{t(15) ≥ t0.025(15)}=0.025查得。 但当n>45时,如无详细表格可查,可以用标准 正态分布代替t分布查t(n)的值. 即 当 n>45时, t(n) u 一般的t分布临界值表中,详列至n=30,当 n>30就用标准正态分布N(0, 1)来近似.
0.01(2,
18)= 6.01
在附表5、6、7中所列的值都比较小,当 较大 时,可用下面公式 F1(n1, n2)
1 F(n2, n1) 1 1 例如, F0.99(18, 2) ≈0.166 F0.01(2,18) 6.01
量和样本方差; 且两个样本相互独立,则统计量
2 2 定理5.4 设 n1, S1 为正态总体 N( 1, 1 ) 的样本容 2 2 量和样本方差;n2, S2 为正态总体 N( 2 , 2 )的样本容
S S
证明 由已知条件知
2 (n1 1)S1 2 1
2
2 1 2 1
2 2 2 2
~ F(n1 1, n2 1)
2 (n2 1)S2 2 2
~ (n1 1),
(n1 1) (n2 1)
2 S1 2 1
~ (n2 1)
2
且相互独立,由F分布的定义有
性质:若X~F(n1,n2),则 1 ~F(n2,n1)。
X
一、F分布的上侧分位点 对于给定的 (0< <1),称满足条件
P F(n1, n2) F(n1, n2)
F (n1, n2)
f(y)dy
的数F (n1,n2)为F分布的上侧分位点。
其几何意义如图5-7所示。 f (y)
2 (n1 1)S1 2 1 2 (n2 1)S2 2 2
2 S2 2 2
~ F(n1 1, n2 1)
U—分布 正态总体样本均值的分布
设总体 X ~ N ,
2
, X , X ,..., X 是 X 的一
1 2 n
个样本, 则样本均值服从正态分布
1 n Xi X n i 1 U ~ N 0,1 n n
2(卡方) — 分布
定义1: 设总体 X ~ N 0, 1 , X1, X 2 , ... , X n 是 X 的
2 2 2 2 X X X 一个样本,则统计量 1 2 n
的概率密度函数为
n x 1 1 x 2 e 2 x 0 n f ( x ) 2 2 ( n ) 2 x0 0