第2节正态总体下的抽样分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

U—分布 正态总体样本均值的分布
设总体 X ~ N , 2 , X1, X 2 ,..., X n 是 X 的一 个样本, 则样本均值服从正态分布


2 1 n X X i ~ N , n i 1 n
1 n Xi X n i 1 U ~ N 0,1 n n
性质:若X~F(n1,n2),则 1 ~F(n2,n1).
F 分布的上分位数 对于给定的 (0< <1),称满足条件
P F(n1, n2) F(n1, n2)
其几何意义如图5-7所示.
F (n1, n2)
X
f(y)dy
的数F(n1,n2)为F分布的上分位数或上侧临界值,
X n X T ~ t(n 1) 2 S n (n 1)S (n 1) 2
设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则统计量
由定义得

定理
别是来自正态总体N(1 ,2)和N(2 ,2)的样本,且 它们相互独立,则统计量
设(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2) 分
n>30就用标准正态分布N(0, 1)来近似.
四、F分布
定义 设随机变量X~ 2(n1)、Y~ 2(n2),且 与相互独立,则称随机变量
服从第一自由度为n1,第二自由度为n2的F分布, 记作
X n1 F Y n2
F~F(n1,n2).
概率密度函数
n n 1 2 n1 1 Ay 2 (1 n1 y) 2 , y 0 f(y) n2 y0 0, n1 n2 ( ) n n1 2 其中 A ( 1 ) 2 , 其图形见图5-6.(P124) n1 n2 n2 ( )( ) 2 2
差异.且P{|T|≥t0}≥P{|X|≥t0},其中X ~N(0,1),即在t分 布的尾部比在标准正态分布的尾部有着更大的概率.
t 分布的数学期望与方差(补充)
n . (n 2) 设T~t (n),则E(T)=0,D(T)= n2
定理

X T ~ t(n 1) (5.9) S n 由于 X 与S 2相互独立,且 2 (n 1)S X 2 ~ (n 1) U ~ N(0,1), 2 n
2 2 1 (n)为 2分布的上1 2
f(x)

2
O
2

2

2

2
2 1 (n) 分位数. 2
2(n) x
如当n=8, =0.05时,
2 1 (n) 2
2 0.975(8) 2.18
2 (n) 2
2 0.025(8) 17.54
2分布的数学期望与方差
n1 2, ( Fra bibliotek )其图形如图5-4所示(P123), 其形状类似标准正态分布的概率密度的图形. 当n较大时, t分布近似于标准正态分布.
当n较大时, t分布近似于标准正态分布.
一般说来,当n>30时,t分布与标准正态分布N(0, 1)就非常接近.
但对较小的n值,t分布与标准正态分布之间有较大
——分布
2
定义
设总体 X ~ N 0,1 , X1, X 2 ,..., X n 是 X
2 2 的一个样本, 则称统计量 2 X12 X 2 X n 服从自
由度为n的 2 分布,记作 2 ~ 2 (n)
自由度是指独立随机变量的个数, df
n
(n) 分布的密度函数为
0 1 3 5 7 9 11 13 15 17
P (n) (n)
2 2
2分布表(附表5(P175) ).
2分布的上分位数
P (n) (n) 2 f(y)dy (n) 2 的数 (n)为 2分布的 f(y)
满足
2 2
u0.05/2=1.96,
u0.01/2=2.575
数理统计中常用的分布除正态分布外,还有 三个非常有用的连续型分布,即
数理统计的三大分布(都是连续型). t 分布 F分布 它们都与正态分布有密切的联系.
t分布、F分布的一些结论的熟练运用. 它们
是后面章节的基础.
2分布
在本章中特别要求掌握对正态分布、 2分布、
X~N( , 2)的样本,则
(X i ) i 1

2
n
2
~ (n)
2
设随机变量X~N(0,1),Y~ 2(n) ,且X与Y相互 独立,则称统计量
三、t分布
记作T 服从自由度为n的t分布(Student)分布, t分布的概率密度函数为
T X Y n
~t(n).
( n 1) 2 2 (1 t ) f(t) n n ( n) 2
例如,求u0.05/2,
反查标准正态分布表得到,
/2 - u /2
O
/2
u /2 x
P{U≥1.96}=0.05 /2 得u0.05/2=1.96
标准正态分布的分位数
在实际问题中, 常取0.1、0.05、0.01. 常用到下面几个临界值:
u0.05 =1.645,
u0.01 =2.326
2
1 y n 21e y 2 , y 0 2n 2 n 2 f ( y) 0, y0
(n 1) n!
2 (n)
f(y)
0.5 0.4 0.3 0.2 0.1
分布密度函数的图形
n=1 n=4 n=10 x 其图形随自由度的 不同而有所改变.
侧分位数或双侧临界值.
x x
x

f(x)dx
y
2
1 x
x
2
x1
2
双侧 分位数或双侧临界值的特例
当X的分布关于y轴对称时, 若存在 x 2 , 使
P{ X x 2} ,
则称 x
2
为X分布的双侧分位数或双侧临界值.
y
如图.
2
2
x 2 O
统计量 f ( X1 , X 2 ,..., X n ) 是样本 X1 , X 2 ,..., X n 的 不含任何未知数的函数,它是一个随机变量 统计量的分布称为抽样分布。 由于正态总体是最常见的总体,因此这里主要讨论 正态总体下的抽样分布. 由于这些抽样分布的论证要用到较多的数学知识, 故在本节中,我们主要给出有关结论,以供应用.
2
2分布的双侧分位数 2 2 2 2 把满足P (n) P (n) 2 1 2 2 2 2 的数 (n), (n) 称为 2分布的双侧分位数 1
2 2
或双侧临界值. 见图. 显然, 2 2分布的上 分位数. (n) 为

2
n
2
~ (n).
2
定理
设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则 (1) 样本均值 X 与样本方差S 2相互独立; n (2)
(2)式的自由度为什么是n-1? n
从表面上看,
n
2 i 1 i
(n 1)S 2
2
(X X )
i 1 i
2

2
~ (n 1)
2
(X X ) 是n个正态随机变量 Xi X 的平方和,
n i i 1 i
但实际上它们不是独立的,它们之间有一种线性约束关系:
(X X ) X nX =0
这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下 的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1
/2
O t/2(n)
t
在附表4 (P174)中给出了t分布的临界值表. 例如,当n=15,=0.05时,查t分布表得,
t0.05(15)=1.753 t0.05/2(15)= 2.131 其中t0.05/2(15)由P{t(15)≥t0.025(15)}=0.025查得.
但当n>45时,如无详细表格可查,可以用标准 正态分布代替t分布查t(n)的值. n>45. 即 t(n)≈u , 一般的t分布临界值表中,详列至n=30,当

O
u
x
所以, u0.05 =1.645.
对标准正态分布变量U~N(0, 1)和给定的, 称满足条件 的点u/2为标准正态分布的双侧分位数或双侧临界值. 如图.
U—分布的双侧分位数
P{|U|≥u/2} =
(x)
u/2可由P{U≥u/2}= /2 即 (u /2) =1- /2
i 1
项是独立的.所以(2)式的自由度是n-1.
定理
设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则 (1) 样本均值 X 与样本方差S 2相互独立; n
(2)
(n 1)S 2
2
(X X )
i 1 i
2

2
~ (n 1)
2
与以下补充性质的结论比较: 性质 设(X1,X2,…,Xn)为取自正态总体
t(n)
的数t(n)为t分布的上分位数或上侧临界值, 其几何意义见图.
f(t)

O
t(n) t
t 分布的双侧分位数
由于t分布的对称性,称满足条件
P T t 2(n)
其几何意义如图所示.


(5.12)
f(t)
的数t/2(n)为t分布的双侧分位数或双侧临界值,
/2 - t/2(n)
查表时应先找到相应的值的表.
0.01(2,
当时n1=2, n2=18时,有 F
18)= 6.01
在附表6中所列的值都比较小,当 较大 时,可用下面公式 F1(n1, n2)
上侧临界值. 如图.
概率分布的分位数(分位点) 定义 对总体X和给定的 (0<<1),若存在x, 使P{X≥x} =, 则称x为X分布的上侧分位数或
y
o
若存在数1、2,使
P{X≥x} =
2 P{X≥1}=P{X≤2} o 2 2 则称1、2为X分布的双
X Y (1 2) T ~ t(n1 n2 2) Sn 1 1 n1 n2
其中Sn
(5.10)

2 (n1 1)S1
2 2 S1、S2 分别为两总体的样本方差.
n1 n2 2

2 (n2 1)S2
,
t 分布的上分位数 对于给定的 (0< <1),称满足条件 P T t(n) f(t)dt
x 2 x
U—分布的上侧分位数
对标准正态分布变量U~N(0, 1)和给定的,上侧 t2 1 e 2 dt 分位数是由: P{U≥u} = u 2


P{U<u} =1- (u) =1-
(x)
确定的点u.
如图.
例如, =0.05,而
P{U≥1.645} =0.05
上分位数或上侧临界值, 其几何意义见图5-5所示.

其中f(y)是 2-分布的概率密度.
2
O
显然,在自由度n取定以后, (n)的值只与有关.
2 0.05(21) 32.67
图5-5
(n) x
2
例如,当n=21,=0.05时,由附表5(P175)可查得,
即 P
(21) 32.67 0.05.
的样本,则
(X i ) i 1

2
n
2
~ (n)
2
证明 由已知,有
Xi~N( , 2)且X1,X2,…,Xn相互独立,

Xi Xi 相互独立, ~ N(0,1)且各
n
由定义5.3得
Xi i 1
2
2
(X i ) i 1
f(y)
其中f(y)是F分布的概率密度.
O

F(n1, n2) x
F 分布的上分位数 F(n1, n2)的值可由F 分布表查得. 附表6(P177~P182)分 =0.1、 =0.05、 =0.01 =0.025 、 =0.005 、 =0.001 、给出了F分布的上
分位数.
设 2~ 2(n),则E( 2)=n,D( 2)=2n.
2分布的可加性
设 则
2 1
~ (n1), ~ (n2), 且 ,
2 2 2 2 2 1
2 2 相互独立,
~ (n1 n2)
2 1 2 2 2
性质 设(X1,X2,…,Xn)为取自正态总体X~N( , 2)
相关文档
最新文档