概率论与数理统计6.2抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设 X1, X2 , , Xn 是来自总体N (0, 1) 的样本,
则称统计量
2=X
2 1
X
2 2
X
2 n
服从自由度为
n的 2 分布, 记为 2 ~ 2(n).
自由度: 指 2 X 2 X 2 X 2 中右端包含独立
1
2
n
变 量 的 个 数.
2(n)分布的概率密度为
f
(
y)
n 22
同理 设U ~ 2 (n ), V ~ 2 (n ), 且U , V 独立, 则称
1
2
随机变量F
i1
i1
2 分布的分位点
对于给定的正数 , 0 1, 称满足条件
P{ 2 2 (n)}
f ( y)dy
2 ( n)
的点
2
(n)
为
2 (n)
分布的上
分位点.
f(x)
对于不同的 , n,
可以通过查表求
得上 分位点的值.
2 (n)
X
例2 设 Z ~ 2(n), 2(n) 的上 分位点满足
n D( X ) 1 2
n i1
i
n2 i1
in
E(S
2
)
E n 1 1
n i 1
(
X
i
X
)2
E n
1 1
n i1
[(Xi
)
(X
)]2
E
1[ n 1
n i 1
(Xi
)2
n( X
)2
]
1[ n 1
n i 1
E(Xi
)2
nE( X
)2]
1[ n 1
n i 1
D( X i
)
nD( X
Ak
1 n
n i 1
X
k i
,k
1, 2,
;
其观察值
k
1 n
n i 1
xik
,k
1, 2,
.
(5)样本 k 阶中心矩
Bk
1 n
n i 1
(
X
i
X )k
,k
2, 3,
;
其观察值
bk
1n n i1 ( xi
x)k
,k
2, 3,
.
设(X1,X2,…,Xn)是来自总体X的一个样本,则
P
lnim
sup
x
Fn( x)
F(x)
0
1.
对于任一实数 x当 n 充分大时, 经验分布函 数的任一个观察值Fn( x) 与总体分布函数F ( x) 只有微小的差别, 从而在实际上可当作F ( x) 来 使用.
二、统计学三(四)大分布
完全由样本确定的函数就是统计量。统计量是随机 变量,它的分布称为抽样分布。
t1 / 2 (n), t / 2 (n)
f (x)
显然,
t1 /2 (n) t /2 (n) / 2
/2
t1 / 2 (n) O t / 2 (n)
x
例4 设 T ~ t(n), t(n) 的上 分位点满足
P{T t (n)}
t( y; n)dy ,
t (n)
求 t (n) 的值, 可通过查表完成.
则称随机变量t X 服从自由度为n 的 t Y /n
分布, 记为 t ~ t(n).
t 分布又称学生氏(Student)分布. t(n) 分布的概率密度函数为
h(t)
n
2
πn
1 n
1
t2 n
n1 2
,
2
t
t分布的密度曲线: f(x)
X
特点 关于y轴对称偶函数;随着自由度的逐 渐增大,密度曲线逐渐接近于标准正态密度 曲线.
用 S( x) ( x )表示 X1, X2 , , Xn 中不大 于 x 的随机变量的个数,
定义经验分布函数 Fn( x) 为
Fn (
x)
1 n
S(
x),
( x )
实例3 设总体 F 具有一个样本值 1, 2, 3,
0,
则经验分布函数 F3( x)的观察值为
1 ,
F3
(
x
)
3 2
,
3
附表2-1 附表2-2
补充知识: Γ-函数
定义
(x) ett x1dt
0
(x 0)
❖ 性质 (x 1) x(x) (x 0); (n 1) n!;(2) (1) 1;
重要积分
et2 t
xdt
1
1
x
0
22
(x 1);
e t 2
dt
1
1
.
0
2 2 2
2. 2分布 (卡方分布)
S2
1 n1
n i 1
(Xi
X )2
n
1
1
n i 1
X
2 i
nX
2
.
其观察值
s2
1 n1
n i 1
( xi
x )2
1 n
1
n i 1
xi2
nx 2
.
(3)(修正)样本标准差
S
S2
1 n1
n i 1
Xi
X
2
;
其观察值
s
1n n 1 i1 ( xi
x)2
.
(4) 样本 k 阶(原点)矩
其中 z 是标准正态分布的上 分位点.
利用上面公式,
可以求得 n 45 时, 上 分位点的近似值.
例如
2 0.05
(50)
1 2
(1.645
99)2 67.221.
而查详表可得
2 0.05
(50)
67.505
.
3. t 分布
设 X ~ N (0, 1), Y ~ 2(n), 且 X , Y 独立,
第二节 统计量与抽样分布
一、基本概念 二、常见分布 三、几个重要的抽样分布定理 四、小结
统计的一般步骤 样本是进行统计推断的依据。但在实际应用时,一
般总不体是直选接择使个用体样本样本本身,观而测是样对本样本样进本行观整察理值和(加数工据,)
即针对具体问题构造适当的函数—统计量,利用这些函数 来进行统数计据推处断理,揭示样总本体有的关统结计论特性.
i
k 1,2,...
性质6.1:设总体X的均值为μ,方差为σ2,(X1,X2,…,Xn)是 X的一个样本,则有
E( X ) , D( X ) 2 , E(S 2 ) 2
n
证明
E( X ) E( 1 n X ) 1 n E( X )
n i1
i
n i1
i
1 n
1
D( X ) D( X )
1
2
b(3 X 4 X ) ~ N (0,1)
3
4
D[
a ( X 2 X )] 1
1
2
D[
b(3 X 4 X )] 1
3
4
a =1/20 b=1/100
2 分布的性质
性质1 ( 2 分布的可加性)
设
2 1
~
2(n1 ),
2 2
~
2(n2 ),
并且
2 1
,
2 2
独
立, 则
2 1
2 2
(
X
2 1
X22
X 32 ).
不是
2. 几个常用统计量
设 X1, X2 , , Xn 是来自总体的一个样本,
x1, x2 , , xn 是这一样本的观察值.
(1)样本平均值
X
1 n
n i 1
Xi;
它反映了总体 均值的信息
其观察值
x
1 n
n i 1
xi
.
它反映了总体 方差的信息
(2)(修正)样本方差
统计量
推断总体性质
这种不含任何未知参数的样本的函数称为统 计量. 它是完全由样本决定的量.
一、统计量
1. 统计量的定义
定义6.5 设X1,X2,…,Xn是来自总体X的样本,x1,x2, …,xn为其样本值,则称不含任何总体分布中未知参数的 连续函数g(X1, X 2, , X n ) 为统计量,相应实数 g(x1, x2, , xn ) 称为其观察值。
1 (n)
n1 y
y2 e 2
,
y0
2
0
其他.
又因为 Xi ~ N (0, 1),
由定义
X
2 i
~
2 (1),
2(n) 的密度曲线
f(x) n=1
n=4
n=10 X
随着n的增大,密度曲线逐渐趋于平缓,对称.
例1、设随机变量X1,X2,X3,X4独立且都服
从N(0,1/2),则(X1+X2)2+(X3+X4)2服从___2_(2_)__分
样 本 均 值:
1 n
X X
n i1
i
样 本 方 差:
样 本 标 准 差:
S 2 1
n
(X X )2
n 1 i1
i
S
1
n
(X X )2
n 1 i1
i
样本k阶原点矩: A 1 n X k
k
n i1
i
k 1,2,...
样本k阶中心矩: B 1 n ( X X )k
k
n i1
1,
x 1, 1 x 2,
2 x 3, x 3.
实例4 设总体 F 具有一个样本值 1, 1, 2, 则经验分布函数F3( x)的观察值为
0,
Leabharlann BaiduF3
(
x
)
2 3
,
1,
x 1, 1 x 2, x 2.
格里文科定理
对于任一实数 x,当 n 时, Fn( x) 以概率1 一致收敛于分布函数F ( x), 即
X
k 2
)
E
(
X
k n
)
k
.
再根据第五章辛钦定理知
辛钦定理
1
n
n i 1
X
k i
P k
,
k 1, 2, ;
由第五章关于依概率收敛的序列的性质知
g( A1, A2 , , Ak ) P g(1, 2 , , k ),
其中 g 是连续函数.
以上结论是下一章所要介绍的矩估计法 的理论根据.
有关二维总体的统计量自己看。
定义6.6 顺序统计量(最大、最小)
定义6.7 经验分布函数
设 x1, x2, , xn 是总体F的一个容量为n 样本值,
先将 x1, x2, , xn 按自小到大的次序排列,
并重新编号, x(1) x(2) x(n) ,
则经验分布函数Fn( x)的观察值为
0,
Fn
(
x
)
k n
,
1,
x x(1) , x(k ) x x(k1) , x x(n) .
证明 因为 Xi ~ N (0, 1), 所以 E( Xi2 ) D( Xi ) 1, D( Xi2 ) E( Xi4 ) [E( Xi2 )]2 3 1 2, i 1, 2, , n.
故 E( 2 ) E n Xi2 n E( Xi2 ) n,
i1
i1
D( 2 ) D n Xi2 n D( Xi2 ) 2n.
例3:设X1,X2,X3,X4是来自正态总体N(0,22)的简 单随机样本,
则
3 X1 X22 X32 X42
服从__t_(_3_)_分布 ;
X 1
~
N (0,1) ,( X 2 )2
( X3 )2
( X4 )2
~
2 (3)
2
2
2
2
X 1
2
~ t(3)
{(
X
2
)2
(
X
3
)2
(
X 4
)2
}
/
~
2(n1
n2 ).
( 此性质可以推广到多个随机变量的情形. )
设
2 i
~
2(ni ),
并且
2 i
(i 1, 2,
, m) 相互
m
独立, 则
2 i
~
2(n1 n2
nm ).
i 1
性质2 ( 2分布的数学期望和方差)
若 2 ~ 2(n), 则 E( 2 ) n, D( 2 ) 2n.
实例1
设
X
1
,
X
2
,
X
是来自总体
3
N
(
,
2
)的一
个
样本, 其中 为已知, 2 为未知, 判断下列各式哪
些是统计量, 哪些不是?
T1 X1,
T2 X1 X2e X3 ,
T3
1 3
(
X
1
X2
X 3 ),
是
T4 max( X1, X 2 , X 3 ), T5 X1 X2 2,
T6
1 2
3
2
2
2
t 分布的分位点
对于给定的 , 0 1, 称满足条件
P{t t (n)}
h(t)dt
t (n)
的点 t (n) 为 t(n) 分布的上 分位点.
f(x)
可以通过查表求
得上分位点的值.
α
当 n 45 时, t (n) z .
t ( n ) X
由分布的对称性知:
双侧α/2分位点:
t0.05(10) 1.8125, 附表3-1
t0.025(15) 2.1315. 附表3-2
4. F分布
设U ~ 2(n1 ), V ~ 2(n2 ), 且U , V 独立, 则称
随机变量
F
U V
/ n1 / n2
服从自由度为 (n1,
n2 ) 的
F
分
布, 记为 F ~ F (n1, n2 ).
下面,介绍来自正态总体的几个重要统计量的分布.
1.标准正态分布及其上侧分位数
定义: 设X~N(0,1), 对任意0<α<1,
若P(X>zα)=α, 则称zα为标准正态分布 的上侧α分位数.
其中 (z ) 1
φ(x)
α
zα
X
注: z z
1
z 1
z
求 z 的值, 可通过查表完成.
z0.05 1.645, z0.025 1.96,
)]
1 (n
n 1
2
2
n n
)
2
性质6.2:
若总体 X 的k 阶矩 E( X k ) 记成 k存在, 则当n 时, Ak P k , k 1, 2, .
证明 因为 X1, X2 , , Xn 独立且与 X 同分布,
所以 X1k ,
X
k 2
,
,
X
k n
独立且与X k 同分布,
故有
E(
X1k
)
E(
P{Z 2 (n)} ,
求2 (n)的值, 可通过查表完成.
2 0.025
(8)
17.535,
附表
2 0.975
(10)
3.247,
附表
2 0.1
(
25)
34.382.
附表
附表3只详列到 n=40 为止.
费舍尔(R.A.Fisher)证明:
当
n
充分大时,
2 (n)
1 2 (z
2n 1)2.
布;若要使aX12+b(X2+X3+X4)2~2(2),则 a=__2__ ,
2
b=__3__.
练习 设 X , X , X , X 是取自总体N(0,4)的简单
1
2
3
4
随机样本 X a( X 2X )2 b(3X 4X )2
1
2
3
4
当a=
, b=
时, X ~ 2(2).
解 由题意得
a ( X 2X ) ~ N (0,1)