概率论与数理统计第17讲 9.11

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

概率论与数理统计第17讲(夜大)
第二节 抽样分布
定义:设n X X ,,1 是来自总体X 的一个样本,),,(1n X X g 是n X X ,,1 的函数,若g 中不含有未知参数,则称),,(1n X X g 是一统计量。

因为n X X ,,1 都是随机变量,而统计量),,(1n X X g 是随机变量的函数,因此统计量是一个随机变量,设n x x ,,1 是相应于样本n X X ,,1 的样本值,则称),,(1n x x g 是
),,(1n
X
X g 的观察值。

下面列出几个常用的统计量。

设n X X ,,1 是来自总体X 的一个样本,n x x ,,1 是这一样本的观察值。

定义
样本均值 ∑
==
n
i i
X
n
X 1
1
样本方差 ()
⎪⎭
⎫ ⎝⎛
--=--=
∑∑==2
1
21
2
2
11
1
1X
n X n X
X
n S
n
i i
n
i i
样本标准差 ()
∑=--=
=
n
i i
X
X
n S S 1
2
2
11
样本k 阶(原点)矩 ,2,111
==

=k X
n
A n
i k i
k
样本k 阶中心矩 ()
3,21
1
=-=
∑=k X
X n
B n
i k
i
k
它们的观察值分别为(大写字母变成小写)…。

这些观察值仍然分别称为样本均值、样
本方差、样本标准差、样本k 阶(原点)矩以及样本k 阶中心矩。

我们指出,若总体X 的k 阶矩k k
EX
μ∆存在,
则当∞→n 时, ,2,1,=−→−k A k p
k μ。

这是因为n X X ,,1 独立且与X 同分布,所以k
n k X X ,,1 独立且与k
X
同分布。

故有
k k n k EX
EX
μ=== 1
由大数定律(辛钦定理)知道: ,2,111
=−→−=

=k X
n
A k
p
n
i k i
k μ
进而由依概率收敛的序列的性质,有:()()k p
k g A A g μμ,,,,11 −→−
其中g 为连续函数。

这就是矩估计法的理论基础。

统计量的分布称为抽样分布。

在使用统计量进行统计推断时常需要知道它的分布。

当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说是困难的。

下面介绍几个常用统计量的分布。

一、2
χ分布 设n X X ,,1 是来自正态总体()1,0N 的样本,则称统计量 221
2
n
X
X
++= χ
服从自由度为n 的2χ分布,记为()n 2
2

χ。

此处自由度是指等式右边包含的独立变量
的个数。

2
χ统计量的性质:
(1)可加性。

设()122
1~n χχ,()222
2~n χχ,并且2
221,χχ相互独立,则有
()212
2221~n n ++χχχ (由Γ分布的可加性可得)
(2)若()n 2
2

χ
,则有 n D n E 2,2
2
==χ
χ
事实上,因为()1,0~N X
i
,所以12==i
i
DX
EX

[]
n i EX
EX DX i
i
i
,,2,1,2132
242 ==-=-=
于是 n EX EX
E n
=++=221
2
χ
, n DX
DX
D n
2221
2
=++= χ
2
χ分布的分位点 对于给定的正数α,10<<α,称满足条件
(){}()()
αχχ
α
χ
α==>
⎰∞
n dy y f n P 2
2
2
的点()n 2αχ为()n 2
χ分布的上α分位点,如图所示。

对于不同的n ,α,上α分位点的值已经制成表格,可以查表来求。

例如对于
25,1.0==n α,查表得()382.3425
2
1.0=
χ。

但是需要说明该表只列到45=n 为止,费舍
曾证明,当n 充分大时,近似地有 ()()
2
2
1
22
1-+≈
n z
n α
αχ
其中αz 是标准正态分布的上α分位点。

利用该式可以求45>n 时()n 2
χ分布的上α分位点
的近似值。

二、t 分布 设()()n Y N X 2
~,1,0~χ,且X ,Y 相互独立,则称随机变量
n
Y X t =
服从自由度为n 的t 分布。

记为()n t t ~。

t 分布又称为学生氏分布(1907年英国统计学家Gosset 以笔名Student 首次发表)。

()n t 分布的概率密度函数为
()t h 的图形关于0=t 对称,当n 充分大时其图形类似与标准正态分布概率密度的图形。

事实上,利用Γ函数的性质,可得 ()2
2
21lim t
n e
t h -

→=
π
故当n 足够大时,t 分布近似于标准正态分布。

但对于较小的n ,t 分布与标准正态分布相
差较大。

t 分布的分位点 对于给定的正数α,10<<α,称满足条件 (){}αα==>t n t t P 点()n t α为()n t 分布的上α分位点,如图所示。

由t 分布上α分位点的定义及()t h 图形的对称性可知 ()()n t n t αα-=-1 t 分布上α分位点可查表求得。

在45>n 时,对于常用的α值,就用正态近似: ()ααz n t ≈
三、F 分布 设()12~n U χ,()22
~n V χ,且U ,V 相互独立,则称随机变量
2
1n V n U F =
服从自由度为()21,n n 的F 分布,记为()21,~n n F F 。

由定义可知,若()21,~n n F F ,则
()12,~1n n F F
F 分布的分位点 对于给定的正数α,10<<α,称满足条件
(){}()()
αφα
α==>⎰∞
21,2
1,n n F
dy y n n F F P
的点()21,n n F α为()21,n n F 分布的上α分位点,如图所示。

上α分位点的值已经制成表格,可以查表来求。

()21,n n F 分布的上α分位点有以下重要性质: ()()
12211,1,n n F n n F αα=
-
上式常用来求F 分布表中未列出的常用的上α分位点。

四、正态总体的样本均值与样本方差的分布
设总体X (不管服从什么分布,只要均值和方差存在)的均值为μ,方差为2
σ

n
X
X ,,1 是来自X 的一个样本,2
,S X 是样本均值和样本方差,则总有
,11
μ==

=n
i i
X
n
X E n
DX
n
X D n
i i
2
1
2

=
=

=
⎪⎭

⎝⎛--=⎪⎭

⎝⎛
--=∑∑==2
122
122
1111
X
nE EX
n X
n X E n ES
n
i i
n
i i
(
)
2
2
2
1
2
2
11
σμ
σμ
σ=⎪⎪⎭

⎝⎛⎪⎪⎭⎫
⎝⎛+-+-=
∑=n
n n n
i
进而,设()2
,~σ
μN X ,可知∑
==
n
i i
X
n
X
1
1也服从正态分布,于是有以下定理:
定理一 设n X X ,,1 是来自正态总体()2

μN 的样本,X
是样本均值,则有
X ⎪⎪⎭


⎛2
,
~n N σ
μ 对于正态总体()2

μN 的样本均值X
和样本方差2
S ,有以下两个重要定理。

定理二 设n X X ,,1 是来自正态总体()2
,σμN 的样本,2
,S
X 是样本均值和样本方
差,则有 (1)
()()1~12
2
2
--n S
n χ
σ
; (2)2
,S
X 相互独立
定理三 设n X X ,,1 是来自正态总体()2
,σμN 的样本,2
,S
X 是样本均值和样本方
差,则有
()1~--n t n
S
X μ
对于两个正态总体的样本均值和样本方差有以下定理 定理四 设1
,,1n X
X 与2
,,1n Y Y 是来自正态总体()2
1
1,σμN 和()22
2

μ
N 的样本,
且这两个样本相互独立(即随机变量(1
,,1n X
X )与(2
,,1n Y Y )相互独立)。


2
22
1,,,S S Y X 分别是这两个样本的样本均值和样本方差,并有
()
()
∑∑∑

====--=
--=
=
=
1
1
2
1
1
2
22
21
2
12
11
2
1
1
1
1,1
1,1,1n i i
n i i
n i i n i i
Y
Y
n S X
X
n S Y n Y X
n X
则有 (1)
()1,1~2122
2
122
21
--n n F S S σ
σ;
(2)当2
22
2

σ
σ==时,
()
()
()2~11212
1
21-++---n n t n n S Y X
w
μμ
其中()()2
212
2
22
112
,
2
11w w w S S n n S n S n S =
-+-+-=
需要说明的是,我们在这一部分介绍的三大统计分布以及四个定理是后面统计的基础,应当注意的是它们都是在总体为正态这一基本假定下得到的。

例1已知()n t X ~,求2
X
的分布。

解:由t 分布定义,则()n t n
Y Z X ~=

其中()1,0~N Z ,()n Y 2
~χ,故n
Y Z
X
2
2
=

其中()()n Y Z
2
2
2
~,
1~χ
χ
,由F 分布定义,则()n F n
Y Z
X
,1~1
/2
2
=。

例2 设X 与Y 相互独立且都服从正态分布()2
3,0N ,而9191
,,,,,Y Y X X
分别是来
自总体X 与Y 的简单随机样本,求统计量2
9
2
191Y Y X
X
U ++++=
的分布。

解:根据题意,9191,,,,,Y Y X X 独立且都服从()2
3,0N ,从而由正态分布的可加
性知道分布()2
9
19
,0~N X i i ∑=,于是()1,0~9
1
9
1
N X
i i

=,而
()()9,,11,0~3
1 =i N Y i ,从
而()1~312
2
χ
⎪⎭
⎫ ⎝⎛i Y ,进而由2
χ分布的可加性,有()9~32
2
9
1
χ

=⎪⎭

⎝⎛i i Y ,由t 分布定义,有
()9~39
191
9
1
2
9
12
9
2
191t Y X
Y Y X
X
U i i i i


==⎪⎭
⎫ ⎝⎛=
++++=
例3 设n X X ,,1 是来自总体X 的样本,现又获得第1+n 个观察值1
+n X
,试证明:
()n
n n
n X
X
n X
X
-++
=++1
1
11
证明:
()()
n
n n
n n i i
n
i i
n n
i i
n n
i i
n X
X
n X X
n X
n n X
n
X n X
n n
n X
n X
n X
-++
=++
+-
=
++
+-+=
++
+=
++==+=+=+∑∑


1
1
1
1
1
11
1
1
1
1
1
1
)
1(1
11
111
111
11
作业:谈学习概率论与数理统计的体会(第四次课交)。

相关文档
最新文档