大学概率论期末复习要点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态总体抽样分布
分位数(分位点) Quantile ,下侧分位数Under Quantile 定义 设连续型变量X 的分布为(),F x 密度为(),f x 对任意的01,p <<满足(累积概率)分布值为p 的位置,p x 即
()()(),01,p
x p p F x P X x f x dx p p -∞
=≤==<<⎰
称为p 分位数(下侧p 分位数).
分位数是一个位置特征,可能不唯一,特别地,当1/2p =时,1/2x 称为中位数.
上侧分位数Upper Side Quantile 定义 设连续型变量X 的分布为(),F x 密度为(),f x 补分布()1(),S x F x - 对任意的01,α<<满足补分布值为α的位置,u α即
()1()()(),01,u S u F u P X u f x dx α
ααααα+∞
=-=>==<<⎰
称为上侧α分位数.
将下侧分位数p 换为1α-得
11()()1,01,F x P X x αααα--=≤=-<<
1111()1()1()(),S x F x P X x P X x ααααα----=-=-≤=>= 由上侧分位数定义得
1,0 1.u x ααα-=<<
分位数(下侧分位数)一般定义1 设变量X 的分布为(),F x 对任意的01,p <<满足(累积概率)分布值p ≥的最小位置,p x 即
min{;()()},p x x F x P X x p =≤≥ 称为p 分位数(下侧p 分位数).
上侧分位数一般定义1 设补分布()1(),S x F x - 对任意的01,α<<满足补分布值α≤的最小位置,u α即
min{;()1()()},u x S x F x P X x αα=-=>≤ 称为上侧α分位数.
将下侧分位数p 换为1α-得
1min{;()()1}x x F x P X x αα-==≤≥-
min{;()1()()},0 1.x S x F x P X x u ααα==-=>≤=<<
分位数(下侧分位数)一般定义2 设变量X 的分布为(),F x 对任意的01,p <<满足(累积概率)分布值左极限p ≤的最大位置,p x 即
max{;(0)()},p x x F x P X x p -<≤ 称为p 分位数(下侧p 分位数).
上侧分位数一般定义2 设补分布()1(),S x F x - 对任意的01,α<<满足补分布值左极限α≥的最大位置,u α即
max{;(0)1(0)1()()},u x S x F x P X x P X x αα-=--=-<=≥≥ 称为上侧α分位数.
将下侧分位数p 换为1α-得
1max{;(0)()1}x x F x P X x αα-=-=<≤-
max{;(0)1(0)1()()},0 1.x S x F x P X x P X x u ααα=-=--=-<=≥≥=<< 上侧分位数一般定义1和一般定义2是相同的.
min{;()1()()}u x S x F x P X x αα==-=>≤ {;()}u P X u ααα=>={;()}u P X u ααα=≥=
max{;(0)1(0)1()()}.x S x F x P X x P X x α=-=--=-<=≥≥
一.U (无偏)统计量Unbiased Statistic
定理 设12,,n X X X 独立同分布(..
.i i d )总体2(,),X N μσ 则样本均值 21
1(,/),n
i i X X N n n μσ==∑
标准化统计量
~(0,1).U N =
证明
由独立正态分布可加(可分,再生)性(即设22
1122(,),(,),X N Y N μσμσ 独立,则
221212(,).X Y N μμσσ+++ 可由随机变量和的卷(褶)积公式推出.)
21
(,),n
i
i X
N n n μσ=∑
21
1(,/).n
i i X X N n n μσ==∑
将X 标准化即得统计量
~(0,1).
U N
=
定理设
12
,,
n
X X X
为总体X两两不相关样本,2
,,
EX DX
μσ
样本均值1
1
,
n
i
i
X X
n=
=∑样本方差22
1
1
().
1
n
i
i
S X X
n=
=-
-
∑则
(1)
2
,,
E X DX
n
σ
μ
==(2)22.
ESσ
=(不依赖于总体分布形式.)
证明
(1)由期望性质得
11
11
,
n n
i i
i i
E X E X EX
n n
μ
==
⎛⎫⎛⎫
===
⎪ ⎪
⎝⎭⎝⎭
∑∑
由方差可加得
2
22
111
111
.
n n n
i i i
i i i
DX D X D X DX
n n n n
σ
===
⎛⎫
====
⎪
⎝⎭
∑∑∑
(2)样本方差公式
2
222
11
(1)()(2)
n n
i i i
i i
n S X X X X X X
==
-=-=-+
∑∑
222
222
111
2(),
n n n
i i i
i i i
X X X nX X nX n X X
===
=-+=-=-
∑∑∑
两边取期望,由2
2222222
,/
i
EX E X DX E X E X DX n
μσμσ
=+=+=+=+得
22
222
11
(1)
n n
i i
i i
n ES E X nX EX nE X
==
⎛⎫
-=-=-
⎪
⎝⎭
∑∑
22222
()(/)(1),
n n n n
μσμσσ
=+-+=-22.
ESσ
=
定理设
1
12
,,
n
X X X
独立同分布(...
i i d)总体2
11
(,),
X Nμσ
2
12
,,,
n
Y Y Y
独立同分布(...
i i d)
总体2
22
(,)
Y Nμσ
,两样本独立,则统计量
~(0,1).
U N
=
其中12
11
12
11
,.
n n
i i
i i
X X Y Y
n n
==
==
∑∑
证明
22
111222
~(,/),~(,/),
X N n Y N n
μσμσ,X Y独立,由独立正态分布可加(可分,再生)性
22
12
12
12
~,,
X Y N
n n
σσ
μμ
⎛⎫
--+
⎪
⎝⎭
将X Y
-标准化即得统计量
~(0,1).
U N
=
上侧分位数Upper Side Quantile u
α
(),01,
P U uααα
>=<<
()()1,
u P U u
αα
α
Φ=≤=-
1(1).
uαα
-
=Φ-
由标准正态分布的对称性
11
1
()(1).
u u
αα
αα
--
-
=Φ=-Φ-=-
标准正态分布上侧分位数
1
0.1
(0.9) 1.28;
u-
=Φ=1
0.05
(0.95) 1.645;
u-
=Φ=1
0.025
(0.975) 1.96;
u-
=Φ=
1
0.01
(0.99) 2.325;
u-
=Φ=1
0.005
(0.995) 2.575;
u-
=Φ=1
0.002
(0.998) 2.880.
u-
=Φ=
二.卡方2
χ分布Chi-Squared Distribution
(德,阿贝E.Abbe(1840-1905),1863)(德,赫尔墨特Helmert(1843-1917),1875)
(英,皮尔逊Karl Pearson(1857-1936),1890)
定义设(1,2,,)
i
X i n
= 独立同分布()(0,1),
iid N n个独立的标准正态分布的平方和,即变
量2222
12
()
n
n X X X
χ+++
称为服从自由度为n的卡方2χ分布,记为22(),n
χχ
即附表伽玛分布Gamma Distribution (,)
αβ
Γ
1/
1
(;,),0,0,0,
()
x
f x x e x
αβ
α
αβαβ
βα
--
=>>>
Γ
的特例(/2,2).
n
αβ
Γ==
密度为
1/2
2
/2
1
(;),0.
2(/2)
n
x
n
f x n x e x
n
--
=>
Γ
是一个非对称分布.
卡方2
χ分布密度的证明
1.随机变量和的公式,卷(褶)积公式
设二维随机变量(,)X Y 的联合密度为(,),f x y 则和Z X Y =+的密度为
()(,)Z f z f x z x dx +∞
-∞
=-⎰(当,X Y 独立时)()().X Y f x f z x dx +∞
-∞
=-⎰
由Y X ,的对称性()(,)Z f z f z y y dy +∞-∞
=-⎰(当,X Y 独立时)()().X Y f z y f y dy +∞-∞
=-⎰
证明
()()(,)Z x y z
F z P Z X Y z f x y dxdy +≤==+≤=
⎰⎰(,),z x
f x y dydx +∞
--∞
-∞
=⎰
⎰
两边对z 求导,由复合函数求导链式法则得
()(,).Z f z f x z x dx +∞
-∞=-⎰
或设,t x y =+
()(,),z
Z F z f x t x dtdx +∞
-∞
-∞=-⎰
⎰
由密度函数定义得()(,).Z f z f x z x dx +∞
-∞
=-⎰
α
参考:多(二)维随机变量函数的分布
2.特殊函数伽玛函数Gamma Function 定义
120
(/2),,n s
n s e ds n N +∞--Γ=∈⎰
(设/2s x =)1/22/2
1.2
n
x n x e dx +∞
--=⎰
(1)1,Γ=由分部积分可得递推公式()
()
1.222
n n n Γ+=Γ
由伽玛函数定义1/2/21(;),0,2(/2)
n
x n f x n x e x n --=>Γ是一个密度,以下证明它是2()
n χ的密度.
3.(;)f x n 的可加(可分,再生)性
设(;1),(;1),X f x Y f x n - ,X Y 独立,则(;).Z X Y f x n =+ 证明.由独立变量和的卷积公式
()()()(;1)(;1)z
Z X Y f z f x f z x dx f x f z x n dx +∞
-∞
=-=--⎰
⎰
(1)
1/2()/22
(1)/20
1()
2((1)/2)n z
x z x n z x e dx n ------=-Γ-⎰
(1)
1
1
1/222/201()
,2(1/2)((1)/2)
n z z n e x z x dx n ----=-ΓΓ-⎰设x zt = (1)
1
1111/2222/201(1)
.2(1/2)((1)/2)
n n
z n z e t t dt n -----=-ΓΓ-⎰
由规范性得(;),Z X Y f x n =+
(1)
1111220
(1/2)((1)/2)
(1).(/2)
n n t t dt n ---ΓΓ--=
Γ⎰
取2,n =
111112
220(1/2)2(1),t t dt --Γ
=-⎰
设11011||,22
x dx t dt -+== 11111122
111()()222
x x dx ----+-==⎰
⎰
11arcsin |.x π-==
得
(1/2)s -+∞
Γ==⎰
设2,2,s x ds xdx ==得泊松积分2(1/2)x e dx +∞--∞
Γ==⎰
设2/,s x x
==2
/20x e dx +∞-=
⎰2/2
1,x e
dx +∞--∞=⎰得标准正态
密度.
设2sin ,0/2,2sin cos ,t dt d θθπθθθ=≤≤=
(1)
1111220
(1)n t t dt ----⎰
/2
20
2cos .n d πθθ-=⎰
/2/2
1010
cos (/2,1)cos sin n
n n I d I I d ππθθπθθ-===⎰
⎰
/2
/2
2
2
220
(1)cos
sin (1)cos (1cos )n n n d n d ππθθθθθθ--=-=--⎰
⎰
2(1)(1),n n n I n I -=---
因此得华莱士Wallis 公式
/20(1)!!131,,222!!2cos (1)!!132,,0!! 1.
23
!!n
n n n n n n n n I d n n n n n n n πππ
θθ-⎧--⎪-=⎨
---⎪-⎩⎰ 是偶数是奇数
,
((1)/2)(/2).n n n n Γ-==⎨
Γ是偶数是奇数 21221(2)!!(21)!!(22)!!
,,
,(21)!!(2)!!2(21)!!
m m m m m m I I I m N m m m π+---<<∈<<+-
化简得
2
22
(2)!!21.21221(21)!!2m m m m m m m ππ⎛⎫<<↑↑+∞ ⎪++-⎝⎭ 22122(21)!!(22)!!(23)!!,,,(2)!!2(21)!!(22)!!2
m m m m m m I I I m N m m m ππ
-----<<∈<<--
化简得
2
(21)!!21212.22(22)!!m m m m m m ππ-⎛⎫-<<↑↑+∞ ⎪-⎝⎭ 4.设(0,1),X N 则22(1)(;1).X f x χ= 由随机变量函数的密度公式得
(
(
/2(;1),0.x f x x ϕ
ϕ-''=+==> 设i X 独立同分布(0,1),N 由(;)f x n 的可加(可分)性得 222
12(2)(;2),,X X f x χ=+
2222
12()()(;).n n X X X f x n χ=+++
或
2.特殊函数伽玛函数Gamma Function 定义
10
(),0,s
s e ds ααα+∞--Γ=>⎰
(1)1,Γ=由分部积分可得递推公式(1)(),0.ααααΓ+=Γ> 设/,0,/,s x ds dx βββ=>=则
1/0
1
().x x e dx αβα
αβ+∞--Γ=⎰
设2,2,s x ds xdx ==则
2
2
2(1)210
()22,0.x x x
e
xdx x
e dx αααα+∞
+∞
----Γ==>⎰
⎰
由伽玛函数定义1/1(;,),0,0,0,()
x f x x e x αβ
ααβαββα--=
>>>Γ是一个密度,称为伽玛分
布(,).αβΓ即附表伽玛分布.
3.伽玛分布(,)αβΓ的可加(可分,再生)性
设12(,),(,),X Y αβαβΓΓ ,X Y 独立,则12(,).Z X Y ααβ=+Γ+
证明.由独立变量和的卷积公式
120
()()()(;,)(;,)z
Z X Y f z f x f z x dx f x f z x dx αβαβ+∞
-∞
=-=-⎰
⎰
111211/()/01211()()()z
x z x x e z x e dx ααββ
ααβαβα-----=-ΓΓ⎰
12121
1/0121(),()()
z z e x z x dx ααβααβαα---+=-ΓΓ⎰设x zt = 1212121
111/0121(1).()()
z z e t t dt ααααβααβαα+----+=-ΓΓ⎰
由规范性得12(,),Z X Y ααβ=+Γ+ 得贝塔函数Beta Function 1
211
112120
12()()
(,)(1).()
t
t dt αααααααα--ΓΓB -=
Γ+⎰
取123/2,αα==
2233111220(3/2)(1/2)(1),(3)8t t dt --ΓΓ==-Γ⎰设11011||,22
x dx t dt -+==
1
1
1
1221111()(),22248
x x dx π--+-===⎰⎰(单位圆面积为π)
得0(1/2)s
-+∞Γ==⎰
4.设(0,1),X N 则22(1)(1/2,2).X χαβ=Γ== 由随机变量函数的密度公式得
(
(
/2(;1),0.x f x x ϕ
ϕ-'
'
=+==>
设i X 独立同分布(0,1),N 由(,)αβΓ的可加(可分)性得 222
12(2)(1,2),,X X χαβ=+Γ==
2222
12()()(/2,2).n n X X X n χαβ=+++Γ==
特例.2(2)(/21,2)n χαβ=Γ====指数分布(1/2)E =附表Rayleigh 瑞利分布2(1)
σ=的平方.
设二维变(向)量的两边缘(分量)独立同标准正态,向量长(模)即平面标准布朗运动单位时刻粒子的半径称为标准瑞利分布2(1).Rayle σ= 由此可得:时间与(圆)面积一一对应. 性质
设22221122~(),~()n n χχχχ独立,则22
21212~().n n χχχ++ 证明
由卡方2χ分布的定义
1
1
1
1
2
22222222
112212,,n n n n n X X X X X X χχ+++=+++=+++
1
2
222222121212~().n n X X X n n χχχ++=++++
期望Expectation ,Mean 2
.E n χ=
方差Discrete ,Variance ,Dispersion 22.D n χ= k 阶原点矩K-Order Origin Moment 22(1)(22).k k E n k E χχ-=+-
2(22)!!
.(2)!!
k n k E n χ+-=-
证明
由期望和方差性质
2
221
1
()(),n
n
i
i
i i E E X E X n χ=====∑∑2
2211()()2,n
n
i
i i i D D X D X n χ=====∑∑
21
2/22
/2001
()(;)2(/2)
n k
k k x n E n x f x n dx x e dx n χ++∞
+∞
--==Γ⎰
⎰
21/22
2022((2)/2)1(/2)
2((2)/2)
n k
k x n k n k x e dx n n k ++∞--+Γ+=ΓΓ+⎰ 2(2)n k χ+的密度积分为1
2((2)/2)(22)!!(2)(22).(/2)(2)!!
k n k n k n n n k n n Γ++-==++-=Γ-
众数Mode (最可能(最大概率或密度)分布点)max{2,0}.M n =-
上侧分位数2
21(),()n n ααχχ-
22
(()),01,P n αχχαα>=<<
将α换为1α-得
221(())1,P n αχχα->=-
2221/2/2(()())1.P n n ααχχχα-≤≤=-
定理(统计学基本定理) 设n X X X ,,,21 是正态总体2(,)X N μσ 的独立样本,则 (1)样本均值X 与样本方差2S 独立;
/2
1/2-α
(2)2
2
221
2
2
()(1)~(1).n
i
i X
X n S
n χχσ
σ
=--=
=
-∑
证明
设n 维正态分布12(,,,),n X X X X '= 正交阵A (即A A E '=),
0000
0A ⎡⎤⎢⎥⎢
⎥⎢
⎥⎢⎥
⎢
⎥=⎢
⎥⎢⎥⎢
⎥⎢⎥⎢⎥
n 维正态分布12(,,,),n Y Y Y Y AX '==
2
2111
1(,/),,),n n i i i i X X N n Y X N n μσσ=====∑
1
21
(1))(0,),/(0,1),2,,.i i i i i i Y X i X N Y N i n σσ-==--=∑
由独立正态分布正交变换为独立正态分布,或由正态分布独立与不相关等价得
,1,2,,,
i Y i n = 独立. (,)()(),1,i j i j i j i j Cov Y Y E YY EY EY E YY i j n =-=≤<≤
1
1111(,)()((1))j n j j i i
j i i Cov Y Y E YY E X X j X -==⎛⎫==-- ⎪⎝⎭
∑∑
1221(1)0,2,j i
j i EX j EX j n -=⎫=--=≤≤⎪⎭
∑只需求平方项期望
1
111(,)()((1))((1))j i i j i j i
i i j i i Cov Y Y E YY X i X X j X --==⎛⎫==---- ⎪⎝⎭
∑∑
1221(1)0,2.i i i i EX i EX i j n -=⎫=--=≤<≤⎪⎭∑
因此X 与,2,,,i Y i n = 独立,从而X 与2S 独立.
2
21
1
,n
n
i
i i i Y
Y Y X A AX X =='''===∑∑
2
2
2
2
2
221
1
1
1
2
(1)(),n
n
n
n
i i
i i i i i i n S X X X nX Y Y Y ====-=-=-=-=∑∑∑∑
由卡方2χ分布定义得
2
2
222
2
(1)(/)~(1).n
i i n S Y n χσχσ=-=
=-∑
简证
222
21
1111(),n n i i i i S X X X X n n ===-=-∑∑
2
2
2
21
1
(1)(),n n
i i i i n S X X X nX ==-=-=-∑∑将,2,,,i X i n X = 标准化
22
22
22
2
11(1)().n
n i i i i X X X n S n U μχσσσ==⎛⎫⎛⎫---⎛⎫==-=- ⎪ ⎪⎝⎭⎝
⎭∑∑ 由矩阵正交变换或直角坐标变换,可将2()n χ分解为其中一个变量为标准正态U 的n
个独立标准正态的平方和,因此X 与2S 独立,2
2
2
(1)n S χσ-=
可表为1n -个独立标准正态
的平方和,即2~(1).n χ-
参考:《概率论与数理统计》,茆诗松等,高等教育出版社.
三.t 分布,学生氏分布Student Distribution (英,高塞特W.S.Gosset (1876-1937),1908) 定义 设2(0,1),(),,X N Y n X Y χ 独立,变量
T =
称为服从自由度为n 的t 分布,记为(),T t n 密度为
122
(;)1,.n x
f x n x R n +-⎫=
+∈⎪
⎭
是一个对称分布.
2
1
(;1),,(1)
f x n x R x π==∈+称为标准柯西分布(0,1).C
t 分布密度的证明可略,因可由F 分布密度推出. 1.随机变量商的密度公式
设二维随机变量(,)X Y 的联合密度为(,),f x y 则商/Z X Y =的密度为
()(,)||,Z f z f yz y y dy +∞-∞
=⎰当,X Y 独立时,()()()||.Z X Y f z f yz f y y dy +∞
-∞
=⎰
证明
/()(/)(,)Z x y z
F z P Z X Y z f x y dxdy ≤==≤=
⎰⎰
(,)(,).yz
yz
f x y dxdy f x y dxdy +∞
+∞
-∞-∞=+⎰
⎰
⎰
⎰
两边对z 求导得
()(,)(,)Z f z f yz y ydy f yz y ydy +∞-∞
=-+⎰
⎰(,)||.f yz y y dy +∞
-∞
=⎰
参考:多(二)维随机变量函数的分布
2.
变量Θ
()y θ=反函数2(),0,y n θθθ=>由随机变量函数的密度公式得Θ的密度为
212/2
/21()(())|()|()22(/2)
n
n Y n f f y y n e n n θθθθθθ--Θ'==Γ
2/21/2/21,0.2(/2)
n n n n n e n θθθ---=>Γ ,X Y 独立,所以,X Θ独立,由独立变量商的密度公式得/T X =Θ的密度为
(;)()()||X f x n f x f d θθθθ+∞
Θ-∞
=
⎰
22/2()/21/2
/21
2(/2)n x n n n n e d n θθθθθ+∞
----=Γ⎰
22(1)/2()/2
,n n n x e d θθθ++∞
-+= 设2(1)/2(1)/2212(1)/222(1)/2
(2)(2),,,,2()()
n n n n
n n n x s ds s s d d ds n x n x n x θθθθθθ----++====+++
1
2
(1)/20
1n n s
x s e ds n +-+∞--⎫=
+⎪
⎭
⎰1
2
1,.n x
x R n +-⎫=
+∈⎪
⎭
性质
()t n 分布收敛到标准正态分布(0,1),.N n →+∞
()t n 分布尾部概率大于标准正态分布(0,1)N 尾部概率,称为厚尾分布.当40n ≥时,()t n 分布可近似为标准正态分布(0,1)N .
2
211222lim 1lim 1.x n n n x x n n x x e n n +-+--→+∞→+∞⎡⎤⎛
⎫
⎛
⎫
⎢⎥+=+= ⎪
⎪⎢⎥⎝
⎭⎝⎭⎣⎦
由规范性,即系数与其适应
,
lim n =
21,,2.
n m m N n m =+∈==
由2(1/2)(1/1,m m m >-+>
,m ↑↑+∞
由2(21)4(1,m m m ->->
.m ↑↑+∞ 因此
.n ↑↑+∞
特例.标准柯西分布最大密度1
(0;1)f n π
==
<
标准正态分布最大密度(0)ϕ=
两密度面积均为1,因此标准柯西分布(0,1)C 尾部概率大于(0,1)N 尾部概率. 期望0,.ET n N =∈ 方差, 2.2
n
DT n n =
>- 证明
由()t n 分布密度对称性得0,.ET n N =∈
1
22
222
(;)1
n
x
DT ET x f x n dx x dx
n
+
-
+∞+∞
-∞-∞
⎛⎫
===+⎪
⎭
⎰⎰
1
222
(1)11
n
x x
n dx
n n
+
-
+∞
-∞
⎫⎛⎫
=+-+
⎪⎪
⎭⎝⎭
⎰
)
()()
1
22
11
22
1
22
22
n
n n
x
n dx n
n
n n
-
-
+∞
-∞
--
Γ
⎛⎫
=+-
⎪
--⎝⎭
Γ
⎰
==
1
22
(1)
1,
22
n
n n y
dy n
n n
-
-
+∞
-∞
⎛⎫
-
=+-
⎪
--⎭
⎰(2)
t n-密度积分为1
(1)
, 2.
22
n n n
n n
n n
-
=-=>
--
上侧分位数
1/2
(),(),()
t n t n t n
ααα
-
(()),0 1.
P T t n
α
αα
>=<<
由t分布密度对称得
(()),
P T t n
α
α
<-=
(())1,
P T t n
α
α
>-=-
由t分布分位数的唯一性得
1
()().
t n t n
αα
-
=-
/2
(||()),
P T t n
α
α
>=
/2
(||())1.
P T t n
α
α
≤=-
α
标准化t 分布Standardized Student Distribution
设(),2,,(),X t n n Y x y >==
则变量Y 的密度为
12
2
()(())|()|1n Y X f y f x y x y n +-⎛⎫⎫'==+⎪
⎪⎪⎭⎭
12
2
1,.2n y
y R n +-⎛⎫=
+∈⎪
-⎭
称为服从自由度为n 的标准化t 分布,记为().Y t n * 特殊函数贝塔函数Beta Function 定义
1110()()
(,)(1).x x dt αβαβαβαβ--ΓΓB -=⎰
贝塔分布Beta Distribution 定义 设随机变量X 的密度为
11
(1)(),0,0,01,(,)
x x f x x αβαβαβ---=>><<B
称为贝塔分布,记为(,).X αβB
设(,),(,),U V αγβγΓΓ 独立,则(,).U
X U V
αβ=
B + 倒贝塔分布Inverse Beta Distribution 定义 设随机变量X 的密度为
211()(1),0,0,1,(,)
f x x x x αββαβαβ-+--=->>>B 称为倒贝塔分布,记为1(,).X αβ-B 费歇Z 分布Fisher Z-Distribution 定义
设21(,),(1)(1)1,,(),|()|,11(1)y
Y X X Y X x y x y Y y y αβ'B -+====+++ 则变量Y 的密
度为
1
1
2
111()(())|()|(,)11(1)Y X y f y f x y x y y y y αβαβ--⎛⎫⎛⎫
'== ⎪ ⎪B +++⎝⎭
⎝⎭
/2α/2α
11(1),0,0,0,(,)
y y y ααβαβαβ---=
+>>>B 称为费歇Z 分布,记为(,).Y Z αβ
或设11(,),1(,),1,.11Y X X Y X Y X Y
βααβB -=B =-=++
或设11(,),,.11Y X Y X X Y
αβ-B ==-+
或设(,),(,),U V αγβγΓΓ 独立,/.Y U V =则变量Y 的密度相同.
取12
,,22n n αβ==即为独立卡方分布商2122()()
n n χχ的密度.
1
121122212(()/2)()(1),0.(/2)(/2)
n
n n Y n n f y y y y n n +--Γ+=+>ΓΓ
定理 设12,,n X X X 独立同分布(..
.i i d )总体2(,),X N μσ 则统计量
~(1).T t n =- 证明
222
2
(1)~(0,1),~(1),n S U N n χχσ-==-独立, 由t 分布定义
T ==
~(1).t n ==-
/S σ=是用样本标准差S 替换总体标准差σ的因子.
定理 设112,,n X X X 独立同分布(..
.i i d )总体21(,),X N μσ 212,,,n Y Y Y 独立同分布(...i i d )总体22(,)Y N μσ ,(两总体方差相等),两样本独立,则统计量
12~(2).T t n n =
+-
其中12111211,,n n i i i i X X Y Y n n ====∑∑12222
21211
1211(),(),11n n i i i i S X X S Y Y n n ===-=---∑∑ 22
21122
12(1)(1).2
w
n S n S S n n -+-=+-
证明
221122~(,/),~(,/),X N n Y N n μσμσ,X Y 独立,由独立正态分布可加性
2121212~,,n n
X Y N n n μμσ⎛⎫+-- ⎪⎝⎭
标准化变量~(0,1).U N =
2
2
2
21122
122
2
(1)(1)~(1),
~(1)n S n S n n χχσ
σ
----,22
12,S S 独立,
由独立卡方分布可加性
2
22
2121122
122
2
(2)(1)(1)~(2).w
n n S n S n S n n χσ
σ
+--+-=
+-
X Y -与2
w
S 独立,根据t 分布的定义
T =
=
12~(2).t n n =
+-
四.F (比率)分布Fisher Proportional Distribution (英,费歇R.A.Fisher (1890-1962),1924) 定义 设2212(),(),X n Y n χχ ,X Y 独立,变量
1
2
//X n F Y n =
称为服从第一(分子)自由度为1,n 第二(分母)自由度为2n 的F 分布,记为12(,),F F n n 密度为
1121
1121
12121222(()/2)(;,)1,0,(/2)(/2)n n n n n n n n f x n n x x x n n n n +-
-Γ+⎛⎫⎛⎫=
+
> ⎪ ⎪ΓΓ⎝⎭
⎝
⎭
2
1122
112
11212()(),0.(/2,(/2)
n n n n n n n x n x n x n n +--=+>B 其中贝塔函数()()
(,),0,0,())
αβαβαβαβΓΓB =
>>Γ+F 分布是一个非对称分布.
F 分布密度的证明
1.随机变量商的密度公式
设二维随机变量(,)X Y 的联合密度为(,),f x y 则商/Z X Y =的密度为
()(,)||,Z f z f yz y y dy +∞
-∞
=⎰当,X Y 独立时,()()()||.Z X Y f z f yz f y y dy +∞
-∞
=⎰
证明
/()(/)(,)Z x y z
F z P Z X Y z f x y dxdy ≤==≤=
⎰⎰ 0
(,)(,)yz
yz
f x y dxdy f x y dxdy +∞
+∞
-∞-∞=+⎰
⎰
⎰
⎰
两边对z 求导得
()(,)(,)Z f z f yz y ydy f yz y ydy +∞
-∞
=-+⎰
(,)||.f yz y y dy +∞
=
参考:多(二)维随机变量函数的分布
2.由独立变量商的密度公式,/Z X Y =的密度为
120
(;,)(,)||()()Z X Y f z n n f yz y y dy f yz f y ydy +∞
+∞
-∞
==⎰
⎰
11212
12
1(1)
2
12,
(/2)(/
2)2n n n y
z n n z y e dy n n -++∞
--++=
ΓΓ⎰设(1)2
y
s z =
+ 112
12
1
22
10
12(1)
(/2)(/2)n n n n n s z z s e ds
n n +--
++∞--+
=ΓΓ⎰1
1211212(()/2)(1),0.n n n n n z z z +--Γ+=+>
由随机变量函数的密度公式,12
21
//X n n F Z Y n n =
=的密度为 1
121
2
2
11121
1
212121221222(()/2)(;,)(/;,)1,0.(/2)(/2)n n n n Z n n n n n f x n n f n x n n n x x x n n n n n +-Γ+⎛⎫⎛⎫=
=+
> ⎪ ⎪
ΓΓ⎝⎭
⎝⎭
3.推论.根据12(1,)F n n n ==分布密度推出()t n 分布密度.由标准正态分布的对称性得()t n 是对称的.
222()(1,)2()1(||)((1;))(),0,t n F n F x P T x P T F n x F x x -=≤==≤=>
两边对x求导得()
t n分布密度
1
22
2
12
(;)(;1,)1,.
n
x
f x n xf x n n n x R
+
-
⎫
====+∈
⎪
⎭
性质
由F分布的定义易知,
21
12
1
~(,),
(,)
F n n
F n n
或
1221
(,)(,) 1.
F n n F n n≡
期望2
2
2
,2,
2
n
EF n
n
=>
-
第一(分子)自由度为
1
n无关.
方差
2
122
2
2
122
2(2)
, 4.
(4)(2)
n n n
DF n
n n n
+-
=>
--
证明
设
1
(1,2,,)
i
X i n
= 同分布()(0,1),
id N则
1
2
22
12
222
222
()()()
n
X
X X
E E E
n n n
χχχ
===
1
222
2
121
11
22
2222
()/
()/
()/()/
n
X X X n
n n
EF E E
n n n n
χ
χχ
+++
==
2
2
1
22
2
22
(1,)()
()/
X
E E
F n Et n
n n
χ
===2
22
2
(), 2.
2
n
Dt n n
n
==>
-
或
112
1
22
1211
2
12
00
1222
(()/2)
(;,)1
(/2)(/2)
n n n
n
n n n n EF xf x n n dx x x dx
n n n n
+
-
+∞+∞⎛⎫⎛⎫
Γ+
==+
⎪ ⎪
ΓΓ⎝⎭⎝⎭
⎰⎰
设
11
11
11
22
1111
22
2222
22
,
22
n n
n n
n n n n
x y x dx y dy
n n n n
++
⎛⎫⎛⎫
++
==
⎪ ⎪
--
⎝⎭⎝⎭
112
1
1
22
21211
2
11222
(()/2)22
1
(/2)(/2)22
n n n
n
n n n n n
y y dy
n n n n n
+
+-
+∞⎛⎫⎛⎫
Γ+++
=+
⎪ ⎪
ΓΓ--
⎝⎭⎝⎭
⎰
112
1
1
22 21211
2
21222
(()/2)22
1
2((2)/2)((2)/2)22
n n n
n
n n n n n
y y dy n n n n n
+
+-
+∞⎛⎫⎛⎫
Γ+++ =+
⎪ ⎪-Γ+Γ---
⎝⎭⎝⎭
⎰
12
(2,2)
F n n
+-的密度积分为1
2
2
2
, 2.
2
n
n
n
=>
-
112
1
22
1
221211
2
12
00
1222
(()/2)
(;,)1
(/2)(/2)
n n n
n
n n n n EF x f x n n dx x x dx
n n n n
+
-+∞+∞+
⎛⎫⎛⎫
Γ+
==+
⎪ ⎪
ΓΓ⎝⎭⎝⎭⎰⎰
设
11
11
22
22
11
1111
22
2222
44
,
44
n n
n n
n n n n
x y x dx y dy
n n n n
++
++
⎛⎫⎛⎫
++
==
⎪ ⎪
--
⎝⎭⎝⎭
1121222
2
1212112
20
1
1222(()/2)441(/2)(/2)44n n n n n n n n n y
y dy n n n n n ++-
+∞
+⎛⎫
⎛⎫
Γ+++=+
⎪
⎪ΓΓ--⎝⎭
⎝⎭
⎰
112
1222
2
112
12112
01221222(2)(()/2)
441(4)(2)((4)/2)((4)/2)44n n n n n n n n n n y
y dy n n n n n n n ++-
+∞+⎛⎫⎛⎫
+Γ+++=
+ ⎪
⎪--Γ+Γ---⎝⎭⎝⎭
⎰
12(4,4)F n n +-的密度积分为1
2
12
2122(2), 4.(4)(2)
n n n n n n +=>-- 22
2
2
122
2
1222(2)(4)(2)(2)
n n n DF EF E F n n n n +=-=---- 2
12222
1222(2), 4.(4)(2)n n n n n n n +-=>-- 众数1212(2)max ,0 1.(2)n n M n n -⎧⎫
=<⎨⎬+⎩⎭
上侧分位数12112(,),(,)F n n F n n αα-
12((,)),0 1.P F F n n ααα>=<<
将α换为1α-得
112((,))1,P F F n n αα->=-
1/212/212((,)(,))1.P F n n F F n n ααα-≤≤=-
由F 分布的性质及上侧分位数的定义可得
随机理论 抽样分布
第21页 共21页 112211(,).(,)
F n n F n n αα-= 证明
2121((,)(,)),P F n n F n n αα>=
2121((,)(,))1,P F n n F n n αα<=- 由12211~(,)(,)
F n n F n n 得 12212111((,))1,(,)(,)
P F n n F n n F n n αα=>=- 由分位数的唯一性得
112211(,).(,)
F n n F n n αα-= 定理 设112,,n X X X 独立同分布(..
.i i d )总体211(,),X N μσ 212,,,n Y Y Y 独立同分布(...i i d )总体222(,),Y N μσ 两总体独立,2212
,S S 依次是两总体的样本方差,则统计量 2211122222
~(1,1).S F F n n S σσ=-- 证明
2211121(1)(1),n S n χσ-- 2222222
(1)(1),n S n χσ-- 独立, 由F 分布的定义
2
11121222222(1)(1)(1)(1)n S n F n S n σσ--=
--2211122222
~(1,1).S F n n S σσ=--。