与正态总体有关的抽样分布定理证明
概率论与数理统计6.5正态总体下的抽样分布
已知 未知
已知,用S
未知,用S
*
N分布(定理6.5)
t(n-1)分布(定理6.6)
F (n1, n2 )分布(定理6.7) F (n1 1, n2 1)分布(定理6.8)
§6.5正态总体下的抽样分布
定理 6.5.1 设 X1, X 2 , , X n 为来自正态总体
N(, 2 ) 的简单随机样本, X 是样本均值,
Xi
2
35.2
P
20 i 1
Xi
2
7.4
0.975 0.005 0.97
17
例5:设某厂的灯泡使用寿命X ~ (1000, 2),单位小时
现抽样9个样本,样本方差为1002小时2。求P X 1062
解:T
X S*
~
t(n 1)
n
P
X
1062
P
X 1000 100 3
1)
n
2
E(S 2 )
2
1 n
n i1
E( Xi
)( X
) (n 1) 2
n
2 E[
1 n
n i1
(
Xi
)(
X
)]
(n
1)
n
2
2E[( X )2 ] (n 1) 2
n
2D X (n 1) 2
n
2 2 (n 1) 2 (n 1) 2
n
n
n
E(S *2 ) E( n S 2 ) n E(S 2 ) 2
P
1
2
20 i1
Xi X
2
35.2
P
1
2
20 i1
Xi X
正态总体下的抽样分布
§1.2数理统计中常用的分布正态总体是最常见的总体, 本节介绍的几个抽样分布均对正态总体而言.1.标准正态分布2. 2分布3.t分布4.F分布o xϕ(x )定义:设X ~N (0,1),对任给的α, 0<α<1,称满足条件1、标准正态分布αϕαα==>⎰+∞dx x z X P z )(}{的点z α为标准正态分布的上α分位点.z αα例:求z0.05解:P{X≤z0.05}=1−P{X>z0.05}=1−0.05=0.95∵P{X≤1.64}=0.9495P{X≤1.65}=0.9505∴z0.05≈(1.64+1.65)/2=1.645公式: Φ(zα)=1−α常用数字575.296.1645.1005.0025.005.0===zzz定义:设X i ~N (0,1) (i =1,2,...,n ), 且它们相互独立,则称随机变量2、χ2分布221nii X χ==∑服从自由度为n 的χ2分布,记为χ2~χ2(n ).χ2分布最常用的是拟合优度检验.其中,在x > 0时收敛,称为Γ函数,具有性质1()tx te dtx +∞−−Γ=⎰(1)(),(1)1,(1/2)(1)!()x x x n n n N πΓ+=ΓΓ=Γ=Γ+=∈一般自由度为n 的χ2(n )的密度函数为12221,0()2()20,xnnn ex ng x x x −−⎧>⎪⎪=Γ⎨⎪⎪≤⎩χ2分布的密度函数图χ2~χ2(n)D Y =Di=1nX i 2=i=1n D(X i 2)=i=1n [E(X i 4)−(E(X i 2))2]=i=1n2=2n .χ2分布的基本性质(1)设Y 1~χ2 (m ), Y 2~χ2 (n ), 且Y 1 , Y 2 相互独立,则χ2 分布的可加性(2)若Y ~χ2 (n ), 则E (Y )=n ,D (Y )=2n.= 1;)(~221n m Y Y ++χY 1=i=1mX i 2,Y 2=i=m+1m+nX i 2,)(~2n m +χY 1+Y 2=i=1m+nX i2E Y =Ei=1nX i 2=i=1nE(X i 2)=i=1n[D(X i )+(E(X i ))2]=i=1n1=n ,E(X i 4)=12πන−∞+∞x 4e −x 22dx =3故(3)设X 1,…, X n 相互独立,且都服从正态分布N (μ,σ2),则;)(~)(12122n X Y ni i χμσ∑=−=(4)若Y ~χ2 分布,则当n 充分大时,近似服从N (0,1).n n Y 2−应用中心极限定理oχ2α(n )xf (x )α设χ2~χ2(n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件αχχαχα==>⎰+∞dx x f n P n )(222)()}({的点χ2α(n )为χ2(n )分布的上α分位点.χ2分布的上α分位点当n 充分大时,22)12(1)(−+≈n z n ααχ例:设X ~N (μ,σ2), (X 1,X 2,...,X 16)是取自总体X 的样本,求概率:}2)(1612{216122σμσ≤−≤∑=i iX P 解:∵X 1,X 2,...,X 16相互独立且)1,0(~N X i σμ−)16(~)(21612χσμ∑=−∴i i X}2)(1612{216122σμσ≤−≤∑=i iX P }32)(8{1612≤−≤=∑=i i X P σμ}32)({}8)({16121612>−−≥−=∑∑==i i i i X P X P σμσμ≈0.95−0.01=0.94定义:设X ~N (0,1),Y ~χ2(n ),且X 与Y 相互独立,则称随机变量3、t 分布服从自由度为n 的t 分布,记为T ~t (n )./X T Y n=T 的密度函数为:22112()1,.2n n n t x x n n n x π+−+⎛⎫Γ ⎪⎛⎫⎝⎭=+−∞<<∞ ⎪⎛⎫⎝⎭Γ ⎪⎝⎭1908年英国统计学家W.S. Gosset (笔名Student )t分布的密度函数图T~t(n)t 分布的上α分位点设T ~t (n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件(){()}()t n P T t n f x dt ααα+∞>==⎰的点t α(n )为t 分布的上α分位点.f (x )xt α(n )αt *0f (x )1-αx-t *t 分布的双侧α分位点设T ~t (n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件*{||}1P T t α<=−的数t *为t 分布的双侧α分位点.α/2t 分布的密度函数f (x )是偶函数,故**()()P T t P T t ≤−=≥***(||)()P T t P t T t <=−<<*(),2P T t α≥=于是得即*()2P T t α>=**()()P T t P T t =<−≤−**(1())()P T t P T t =−≥−≥*12()1,P T t α=−≥=−= t α/2(n )t 分布的性质(1) 其密度函数f (x )是偶函数(3) f (x )的极限为N (0,1)的密度函数,即221lim ()()2x n f x x e φπ−→∞==(2)t 1−α(n )= −t α(n )当n >45时,t α(n )≈z α例:设X , Y 1,Y 2,Y 3,Y 4 相互独立,且X ~N (2,1),令Y i ~N (0, 4),i =1, 2, 3, 4 ,解:∵X -2~N (0, 1),~t (4),即Z 服从自由度为4 的t 分布.求Z 的分布.由t 分布的定义Y i /2~N (0, 1),i = 1, 2, 3, 4 . ,)2(4412∑=−=i iY X Z ∑=−=412)2(4i i Y X Z 4)2(2412∑=−=i i Y X例:设随机变量X 与Y 相互独立,X ~ N (0,16),Y ~ N (0,9) , X 1, X 2,…, X 9与Y 1, Y 2 ,…, Y 16分别是取自X 与Y 的简单随机样本,求统计量所服从的分布.解:)169,0(~921⨯+++N X X X )1,0(~)(431921N X X X +++⨯ 2162191YY XX Z ++++=从而16,,2,1,)1,0(~31=i N Y i )16(~3122161χ∑=⎪⎭⎫ ⎝⎛i i Y 2162221921Y Y Y X X X ++++++ ()16314311612921∑=⎪⎭⎫ ⎝⎛+++⨯=i i Y X X X )16(~tt分布用于在小样本(n<30)场合下的正态分布(大样本(n≥30)场合下可以用正态分布来近似),有时候在信息不足的情况下,只能用t分布,比如在总体方差不知的情况下,对总体均值的估计和检验通常要用t统计量.12222,()2(),0()()()220,0m n m m nm n x x m nm n n m x m n f x x +−−+⎧Γ⎪+>⎪=⎨ΓΓ⎪⎪≤⎩F 的密度函数为:所服从的分布为第一自由度为m ,第二自由度为n 的F 分布,记作F ~ F (m , n ).4、F 分布则称统计量F 分布多用于比例的估计和检验!nY mX F =定义:设随机变量X 与Y 独立,且X~χ2(m),Y~χ2(n),F 分布的密度函数图F~F(m,n)F 分布的上α分位点设F ~F (m ,n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件ααα==>⎰+∞dx x f n m F F P n m F ),()()},({的点F α(m ,n )为F 分布的上α分位点.0f (x )F α(m ,n )αxF 分布的性质(1) 若F ~F (m ,n ),则(2)()~,1F F n m ),(1),(1m n F n m F αα=−}),(11{1n m F F P α−≤=∵1−α=P {F ≥F 1−α(m ,n )}}),(11{11n m F F P α−>−=αα=>⇒−}),(11{1n m F F P ),(),(11m n F n m F αα=⇒−(3)若X ~ t (n ), 则X 2~ F (1, n );mX nY F=1例:设F ~ F (24, 15) ,求F 1,F 2,F 3,使其分别满足P (F >F 1 )= 0.025 , P (F <F 2 )= 0.025 , P (F >F 3 )= 0.95 .解:(1)由m =24,n =15,α= 0. 025 ,查P192 附表6(2)无法直接查表获得,但由F 分布性质知1/F ~F (15, 24),查附表6知(3) ∵F 3 =F 0. 95(24,15), 查附表6知:∴ F 2 = 1/2.44 = 0.41 ; 由性质(2)知,025.0)11()(22=>=<F F P F F P 1F 2=F 0.025(15,24)=2.44⇒P(F <1/2.44)=0.025F 0.05(15,24)=2.11,,)24,15(1)15,24(95.0195.0−=F F .474.011.213==∴F 知F 1= F 0.025 (24, 15)= 2.70 ;抽样分布定理1. 单个正态总体的抽样分布2. 两个正态总体的抽样分布定理:设X 1,X 2,...,X n 是来自正态总体N (μ,σ2)的样本,则1. 单个正态总体的抽样分布(1)),(~2n N X σμ)1,0(~N n X σμ−⇒(2)与S 2相互独立X (3))1(~)1(222−−n S n χσ(4))1(~−−n t n S X μ1σ2n(X i −μ)2~χ2(n)(5)(1)∑==ni i X n X 11)1,0(~N n X σμ−⇒为n 个相互独立的正态X ∴服从正态分布∑==ni i X E n X E 1)(1)(=μ∑==n i i X D n X D 12)(1)(n2σ=),(~2n N X σμ∴随机变量的线性组合(4)),1,0(~N n X σμ− 且它们相互独立由t 分布的定义,)1(~1)1(22−−−−n t n S n nX σσμ)1(~−−n t n S X μ即22)1(σS n −~χ2(n −1)例:设(X 1,X 2,…,Xn )是取自总体X 的样本, 是样本均值,如果总体X ~N (μ,4),则样本容量n 应取多大才能使X 95.0}1.0|{|≥≤−μX P 解:)1,0(~ N n X σμ− }21.02||{}1.0|{|n n X P X P ≤−=≤−∴μμ}05.02)(05.0{n X n n P ≤−≤−=μ)05.0()05.0(n n −Φ−Φ=1)05.0(2−Φ=n ≥0.95975.0)05.0(≥Φ⇒n 96.105.0≥⇒n ⇒n ≥1536.64⇒n ≥1537解:),1(~)1(222−−n S n χσ由),,(~2nN X σμ又()⎪⎭⎫⎝⎛+−+n n N X X n 211,0~σ)1,0(~11N n n X X n +−+σ故212(1)~(1)1(1)n X Xn n St n n n σσ+⎛⎫−−−⎪+−⎝⎭于是)1(~11−+−+n t n nS X X n 即例:总体X ~N (μ,σ2),(X 1,X 2,…,X n ,X n +1)为样本,,求X n+1−തX S n n+1的分布.S 2=1n −1i=1n(X i −തX)2തX=1n i=1nX i定理:设总体X ~N (μ1,σ12),总体Y ~N (μ2,σ22).X 1,X 2,...,是总体X 的样本,Y 1,Y 2,...,是总体Y 的样本, 且这两个样本相互独立.则1n X 2n Y 2. 两个正态总体的抽样分布(1)),(~22212121n n N Y X σσμμ+−−(2))1,1(~2122222121−−n n F S S σσ)2(~11)()(212121−++−−−n n t n n S Y X ωμμ其中2)1()1(212222112−+−+−=n n Sn S n S ω称为混合样本方差.进一步,若σ12=σ22 =σ2,有(3)),(~221221n n N Y X σσμμ+−− )1,0(~11)()(2121N n n Y X +−−−∴σμμ2211)1(σSn −~χ2(n1−1),2222)1(σSn −~χ2(n2−1)且它们相互独立22222211)1()1(Sn Sn −+−∴~χ2(n1+n 2−2)由t 分布的定义,2)1()1(11)()(21222222112121−+−+−+−−−n n Sn Sn n n Y X σσσμμ22221121112)1()1()()(n n n n Sn S n Y X +−+−+−−−−μμ即~t (n 1+n 2−2)~t (n 1+n 2−2)小结1.理解总体、个体、样本和统计量的概念,掌握样本均值和样本方差的计算及基本性质2.掌握 2分布、t分布、F分布的定义,会查表计算3.理解正态总体的某些统计量的分布。
4抽样分布定理
6.3 抽样分布定理
下证Y1 ,Y2 ,,Yn相互独立且均服从正态分布N (0, 2 )
事实上:
由定理2.4.6易知,Y1 , Y2 , , Yn的联合密度函数为 其中J B 1 , 故|J |= |B 1 | 1 g y1 , y2 , yn f X1 ,, X n ( x ( ,x( )| J | 1 y1 , , yn), n y1 , , yn)
易知B是正交矩阵
6.3 抽样分布定理
则 1 Y X 1 1 [ X1 X 2 ] 1 2 1 Y2 X2 [ X1 X 2 2 X 3 ] 2 3 Y BX B 1 Y X [ X 1 X 2 X n 1 X n ] n 1 n 1 ( n 1) n 1 [X X X X ] 2 n 1 n Yn Xn n 1 为正交线性变换。 (6.3.1)
i 1
n
1
2
1
)
n
e
i 1
n
xi2 2 2
(
1
2
2 x i 2 2 i 1 n ( ) e
1
n
2
) e
n
1 2
2
X X
g y1 , y2 , yn f X1 ,, X n x1 y1 , , yn , ,xn y1 , , yn | J | f X1 ,, X n B Y (
若X~F(m,n), X的概率密度为
mn m 1 m n 2 x 2 2 2 f x; m , n m n mn m n mx n 2 2 2
正态总体的抽样分布
2π −∞
−
3
x2 ∞−
x2
∫ xe 2 d (− ) = −
2π −∞
2
∫ 3
∞
x2 −
xde 2
=−
2π −∞
3 2π
⎛ x2 −
⎜⎜ xe 2 ⎝
+∞
⎞ ⎟⎟ ⎠ −∞
∫ ∫ + 3
x2 ∞−
e 2 dx =
3
x2 ∞−
e 2 d(
x
)=
3
2π −∞
π −∞
2
f
(x)
χ
2 n
分布分位点
对于给定的 α∈(0,1), 称满足条件
{ } ∫ α P
χ
2 n
>
χ
2 n
(α
)
∞
=
f (x)dx =
χn2 (α )
的点 χn2(α)为 χn2分布的上(右)α分位点。
χn2 分布上α 分位点有表可查见附表4。
n = 10 α
χ•210(0.005)
例如 由P215查得
P
(
χ
由度为n的F分布,F ~ Fm,n 又称:df1 = m, df2 = n.
其密度函数为:
f (x)
=
⎛ ⎜ ⎜ ⎜ ⎜ ⎜⎜⎝
Γ
⎛ ⎜⎝
m
+ 2
Γ
⎛ ⎜ ⎝
m 2
⎞ ⎟ ⎠
Γ
0,
n⎞ ⎟⎠
⎛n⎞
⎛ ⎜⎝
m n
π
⎞2 ⎟ ⎠
x
π 2
−1
⎛⎜1
+
⎝
m n
正态总体的常用抽样分布
特点
卡方分布在正态分布两侧有更多的面 积,即其尾部比正态分布更重。随着 自由度n的增加,卡方分布趋近于正 态分布。
04
抽样分布的应用
参数估计
1 2
参数估计
通过抽样分布,我们可以估计总体参数,如均值 和方差。常用的估计方法有矩估计和最大似然估 计。
置信区间
基于抽样分布,我们可以构建总体参数的置信区 间,从而对总体参数进行区间估计。
03
样本方差的数学期望等于总体方差,其方差随 着样本量的增加而减小。
样本偏度与峰度
样本偏度是总体偏度的无偏估计,用于衡量数据的对称性。 样本峰度是总体峰度的无偏估计,用于衡量数据分布的尖锐程度。 在正态分布中,偏度和峰度均为0,但在非正态分布中,偏度和峰度可能不为0。
03
其他常用抽样分布
t分布
中心极限定理
中心极限定理的基本思想
中心极限定理表明,无论总体分布是什么类型,只要样本量足够大,从该总体中随机抽取的样本均值将趋近于正 态分布。这意味着我们可以利用正态分布的性质来分析和推断样本均值。
中心极限定理的应用
中心极限定理在统计学中具有广泛的应用价值。例如,在制定置信区间、假设检验和回归分析等统计方法时,都 需要利用中心极限定理来处理样本数据和推断总体参数。因此,正确理解和应用中心极限定理对于统计推断的准 确性和可靠性至关重要。
THANKS
样本量大小的影响
样本量大小
样本量的大小对抽样分布的形状和稳 定性有显著影响。随着样本量增加, 抽样分布的形状逐渐接近正态分布, 且分布的离散程度逐渐减小。
样本量与精度
样本量越大,估计的精度越高,即估 计的参数值越接近真实值。因此,在 制定抽样计划时,应充分考虑样本量 的大小,以确保估计的精度满足要求。
数理统计几个重要定理
几个重要的抽样分布定理
数理统计
定理 1 (样本均值的分布) 设 X1, X2, …, Xn 是来自正态总体 的样本, X 是样本均值,则有
N ( , )
2
2 X ~ N ( , ) n
X 即 ~ N (0,1) n
数理统计
定理 2 (样本方差的分布) 设X1,X2,…,Xn是来自正态总体
X ~ t ( n 1) S n
数理统计
定理 4 (两总体样本均值差、样本方差比的分布) 且X与Y独立, 设X ~ N ( 1, 2 ),Y ~ N ( 2 , 2 ), X1,X2,…, X n是来自X的样本,Y1,Y2,…,Yn 是取自Y的样本, 1 2 X和Y 分别是这两个样本的 样本均值, S 2和S 2 分别是
2
N ( , ) 的样本,(1) ( n 1) S 2
(2)
2 2 X 与S 独立 .
~ 2 ( n 1)
数理统计
定理 3 (样本均值的分布) 设X1,X2,…,Xn是取自正态总体 的样本, 则有
2
N ( , )
2
X 和S 分别为样本均值和样本方差,
1 2
这两个样本的样本方差,则有
S 1、 ~ F ( n1 1, n2 1) S X Y ( 1 2 ) 2、 ~ t ( n1 n2 2) ( n1 1) S12 ( n2 1) S22 1 1 n1 n2 2 n1 n2
2 1 2 2 2 1 2 2
第3节 正态总体下的抽样分布定理
(4) X和S2相互独立.
数理统计
n取不同值时 (n 1)S 2 的分布
2
数理统计
n取不同值时样本均值 X 的分布
数理统计
推论 设X1,X2,…,Xn是取自正态总体 N (, 2 )
的样本, 则有
X和S2 分别为样本均值和样本方差,
X ~ t(n 1)
Sn
X ~ N (0,1), / n
证
(1)
由定理2,
X
~
N (1
,
2 1
n1
),
Y
~
N (2
,
2 2
n2
),
且 X 与Y 相互独立,由正态分布的可加性,可得
X
Y
~
N (1
2
,
2 1
n1
2 2
)
.
n2
标准化,即得
U ( X Y ) (1 2 ) ~ N (0,1) .
2 1
2 2
n1 n2
10
数理统计
(2) 由定理2,
(n1
数理统计
第三节 正态总体下的抽样 分布定理
数理统计
定理1 设总体 X 的均值和方差均存在,EX ,
DX 2 ,对样本 ( X1, X2 ,, Xn ) 及其样本均值 X 和样本
方差 S2 ,
有 E(X) ,
2
D( X )
,
E(S2) 2
.
n
证 X1, X 2 ,, X n 相互独立,且与总体 X 同分布,故有
8
定理3
设两个正态总体 X
~
N
(
1
,
2 1
)
,Y
~
4.3抽样分布
(3) X与S2相互独立
(4) X ~ t(n 1)
Sn
已知, 2未知
(5) n ( Xi )2 ~ 2 (n)
i1
已知
LOGO
例1 设总体X 服从正态分布N (12, 2 ), 抽取容量为
25的样本,求样本均值X大于12.5的概率.如果(1)已
知 12;(2)未知,但已知样本方差S2 3.6.
n1 n2
服
从
F(n1,
n
)
2
分
布
.
LOGO
4.3.2 正态总体的抽样分布
由于要求具体抽样分布是困难的,有时甚至是不可 能的。正态总体的抽样分布有详尽的研究,本节主要 学习正态总体的抽样分布。
掌握正态分布、 2分布、t分布、F分布的一些结论
对于正态总体抽样分布的学习非常有用. 主要学习单个正态总体的抽样分布以及多个正态总
i1
于是P
10
i1
Xi 2
4
P
1 0.52
10 i1
Xi2
16
查表求02.10(10) 16.由此可得
P
10 i1
Xi
2
4
0.10.
(2) 由题设及定理4.3.2, 9S 2
0.52
10
P i1
(Xi
X )2
1
2.85
P
0.52
10 i1
查表得02.25(9) 11.4,由此可求得
n
n
该定理的证明由正态分布的性质3.1.10可得。
注意:当样本来自非正态总体时,若总体均值为,方差 为 样 本量2(充有分限大且时不,X为近零似)服,从由N中(心, 极)2.限定理可以证明当
16几个常用的抽样分布与抽样分布定理
(s
0),
(s 1)
s (s) ,(12)
3
3.性质:
1)期望与方差
提示: 2
X
2 1
X
2 n
若 2 ~ 2(n),则 E( 2)= n,D( 2)=2n
证明: 因为Xi~N(0, 1)
所以
E
(
X
2 i
)
D( Xi
) [E( Xi
)]2
1 0 1
D(
X
2 i
)
E
(
X
4 i
)
[
2 1
/
2 2
~
F (n1
1, n2
1)
29
定理2结论(3)
假定
2 1
2 2
2,
就有
t T ( X Y ) (1 2 ) ~ S 1 n1 1 n2
(n1 n2 2)
其中
S2
(n11)S12 (n2 1)S22 n1 n 2 2
即
( X Y ) (1 2 )
13
T 的概率密度为
(s) xs1e x d x (s 0),
0
f (t)
( n 1) 2
(1
t2
)
n1
2,
(12)
t
n ( n) n
2
14
2.基本性质:
(1) f ( t ) 关于 t = 0(纵轴)对称。
(2) f ( t ) 的极限为 N(0, 1) 的密度函数,即
lim f (t) (t)
标准化
定理1:设总体 X ~ N ( , 2 ) ,X1, X2,…, Xn 是
来自总体 X 的样本,
正态总体下的抽样分布
中心极限定理是抽样分布的理论基础, 它表明无论总体分布是什么,只要样 本量足够大,样本均值的分布近似正 态分布。
样本均值的性质
无偏性
样本均值的数学期望等于总体均值, 即$text{E}(bar{x}) = mu$。
最小方差性
在所有可能的样本统计量中,样本均 值具有最小的方差,即 $text{Var}(bar{x}) = frac{sigma^2}{n}$。
数学表达式
正态分布的数学表达式为$f(x) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}$,其中$mu$是均值, $sigma$是标准差。
抽样分布的概念
抽样分布
抽样分布描述的是从某一总体中随机 抽取一定数量的样本后,这些样本统 计量(如均值、方差等)的分布情况。
大样本下样本方差的分布
卡方分布
在大样本下,样本方差通常呈现卡方分布。
方差的无偏估计
在大样本下,样本方差是总体方差的无偏估计。
方差的同方差性
在大样本下,来自不同总体的样本方差通常具有同方差性,即它们具有相同的 方差。
04
小样本下的抽样分布
小样本的定义
小样本是指从总体中随机抽取的样本 量较小,通常在30个样本以下。
THANKS
感谢观看
正态分布的性质
Байду номын сангаас01
02
03
集中性
正态分布的曲线关于均值 所在直线对称,数据值主 要集中在均值附近。
均匀性
正态分布的曲线在均值两 侧均匀下降,且下降速度 逐渐减缓。
平坦性
正态分布的曲线在均值的 两侧逐渐接近水平线,表 现出平坦的趋势。
第三章 正态分布与抽样分布
图3-5 正态分布的概率
关于正态分布,有几个概率应记住: 关于正态分布,有几个概率应记住: 一般正态分布: 一般正态分布:
P(µ-1.96σ≤x<µ+1.96σ)=0.95 1.96σ≤x<µ+1.96σ)= )=0.95 P(µ-2.58σ≤x<µ+2.58σ)=0.99 2.58σ≤x<µ+2.58σ)= )=0.99 P(µ-σ≤x<µ+σ)=0.6826 σ≤x<µ+σ)= )=0.6826 P(µ-2σ≤x<µ+2σ)=0.9545 2σ≤x<µ+2σ)= )=0.9545 P(µ-3σ≤x<µ+3σ)=0.9973 3σ≤x<µ+3σ)= )=0.9973
对于大样本资料,常将样本标准差S 对于大样本资料,常将样本标准差S 与样本均数配合使用,记为 X ± S ,用 与样本均数配合使用, 以说明所考察性状或指标的优良性与稳 定性。对于小样本资料, 定性。对于小样本资料,常将样本标准 误 SX 与样本均数 X 配合使用,记 配合使用, 为 X ± S ,用以表示所考察性状或指 标的优良性与抽样误差的大小。 标的优良性与抽样误差的大小。
学上已证明 总体的两个参数与x总体的两 总体的两个参数与x 个参数有如下关系: 个参数有如下关系:
µx = µ
σx =
σ
n
表 X 的抽样分布形式与原总体X分布形式的关系 的抽样分布形式与原总体X
2.2 均数标准误
均数标准误 σx = 的大小反映样本均数 X n 抽样误差的大小 标准误大, 的大小。 的抽样误差的大小。标准误大,说明各样本均 间差异程度大;反之,亦然。 数 X 间差异程度大;反之,亦然。 在实际工作中,总体标准差σ往往是未知的, 在实际工作中,总体标准差σ往往是未知的, σx 此时,可用样本标准差S 因而无法求得 。此时,可用样本标准差S估 S 于是, 计σ 。于是,以 估计 n 。记σx 为 n, S SX 称作样本标准误或均数标准误。 称作样本标准误或均数标准误。 是均数抽样 SX 误差的估计值。 误差的估计值。
第42讲 单个正态总体的抽样分布
定理一:设总体X ~ N (, 2 ), X1, X 2 ,, X n是样本,
2 2 1 1 ( Xi X ) . 样本均值X X i , 样本方差S n i1 n 1 i1 2 则(1) X ~ N (, ); n n
n
2 i 1
n
n
X 2 X X i nX
i 1 2 i i 1
n
i 1
2 i
2
n
2
X
i 1 n i 1
n
2 i
2 XnX nX
2
2
X nX
2 i
8
2 1 E ( S ) E[ (Xi X ) ] n 1 i 1 n 2 2 1 ( X i nX )] E[ n 1 i 1 2 2 2 1 [ E ( X i ) nE ( X )] n 1 i 1 2 2 2 2 1 [( ) n( )] n 1 i1 n 2 n n
2
i
2 2
~
(n 1)
2
2 ( X X ) i i 1 n
(2)
n i 1
( X )
i1
n
)
2
2
~ ( n)
2
2
2
(n 1) S 2
2
X 1 X ,, X n X 有一个约束条件
(X
i
2
Xi i 1
X 1 , , X n 是取自总体 X 的样本,
X , S 为样本均值和样本方差. (1) 求 E ( S );
2.5 正态总体的抽样分布
Yi ai j , i 1, 2, , n,
j 1
故Y1,Y2,...,Yn仍为正态随机变量,且
E (Yi ) aij E ( Z j ) 0.
j 1
n
由
0, i j , cov( Z i , Z j ) ij 1, i j ,
n n
i 1, 2, , n,
53.852 50.852 (1.7143) (1.1429) 6.3/ 6 6.3/ 6 0.8239
定理2 设 X ~ N ( , 2 ), X 1 , X 2 , , X n 为X的样本,则
2
证明
Yi N (0,1),
而
i 1, 2, , n. 1 Z j nZ , n
n i 1
Y1 a1 j Z j
j 1 j 1 n
n
n
2 T T T T T 2 Y Y Y ( AZ ) ( AZ ) Z ( A A ) Z Z Z Z i i, i 1
2 例6 设总体 X ~ N ( , ),从总体中抽取样本 X 1 , X 2 , , X n , X n 1 , 记 n 2 1 n 1 2 X n X i , Sn Xi X , n i 1 n 1 i 1 证明统计量
n X n 1 X n t (n 1). n 1 Sn
X 1 , X 2 , , X n为X的样本, 定理4 设总体 X ~ N ( , 2 ) , 样本均值和样本方差分别为 X 和 S 2 ,则随机变量 X t n ~ t ( n 1). S X N 0,1, 证明 根据定理1,可得 u / n
抽样分布定理
f(x)=P(X=k)=pk(1-p)1-k
(2)二项分布
r r n r f(x)=P(X=x)= C n p q
k=0,1
(3)正态分布
X ~ N( μ, σ 2 ) 一般正态分布
X ~ N (0, 1)
标准正态分布
要求:能利用附表求取事件发生的概率
目的:根据概率进行决策 方法:
X 3 1.2 3 P( X 1.2) P( ) 正态分布标准化 3 3 X 3 P( 1.4) 3
X1~X10构成了一个随机变量系
所有均值构成了一个样本均值总体
所有方差和标准差也分别构成了样本方差总体和标准差总体
抽样分布定理一
任意总体:E(X) ,D(X)
2
随机抽样 : 得独立同分布的随机变量系:
X 1, X 2,, Xn
1 X X n
i
1 n E( X ) X n n
利用附表1查P(U<-1.4)的概率
附表1
U -2.90 -2.80 -2.70 -2.60 -2.50 -2.40 -2.30 -2.20 -2.10 -2.00 -1.90 -1.80 -1.70 -1.60 -1.50 -1.40 -1.30 -1.20 -1.10 -1.00 -0.09 0.0014 0.0019 0.0026 0.0036 0.0048 0.0064 0.0084 0.0110 0.0143 0.0183 0.0233 0.0294 0.0367 0.0455 0.0559 0.0681 0.0823 0.0985 0.1170 0.1379 -0.08 0.0014 0.0020 0.0027 0.0037 0.0049 0.0066 0.0087 0.0113 0.0146 0.0188 0.0239 0.0301 0.0375 0.0465 0.0571 0.0694 0.0838 0.1003 0.1190 0.1401 -0.07 0.0015 0.0021 0.0028 0.0038 0.0051 0.0068 0.0089 0.0116 0.0150 0.0192 0.0244 0.0307 0.0384 0.0475 0.0582 0.0708 0.0853 0.1020 0.1210 0.1423 -0.06 0.0015 0.0021 0.0029 0.0039 0.0052 0.0069 0.0091 0.0119 0.0154 0.0197 0.0250 0.0314 0.0392 0.0485 0.0594 0.0721 0.0869 0.1038 0.1230 0.1446 -0.05 0.0016 0.0022 0.0030 0.0040 0.0054 0.0071 0.0094 0.0122 0.0158 0.0202 0.0256 0.0322 0.0401 0.0495 0.0606 0.0735 0.0885 0.1056 0.1251 0.1469 -0.04 0.0016 0.0023 0.0031 0.0041 0.0055 0.0073 0.0096 0.0125 0.0162 0.0207 0.0262 0.0329 0.0409 0.0505 0.0618 0.0749 0.0901 0.1075 0.1271 0.1492 -0.03 0.0017 0.0023 0.0032 0.0043 0.0057 0.0075 0.0099 0.0129 0.0166 0.0212 0.0268 0.0336 0.0418 0.0516 0.0630 0.0764 0.0918 0.1093 0.1292 0.1515 -0.02 0.0018 0.0024 0.0033 0.0044 0.0059 0.0078 0.0102 0.0132 0.0170 0.0217 0.0274 0.0344 0.0427 0.0526 0.0643 0.0778 0.0934 0.1112 0.1314 0.1539 -0.01 0.0018 0.0025 0.0034 0.0045 0.0060 0.0080 0.0104 0.0136 0.0174 0.0222 0.0281 0.0351 0.0436 0.0537 0.0655 0.0793 0.0951 0.1131 0.1335 0.1562 0.00 0.0019 0.0026 0.0035 0.0047 0.0062 0.0082 0.0107 0.0139 0.0179 0.0228 0.0287 0.0359 0.0446 0.0548 0.0668 0.0808 0.0968 0.1151 0.1357 0.1587
3-多元正态抽样分布
n
X
2 i
~
2 (n)
i 1
一、维希特(Wishart) 1、定义随机矩阵的分布
x11 x12
设随机矩阵X
x21
x22
xn1
xn2
x1p
x2
p
xnp
矩阵中的每一个元素均为随机变量,则矩阵X的分布是其行 向量拉长,组成一个长向量
x1
p
x2 p
xn1 x11 x12
xn 2
x21
x22
xnp
xn1
xn 2
x1p
x2
p
xnp
n
W X il X lj l 1
服从自由度为 n 的非中心维斯特分布,记为W ~ Wp (n,。, μ)
0 )
n(x 0)1(x 0)
服从自由度为 p的卡方分布。
证:
由于样本均值
x
~
Np
(
,
1 n
)
令
1
n 2 (X )
1
E() E[ n 2 (X )]
1
D() D[ n 2 (X )] p
1
n 2 (X ) ~ N p (o,I)
A (X j X)(X j X)
j n1
A XiXi nXX
i n1
A XiXi nn
i 1
A n1