正态总体的抽样分布.
6.3抽样分布定理
2. .
σ σ
2 1
2 S12 S2 2 2
~ F ( n1 − 1, n2 − 1) .
σ 12
2 σ2
N ( µ1 − µ 2 , + ) 3. X − Y ~ n1 n2
10
证明
1.因为 .
X ~ N ( µ1 ,
独立, 且 X 与Y 独立,则
σ
2
n1
) ,Y ~ N ( µ 2 ,
σ
2
n2
U V / ( n1 + n2 − 2)
( X −Y ) − (µ − µ ) ~ t (n + n =
1 2
Sω
1 1 + n1 n2
1
2
−2)
13
2.因为 .
( n1 −1) S
σ12
2 1
( n2 − 1) S ~ χ ( n1 − 1), 2
2
2 2
σ2
~ χ 2 ( n2 − 1),
且它们相互独立,按 F 分布的定义即得 且它们相互独立,
2
1 n 1 n E ( X ) = ∑ E ( Xi ) = ∑ µ = µ n i =1 n i =1
1 n 1 n 2 σ2 D( X ) = 2 ∑ D ( X i ) = 2 ∑σ = n i =1 n i =1 n
于是
X ~ N (µ ,
X −µ σ/ n
σ2
n
)
从而
~ N (0,1)
( n1 − 1) S12 / ( n2 − 1) S
σ
2 2
σ
2 1
( n1 − 1)
2 2
/ ( n2 − 1)
=
概率论与数理统计6.5正态总体下的抽样分布
已知 未知
已知,用S
未知,用S
*
N分布(定理6.5)
t(n-1)分布(定理6.6)
F (n1, n2 )分布(定理6.7) F (n1 1, n2 1)分布(定理6.8)
§6.5正态总体下的抽样分布
定理 6.5.1 设 X1, X 2 , , X n 为来自正态总体
N(, 2 ) 的简单随机样本, X 是样本均值,
Xi
2
35.2
P
20 i 1
Xi
2
7.4
0.975 0.005 0.97
17
例5:设某厂的灯泡使用寿命X ~ (1000, 2),单位小时
现抽样9个样本,样本方差为1002小时2。求P X 1062
解:T
X S*
~
t(n 1)
n
P
X
1062
P
X 1000 100 3
1)
n
2
E(S 2 )
2
1 n
n i1
E( Xi
)( X
) (n 1) 2
n
2 E[
1 n
n i1
(
Xi
)(
X
)]
(n
1)
n
2
2E[( X )2 ] (n 1) 2
n
2D X (n 1) 2
n
2 2 (n 1) 2 (n 1) 2
n
n
n
E(S *2 ) E( n S 2 ) n E(S 2 ) 2
P
1
2
20 i1
Xi X
2
35.2
P
1
2
20 i1
Xi X
6_2正态总体的抽样分布
一 、 正态总体样本均值和方差的分布
定理1 若(X1,X2,…,Xn)是正态总体N(, σ2)的一个样本 , X和 S 2 分别是样本均值和样本方差,则:
1° X 与 S 2 相互独立;
2° X ~ N (, 2 )
n
3°
(n 1)S 2
2
~
2 (n 1)
1 n
4°
(n 1)S 2
2
~
2 (n 1)
1 n
2 i 1
Xi X 2 ~ 2 (n 1)
《概率统计》
返回
下页
结束
证明 (1)
X ~ N(, 2 ) , X ~ N(0,1) n / n
(2)
令 U X , / n
V
(n 1)S2
2 ,
则 U ~ N (0,1), V ~ 2(n 1).
,
(
1 n1
1 ) 2 )
n2
标准化后即得
( X Y ) (1 2 ) ~ N (0,1) 11
n1 n2
《概率统计》
返回
下页
结束
(2) 令 U ( X Y ) (1 2 ) ,
11
n1 n2
则由(1)知 U ~ N (0,1)
令V
(n1
1)S12
2
(n2
1)
S
2 2
2
,
由于
(n1
4/5
4/5
2 2(0.56) 0.5754
《概率统计》
返回
下页
结束
二、 单个正态总体的抽样分布 定理2 设(X1,X2,…,Xn)为正态总体N(μ,σ2)的一个样本, 则
正态总体下的抽样分布
§1.2数理统计中常用的分布正态总体是最常见的总体, 本节介绍的几个抽样分布均对正态总体而言.1.标准正态分布2. 2分布3.t分布4.F分布o xϕ(x )定义:设X ~N (0,1),对任给的α, 0<α<1,称满足条件1、标准正态分布αϕαα==>⎰+∞dx x z X P z )(}{的点z α为标准正态分布的上α分位点.z αα例:求z0.05解:P{X≤z0.05}=1−P{X>z0.05}=1−0.05=0.95∵P{X≤1.64}=0.9495P{X≤1.65}=0.9505∴z0.05≈(1.64+1.65)/2=1.645公式: Φ(zα)=1−α常用数字575.296.1645.1005.0025.005.0===zzz定义:设X i ~N (0,1) (i =1,2,...,n ), 且它们相互独立,则称随机变量2、χ2分布221nii X χ==∑服从自由度为n 的χ2分布,记为χ2~χ2(n ).χ2分布最常用的是拟合优度检验.其中,在x > 0时收敛,称为Γ函数,具有性质1()tx te dtx +∞−−Γ=⎰(1)(),(1)1,(1/2)(1)!()x x x n n n N πΓ+=ΓΓ=Γ=Γ+=∈一般自由度为n 的χ2(n )的密度函数为12221,0()2()20,xnnn ex ng x x x −−⎧>⎪⎪=Γ⎨⎪⎪≤⎩χ2分布的密度函数图χ2~χ2(n)D Y =Di=1nX i 2=i=1n D(X i 2)=i=1n [E(X i 4)−(E(X i 2))2]=i=1n2=2n .χ2分布的基本性质(1)设Y 1~χ2 (m ), Y 2~χ2 (n ), 且Y 1 , Y 2 相互独立,则χ2 分布的可加性(2)若Y ~χ2 (n ), 则E (Y )=n ,D (Y )=2n.= 1;)(~221n m Y Y ++χY 1=i=1mX i 2,Y 2=i=m+1m+nX i 2,)(~2n m +χY 1+Y 2=i=1m+nX i2E Y =Ei=1nX i 2=i=1nE(X i 2)=i=1n[D(X i )+(E(X i ))2]=i=1n1=n ,E(X i 4)=12πන−∞+∞x 4e −x 22dx =3故(3)设X 1,…, X n 相互独立,且都服从正态分布N (μ,σ2),则;)(~)(12122n X Y ni i χμσ∑=−=(4)若Y ~χ2 分布,则当n 充分大时,近似服从N (0,1).n n Y 2−应用中心极限定理oχ2α(n )xf (x )α设χ2~χ2(n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件αχχαχα==>⎰+∞dx x f n P n )(222)()}({的点χ2α(n )为χ2(n )分布的上α分位点.χ2分布的上α分位点当n 充分大时,22)12(1)(−+≈n z n ααχ例:设X ~N (μ,σ2), (X 1,X 2,...,X 16)是取自总体X 的样本,求概率:}2)(1612{216122σμσ≤−≤∑=i iX P 解:∵X 1,X 2,...,X 16相互独立且)1,0(~N X i σμ−)16(~)(21612χσμ∑=−∴i i X}2)(1612{216122σμσ≤−≤∑=i iX P }32)(8{1612≤−≤=∑=i i X P σμ}32)({}8)({16121612>−−≥−=∑∑==i i i i X P X P σμσμ≈0.95−0.01=0.94定义:设X ~N (0,1),Y ~χ2(n ),且X 与Y 相互独立,则称随机变量3、t 分布服从自由度为n 的t 分布,记为T ~t (n )./X T Y n=T 的密度函数为:22112()1,.2n n n t x x n n n x π+−+⎛⎫Γ ⎪⎛⎫⎝⎭=+−∞<<∞ ⎪⎛⎫⎝⎭Γ ⎪⎝⎭1908年英国统计学家W.S. Gosset (笔名Student )t分布的密度函数图T~t(n)t 分布的上α分位点设T ~t (n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件(){()}()t n P T t n f x dt ααα+∞>==⎰的点t α(n )为t 分布的上α分位点.f (x )xt α(n )αt *0f (x )1-αx-t *t 分布的双侧α分位点设T ~t (n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件*{||}1P T t α<=−的数t *为t 分布的双侧α分位点.α/2t 分布的密度函数f (x )是偶函数,故**()()P T t P T t ≤−=≥***(||)()P T t P t T t <=−<<*(),2P T t α≥=于是得即*()2P T t α>=**()()P T t P T t =<−≤−**(1())()P T t P T t =−≥−≥*12()1,P T t α=−≥=−= t α/2(n )t 分布的性质(1) 其密度函数f (x )是偶函数(3) f (x )的极限为N (0,1)的密度函数,即221lim ()()2x n f x x e φπ−→∞==(2)t 1−α(n )= −t α(n )当n >45时,t α(n )≈z α例:设X , Y 1,Y 2,Y 3,Y 4 相互独立,且X ~N (2,1),令Y i ~N (0, 4),i =1, 2, 3, 4 ,解:∵X -2~N (0, 1),~t (4),即Z 服从自由度为4 的t 分布.求Z 的分布.由t 分布的定义Y i /2~N (0, 1),i = 1, 2, 3, 4 . ,)2(4412∑=−=i iY X Z ∑=−=412)2(4i i Y X Z 4)2(2412∑=−=i i Y X例:设随机变量X 与Y 相互独立,X ~ N (0,16),Y ~ N (0,9) , X 1, X 2,…, X 9与Y 1, Y 2 ,…, Y 16分别是取自X 与Y 的简单随机样本,求统计量所服从的分布.解:)169,0(~921⨯+++N X X X )1,0(~)(431921N X X X +++⨯ 2162191YY XX Z ++++=从而16,,2,1,)1,0(~31=i N Y i )16(~3122161χ∑=⎪⎭⎫ ⎝⎛i i Y 2162221921Y Y Y X X X ++++++ ()16314311612921∑=⎪⎭⎫ ⎝⎛+++⨯=i i Y X X X )16(~tt分布用于在小样本(n<30)场合下的正态分布(大样本(n≥30)场合下可以用正态分布来近似),有时候在信息不足的情况下,只能用t分布,比如在总体方差不知的情况下,对总体均值的估计和检验通常要用t统计量.12222,()2(),0()()()220,0m n m m nm n x x m nm n n m x m n f x x +−−+⎧Γ⎪+>⎪=⎨ΓΓ⎪⎪≤⎩F 的密度函数为:所服从的分布为第一自由度为m ,第二自由度为n 的F 分布,记作F ~ F (m , n ).4、F 分布则称统计量F 分布多用于比例的估计和检验!nY mX F =定义:设随机变量X 与Y 独立,且X~χ2(m),Y~χ2(n),F 分布的密度函数图F~F(m,n)F 分布的上α分位点设F ~F (m ,n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件ααα==>⎰+∞dx x f n m F F P n m F ),()()},({的点F α(m ,n )为F 分布的上α分位点.0f (x )F α(m ,n )αxF 分布的性质(1) 若F ~F (m ,n ),则(2)()~,1F F n m ),(1),(1m n F n m F αα=−}),(11{1n m F F P α−≤=∵1−α=P {F ≥F 1−α(m ,n )}}),(11{11n m F F P α−>−=αα=>⇒−}),(11{1n m F F P ),(),(11m n F n m F αα=⇒−(3)若X ~ t (n ), 则X 2~ F (1, n );mX nY F=1例:设F ~ F (24, 15) ,求F 1,F 2,F 3,使其分别满足P (F >F 1 )= 0.025 , P (F <F 2 )= 0.025 , P (F >F 3 )= 0.95 .解:(1)由m =24,n =15,α= 0. 025 ,查P192 附表6(2)无法直接查表获得,但由F 分布性质知1/F ~F (15, 24),查附表6知(3) ∵F 3 =F 0. 95(24,15), 查附表6知:∴ F 2 = 1/2.44 = 0.41 ; 由性质(2)知,025.0)11()(22=>=<F F P F F P 1F 2=F 0.025(15,24)=2.44⇒P(F <1/2.44)=0.025F 0.05(15,24)=2.11,,)24,15(1)15,24(95.0195.0−=F F .474.011.213==∴F 知F 1= F 0.025 (24, 15)= 2.70 ;抽样分布定理1. 单个正态总体的抽样分布2. 两个正态总体的抽样分布定理:设X 1,X 2,...,X n 是来自正态总体N (μ,σ2)的样本,则1. 单个正态总体的抽样分布(1)),(~2n N X σμ)1,0(~N n X σμ−⇒(2)与S 2相互独立X (3))1(~)1(222−−n S n χσ(4))1(~−−n t n S X μ1σ2n(X i −μ)2~χ2(n)(5)(1)∑==ni i X n X 11)1,0(~N n X σμ−⇒为n 个相互独立的正态X ∴服从正态分布∑==ni i X E n X E 1)(1)(=μ∑==n i i X D n X D 12)(1)(n2σ=),(~2n N X σμ∴随机变量的线性组合(4)),1,0(~N n X σμ− 且它们相互独立由t 分布的定义,)1(~1)1(22−−−−n t n S n nX σσμ)1(~−−n t n S X μ即22)1(σS n −~χ2(n −1)例:设(X 1,X 2,…,Xn )是取自总体X 的样本, 是样本均值,如果总体X ~N (μ,4),则样本容量n 应取多大才能使X 95.0}1.0|{|≥≤−μX P 解:)1,0(~ N n X σμ− }21.02||{}1.0|{|n n X P X P ≤−=≤−∴μμ}05.02)(05.0{n X n n P ≤−≤−=μ)05.0()05.0(n n −Φ−Φ=1)05.0(2−Φ=n ≥0.95975.0)05.0(≥Φ⇒n 96.105.0≥⇒n ⇒n ≥1536.64⇒n ≥1537解:),1(~)1(222−−n S n χσ由),,(~2nN X σμ又()⎪⎭⎫⎝⎛+−+n n N X X n 211,0~σ)1,0(~11N n n X X n +−+σ故212(1)~(1)1(1)n X Xn n St n n n σσ+⎛⎫−−−⎪+−⎝⎭于是)1(~11−+−+n t n nS X X n 即例:总体X ~N (μ,σ2),(X 1,X 2,…,X n ,X n +1)为样本,,求X n+1−തX S n n+1的分布.S 2=1n −1i=1n(X i −തX)2തX=1n i=1nX i定理:设总体X ~N (μ1,σ12),总体Y ~N (μ2,σ22).X 1,X 2,...,是总体X 的样本,Y 1,Y 2,...,是总体Y 的样本, 且这两个样本相互独立.则1n X 2n Y 2. 两个正态总体的抽样分布(1)),(~22212121n n N Y X σσμμ+−−(2))1,1(~2122222121−−n n F S S σσ)2(~11)()(212121−++−−−n n t n n S Y X ωμμ其中2)1()1(212222112−+−+−=n n Sn S n S ω称为混合样本方差.进一步,若σ12=σ22 =σ2,有(3)),(~221221n n N Y X σσμμ+−− )1,0(~11)()(2121N n n Y X +−−−∴σμμ2211)1(σSn −~χ2(n1−1),2222)1(σSn −~χ2(n2−1)且它们相互独立22222211)1()1(Sn Sn −+−∴~χ2(n1+n 2−2)由t 分布的定义,2)1()1(11)()(21222222112121−+−+−+−−−n n Sn Sn n n Y X σσσμμ22221121112)1()1()()(n n n n Sn S n Y X +−+−+−−−−μμ即~t (n 1+n 2−2)~t (n 1+n 2−2)小结1.理解总体、个体、样本和统计量的概念,掌握样本均值和样本方差的计算及基本性质2.掌握 2分布、t分布、F分布的定义,会查表计算3.理解正态总体的某些统计量的分布。
正态总体的抽样分布
2π −∞
−
3
x2 ∞−
x2
∫ xe 2 d (− ) = −
2π −∞
2
∫ 3
∞
x2 −
xde 2
=−
2π −∞
3 2π
⎛ x2 −
⎜⎜ xe 2 ⎝
+∞
⎞ ⎟⎟ ⎠ −∞
∫ ∫ + 3
x2 ∞−
e 2 dx =
3
x2 ∞−
e 2 d(
x
)=
3
2π −∞
π −∞
2
f
(x)
χ
2 n
分布分位点
对于给定的 α∈(0,1), 称满足条件
{ } ∫ α P
χ
2 n
>
χ
2 n
(α
)
∞
=
f (x)dx =
χn2 (α )
的点 χn2(α)为 χn2分布的上(右)α分位点。
χn2 分布上α 分位点有表可查见附表4。
n = 10 α
χ•210(0.005)
例如 由P215查得
P
(
χ
由度为n的F分布,F ~ Fm,n 又称:df1 = m, df2 = n.
其密度函数为:
f (x)
=
⎛ ⎜ ⎜ ⎜ ⎜ ⎜⎜⎝
Γ
⎛ ⎜⎝
m
+ 2
Γ
⎛ ⎜ ⎝
m 2
⎞ ⎟ ⎠
Γ
0,
n⎞ ⎟⎠
⎛n⎞
⎛ ⎜⎝
m n
π
⎞2 ⎟ ⎠
x
π 2
−1
⎛⎜1
+
⎝
m n
正态总体的常用抽样分布
特点
卡方分布在正态分布两侧有更多的面 积,即其尾部比正态分布更重。随着 自由度n的增加,卡方分布趋近于正 态分布。
04
抽样分布的应用
参数估计
1 2
参数估计
通过抽样分布,我们可以估计总体参数,如均值 和方差。常用的估计方法有矩估计和最大似然估 计。
置信区间
基于抽样分布,我们可以构建总体参数的置信区 间,从而对总体参数进行区间估计。
03
样本方差的数学期望等于总体方差,其方差随 着样本量的增加而减小。
样本偏度与峰度
样本偏度是总体偏度的无偏估计,用于衡量数据的对称性。 样本峰度是总体峰度的无偏估计,用于衡量数据分布的尖锐程度。 在正态分布中,偏度和峰度均为0,但在非正态分布中,偏度和峰度可能不为0。
03
其他常用抽样分布
t分布
中心极限定理
中心极限定理的基本思想
中心极限定理表明,无论总体分布是什么类型,只要样本量足够大,从该总体中随机抽取的样本均值将趋近于正 态分布。这意味着我们可以利用正态分布的性质来分析和推断样本均值。
中心极限定理的应用
中心极限定理在统计学中具有广泛的应用价值。例如,在制定置信区间、假设检验和回归分析等统计方法时,都 需要利用中心极限定理来处理样本数据和推断总体参数。因此,正确理解和应用中心极限定理对于统计推断的准 确性和可靠性至关重要。
THANKS
样本量大小的影响
样本量大小
样本量的大小对抽样分布的形状和稳 定性有显著影响。随着样本量增加, 抽样分布的形状逐渐接近正态分布, 且分布的离散程度逐渐减小。
样本量与精度
样本量越大,估计的精度越高,即估 计的参数值越接近真实值。因此,在 制定抽样计划时,应充分考虑样本量 的大小,以确保估计的精度满足要求。
第3节 正态总体下的抽样分布定理
(4) X和S2相互独立.
数理统计
n取不同值时 (n 1)S 2 的分布
2
数理统计
n取不同值时样本均值 X 的分布
数理统计
推论 设X1,X2,…,Xn是取自正态总体 N (, 2 )
的样本, 则有
X和S2 分别为样本均值和样本方差,
X ~ t(n 1)
Sn
X ~ N (0,1), / n
证
(1)
由定理2,
X
~
N (1
,
2 1
n1
),
Y
~
N (2
,
2 2
n2
),
且 X 与Y 相互独立,由正态分布的可加性,可得
X
Y
~
N (1
2
,
2 1
n1
2 2
)
.
n2
标准化,即得
U ( X Y ) (1 2 ) ~ N (0,1) .
2 1
2 2
n1 n2
10
数理统计
(2) 由定理2,
(n1
数理统计
第三节 正态总体下的抽样 分布定理
数理统计
定理1 设总体 X 的均值和方差均存在,EX ,
DX 2 ,对样本 ( X1, X2 ,, Xn ) 及其样本均值 X 和样本
方差 S2 ,
有 E(X) ,
2
D( X )
,
E(S2) 2
.
n
证 X1, X 2 ,, X n 相互独立,且与总体 X 同分布,故有
8
定理3
设两个正态总体 X
~
N
(
1
,
2 1
)
,Y
~
三大抽样分布
F(n1, n2)为F(n1, n2)的上侧分位点;
1 注: F1 (n1 , n2 ) F (n2 , n1 )
F (n1 , n2 )
若X 1 , Y1 ,
, X n1 来自正态总体X, X ~ N ( 1 , 12 ),
2 , Yn2 来自正态总体Y, Y ~ N ( 2 , 2 ), 且两样本独立.
当
2 ( n)
2.t 分布
关于t分布的早期理论工作,是英国统计学家威廉· 西利· 戈塞 特(Willam Sealy Gosset)在1990年进行的。 t分布是小样本分布,小样本一般是指n<30。t分布适用于 当总体标准差未知时用样本标准差s代替总体标准差σ,由
样本平均数推断总体平均数及两个小样本之间差异的显著性
χ2 分布是海尔墨特(Hermert)和卡· 皮尔生(K· Pearson) 分别于1875年和1890年导出的。它主要适用于对拟合优度检 验和独立性检验,以及对总体方差的估计和检验。 χ2 分布是一种抽样分布。当我们对正态随机变量随机地重 复抽取个数值,将每一个值变换成标准正态变量,并对这个 新的变量分别取平方再求和之后,就得到一个服从χ2分布的 变量,即
F分布的主要性质有: ①F分布是一种非对称的分布,呈右偏态; ② F分布两个自由度:n1-1和n2-1,相应的分布记作F(n1-1,n2-
1)。通常n1-1称为分子自由度, n2-1称为分母自由度。
③随n1,n2的不断增大,F分布的右偏程度逐渐减弱,但不会趋向 正态;
④具有倒数性质即若X~F(n1,n2),则1/X~F(n1,n2);
(4) t 分布是一个分布族,对于不同的样本容量对应不同的 分布,且均值都为0;随着自由度的增大,分布也逐渐趋 于标准正态分布。
4.3抽样分布
(3) X与S2相互独立
(4) X ~ t(n 1)
Sn
已知, 2未知
(5) n ( Xi )2 ~ 2 (n)
i1
已知
LOGO
例1 设总体X 服从正态分布N (12, 2 ), 抽取容量为
25的样本,求样本均值X大于12.5的概率.如果(1)已
知 12;(2)未知,但已知样本方差S2 3.6.
n1 n2
服
从
F(n1,
n
)
2
分
布
.
LOGO
4.3.2 正态总体的抽样分布
由于要求具体抽样分布是困难的,有时甚至是不可 能的。正态总体的抽样分布有详尽的研究,本节主要 学习正态总体的抽样分布。
掌握正态分布、 2分布、t分布、F分布的一些结论
对于正态总体抽样分布的学习非常有用. 主要学习单个正态总体的抽样分布以及多个正态总
i1
于是P
10
i1
Xi 2
4
P
1 0.52
10 i1
Xi2
16
查表求02.10(10) 16.由此可得
P
10 i1
Xi
2
4
0.10.
(2) 由题设及定理4.3.2, 9S 2
0.52
10
P i1
(Xi
X )2
1
2.85
P
0.52
10 i1
查表得02.25(9) 11.4,由此可求得
n
n
该定理的证明由正态分布的性质3.1.10可得。
注意:当样本来自非正态总体时,若总体均值为,方差 为 样 本量2(充有分限大且时不,X为近零似)服,从由N中(心, 极)2.限定理可以证明当
正态总体的抽样分布
⑴ nX 2 2 n 1;
⑵
⑶
D
D
X2
X2
2 n2
;
S2
2 n2
2. n 1
双正态总体的抽样分布
设 X1, X 2 ,
, Xn
是取自总体
X ~N
1
,ห้องสมุดไป่ตู้
2 1
的一个简单随机样本, Y1,Y2 , ,Ym 是取自总体
P
X 40 5/ n
n 5
2
n 5
1,
n 5
0.975
n 5
u0.975
1.96
n 96.04.
所以, 取 n 97.
例2 设 X1, X 2 , , X n 是取自总体 X ~ N 0,1
X
=
1 n
n i 1
Xi
~
N
,
2
n
即
n X ~ N 0,1
证明(2)
由于 Xi ~ N , 2 ,
即:Xi ~ N 0,1
根据卡方分布的定义,可得
n
i1
Xi
2
=
1
2
n
Xi
i 1
2
⑴抽取容量为36的样本, 求 P 38 X 43 ;
⑵问样本容量 n 多大时, 才能使 P X 40 1 0.95 ?
解⑴ 由抽样分布及 n 36 可知
X
正态总体下的抽样分布
中心极限定理是抽样分布的理论基础, 它表明无论总体分布是什么,只要样 本量足够大,样本均值的分布近似正 态分布。
样本均值的性质
无偏性
样本均值的数学期望等于总体均值, 即$text{E}(bar{x}) = mu$。
最小方差性
在所有可能的样本统计量中,样本均 值具有最小的方差,即 $text{Var}(bar{x}) = frac{sigma^2}{n}$。
数学表达式
正态分布的数学表达式为$f(x) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}$,其中$mu$是均值, $sigma$是标准差。
抽样分布的概念
抽样分布
抽样分布描述的是从某一总体中随机 抽取一定数量的样本后,这些样本统 计量(如均值、方差等)的分布情况。
大样本下样本方差的分布
卡方分布
在大样本下,样本方差通常呈现卡方分布。
方差的无偏估计
在大样本下,样本方差是总体方差的无偏估计。
方差的同方差性
在大样本下,来自不同总体的样本方差通常具有同方差性,即它们具有相同的 方差。
04
小样本下的抽样分布
小样本的定义
小样本是指从总体中随机抽取的样本 量较小,通常在30个样本以下。
THANKS
感谢观看
正态分布的性质
Байду номын сангаас01
02
03
集中性
正态分布的曲线关于均值 所在直线对称,数据值主 要集中在均值附近。
均匀性
正态分布的曲线在均值两 侧均匀下降,且下降速度 逐渐减缓。
平坦性
正态分布的曲线在均值的 两侧逐渐接近水平线,表 现出平坦的趋势。
第三章 正态分布与抽样分布
图3-5 正态分布的概率
关于正态分布,有几个概率应记住: 关于正态分布,有几个概率应记住: 一般正态分布: 一般正态分布:
P(µ-1.96σ≤x<µ+1.96σ)=0.95 1.96σ≤x<µ+1.96σ)= )=0.95 P(µ-2.58σ≤x<µ+2.58σ)=0.99 2.58σ≤x<µ+2.58σ)= )=0.99 P(µ-σ≤x<µ+σ)=0.6826 σ≤x<µ+σ)= )=0.6826 P(µ-2σ≤x<µ+2σ)=0.9545 2σ≤x<µ+2σ)= )=0.9545 P(µ-3σ≤x<µ+3σ)=0.9973 3σ≤x<µ+3σ)= )=0.9973
对于大样本资料,常将样本标准差S 对于大样本资料,常将样本标准差S 与样本均数配合使用,记为 X ± S ,用 与样本均数配合使用, 以说明所考察性状或指标的优良性与稳 定性。对于小样本资料, 定性。对于小样本资料,常将样本标准 误 SX 与样本均数 X 配合使用,记 配合使用, 为 X ± S ,用以表示所考察性状或指 标的优良性与抽样误差的大小。 标的优良性与抽样误差的大小。
学上已证明 总体的两个参数与x总体的两 总体的两个参数与x 个参数有如下关系: 个参数有如下关系:
µx = µ
σx =
σ
n
表 X 的抽样分布形式与原总体X分布形式的关系 的抽样分布形式与原总体X
2.2 均数标准误
均数标准误 σx = 的大小反映样本均数 X n 抽样误差的大小 标准误大, 的大小。 的抽样误差的大小。标准误大,说明各样本均 间差异程度大;反之,亦然。 数 X 间差异程度大;反之,亦然。 在实际工作中,总体标准差σ往往是未知的, 在实际工作中,总体标准差σ往往是未知的, σx 此时,可用样本标准差S 因而无法求得 。此时,可用样本标准差S估 S 于是, 计σ 。于是,以 估计 n 。记σx 为 n, S SX 称作样本标准误或均数标准误。 称作样本标准误或均数标准误。 是均数抽样 SX 误差的估计值。 误差的估计值。
第42讲 单个正态总体的抽样分布
定理一:设总体X ~ N (, 2 ), X1, X 2 ,, X n是样本,
2 2 1 1 ( Xi X ) . 样本均值X X i , 样本方差S n i1 n 1 i1 2 则(1) X ~ N (, ); n n
n
2 i 1
n
n
X 2 X X i nX
i 1 2 i i 1
n
i 1
2 i
2
n
2
X
i 1 n i 1
n
2 i
2 XnX nX
2
2
X nX
2 i
8
2 1 E ( S ) E[ (Xi X ) ] n 1 i 1 n 2 2 1 ( X i nX )] E[ n 1 i 1 2 2 2 1 [ E ( X i ) nE ( X )] n 1 i 1 2 2 2 2 1 [( ) n( )] n 1 i1 n 2 n n
2
i
2 2
~
(n 1)
2
2 ( X X ) i i 1 n
(2)
n i 1
( X )
i1
n
)
2
2
~ ( n)
2
2
2
(n 1) S 2
2
X 1 X ,, X n X 有一个约束条件
(X
i
2
Xi i 1
X 1 , , X n 是取自总体 X 的样本,
X , S 为样本均值和样本方差. (1) 求 E ( S );
2.5 正态总体的抽样分布
Yi ai j , i 1, 2, , n,
j 1
故Y1,Y2,...,Yn仍为正态随机变量,且
E (Yi ) aij E ( Z j ) 0.
j 1
n
由
0, i j , cov( Z i , Z j ) ij 1, i j ,
n n
i 1, 2, , n,
53.852 50.852 (1.7143) (1.1429) 6.3/ 6 6.3/ 6 0.8239
定理2 设 X ~ N ( , 2 ), X 1 , X 2 , , X n 为X的样本,则
2
证明
Yi N (0,1),
而
i 1, 2, , n. 1 Z j nZ , n
n i 1
Y1 a1 j Z j
j 1 j 1 n
n
n
2 T T T T T 2 Y Y Y ( AZ ) ( AZ ) Z ( A A ) Z Z Z Z i i, i 1
2 例6 设总体 X ~ N ( , ),从总体中抽取样本 X 1 , X 2 , , X n , X n 1 , 记 n 2 1 n 1 2 X n X i , Sn Xi X , n i 1 n 1 i 1 证明统计量
n X n 1 X n t (n 1). n 1 Sn
X 1 , X 2 , , X n为X的样本, 定理4 设总体 X ~ N ( , 2 ) , 样本均值和样本方差分别为 X 和 S 2 ,则随机变量 X t n ~ t ( n 1). S X N 0,1, 证明 根据定理1,可得 u / n
概率论与数理统计 --- 第六章{样本及抽样分布} 第四节:抽样分布
P T 1.059
0.15.
例2:
从正态总体N ( , 0.5 )中抽取样本X 1 , , X 10 .
2
数理统计
10 2 (1)已知 0,求概率P X i 4 ; i 1 10 2 (2)未知,求概率P ( X i X ) 2.85 . i 1
S1 和S2 分别是这两个样本的样本方差, 则有:
2 2
(1)
S1
2 2
S2
~ F ( n1 1, n2 1);
2 2
若两方差 1 2,则
S1 1
2 2
2 2
S2 2
~ F ( n1 1, n2 1);
(2)
X Y ( 1 2 ) ( n1 1) S1 ( n2 1) S2
n取不同值时
( n 1) S
2
2
的分布
定理3 (样本均值的分布) 数理统计 设X1, X2, …, Xn是取自正态总体 N(μ, σ2)的样本, 2 X和S 分别为样本均值和样本方差, 则有:
X S n ~ t ( n 1)
证:由定理1、和t分布的定义可得: 2
X ~ N (0,1), ( n 1) S
2) F分布的分位点:
对于给定的, 1, 称满足条件: 0
P F F ( n1 , n2 )
( y )dy
F ( n1 , n2 )
的点F ( n1 , n2 )为F ( n1 , n2 )分布的上 分位点.
F分布的上分位点的性质:
F1 ( n1 , n2 ) 1 F ( n2 , n1 )
正态总体样本均值与样本方差的分布
~ 2(n 1);
(3) X 与 S 2 相互独立.
定理6.2 设 X1, X2 ,L , Xn 是来自正态总体 N (, 2 )
的样本, X 与 S2 是样本均值与样本方差, 则
X ~ t(n 1).
S/ n
证明
因为 X ~ N (0,1), / n
(n 1)S 2
S2
1 n1
n i 1
(Xi
X
)2
6.3.1 单个正态总体的情形
定理6.1 设 X1, X2 ,L , Xn 是来自正态总体 N (, 2 )
的样本, X 与 S2 是样本均值与样本方差, 则
(1)
X
~
N
,
2
n
或
X
n
~ N 0, 1;
(2)
(n 1)S 2
2 2
nm
(2)
S12 / S22
2 1
/
2 2
~ F(n 1, m 1);
(3)
当
2 1
2 2
2
时,
( X Y ) (1 2 ) ~ t(n m 2),
Sw
1 1 nm
其中
Sw2
(n 1)S12 (m 1)S22 , nm2
在概率统计问题中,正态分布占据着十分重
要的位置,这是因为许多量的概率分布或者是正
态分布,或者接近于正态分布,而且,正态分布
有许多优良性质,便于进行较深入的理论研究。
因此,我们着重来讨论一下正态总体下的抽样分
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
问题
设 则
相互独立, 都服从正态分布
为什么?
例2 设总体X~N(0,0.32), n =10,求
解 ∵ X/0.3~N(0,1),
∴
三、t 分布
1. 定义: 设 X~N(0,1) , Y~
2
(n)
, 且X与Y
相互独立, 则称变量 所服从的分布为自由度为 n的 t 分布. T的密度函数为:
1 [( n 1) 2] x 2 n2 f ( x; n) (1 ) n (n 2) n
n
i
X )=0
无形中多了一个条件,减少了一个自由度 故为 2 ( n 1)
定理 2
(样本方差的分布)
设 X1, X2, … , Xn 是取自正态总体 N ( , 2 ) 的样本,
X 和 S2
分别为样本均值和样本方差,
2
则有
(1)
( n 1) S 2
N
~ ( n 1)
2
令Y=(X1 +X 2 +X 3 ) (X 4 +X 5 +X 6 ) 求常数C,使cY ~ 分布
2
练习
设总体X~N(0,1),样本X 1 , X 2 , X 和S 为样本均值和方差,则( (A) X ~N(0,1)
N I 1 2 i 2 2
Xn )成立
(B)n X ~ N (0,1)
对 n > 2
(2)t 分布的密度函数关于 x = 0 对称,且
Lim f ( x; n) 0
x
当n充分大时,其图形类似于标准正态分布密度
函数的图形.
很大.
不难看到,当n充分大时,
t 分布近似
N (0,1)分布. 但对于较小的n, t分布与N (0,1)分布相差
3 、 t 分布的分位点 对于给定的正数 称满足条件
例题分析 设X1,X2,X3,X4是总体
例题分析
Z
Y1 Y2 2(Y1 Y2 ) / 2 S 2S 2 /2 2
t (2)
强调 Y2与Z 独立,Y1 -Y2与Z 独立
例题分析
设X 1 , X 2 ,
, X 8是来自于总体N (0, 2 )的一个样本
(X1 -X 2 )2 ( X 3 X 4 )2 求 Y= 的分布 2 2 ( X5 X6 ) ( X7 X8 )
1 x
n1 n2
n12. 性质 (1) 由定义可见,
1 Y n2 ~ F( n2, n1) F X n1 (2) X的数学期望为: n2 E( X ) 若 n2 > 2 n2 2
即它的数学期望并不依赖于第一自由度n1.
(3)
F 分布的分位点 称满足条件
请回答
设总体X~N( , ),样本X 1 , X 2 ,
2
X n来自X
, 2未知,则下列结论(
)正确
n 1 2 2 (A) S 2 = (X -X) ~ (n-1) i n - 1 i=1
1 n (b) (X i -X)2 ~ 2 (n-1) n i=1 (c) 1
2 2 (X -X) ~ (n-1) i 2 i=1
2 2
证:EX i 0, DX i 1, X i ~ N (0,1)
2 i 4 i 2 2 i n
n
EX 1,
2 i
DX EX ( EX ) 3 1 2, i 1, 2,
所以 E 2 E ( X i2 ) EX i2 n.
D 2 D( X i2 ) DX i2 2n.
Y ~ N (μ2,σ2 2) : Y1,Y2,…,Yn2 ,它们相互独立,
则
定理3
(两总体样本均值差的分布)
2 2
且 设 X ~ N (1 , ),Y ~ N (2 , ),
X 与Y 独立,
X 1 , X 2 , …,
X n1
2 2
是取自X的样本, Y1,Y2,…,
Yn2
是
取自Y的样本, 均值, S 2
来定义.
2—分布的密度函数曲线
n x 1 1 n2 x2 e 2 f ( x; n ) 2 ( n 2 ) 0
x0 x0
2. 2分布的性质
由 分布的定义,不难得到:
(2) 设
则 这个性质叫 分布的可加性.
且X1 , X2相互独立,
( 2) E n, D 2n
的点
为
分布的“上
百分位点”。
查t 分布表,附表3 例
t的分布的双侧α 分位点为满足
取
当
时
分布上侧α 分位点
分布下侧α 分位点
分布双侧α 分位点
四、F分布 1.定义: 设
X ~ (n1 ), Y ~ (n2 ), X与Y相互独立,
2 2
则称统计量
服从自由度为n1及 n2 的F分布,
则有
N 取不同值时样本均值
X 的分布
X ~ N ( ,
2
n
)
关于
( n 1) S 2
2
~ 2 ( n 1)的简要说明
( n 1) S 2
2
=
1
2 ( X X ) i 2 i 1
n
从以上两式子看出,仅 和X 不同
但是,第一个式子,X i自由,第二式
(X
i 1
对于给定的正数
的点
为
分布的上
分位点。
关于 F 分布分位点的重要结论
表中所给的
当
都是很小的数,如0.01,0.05等
较大时,如0.95,
表中查不出,可由以上结论
休息片刻
四、几个重要的抽样分布定理 定理 1 设 (样本均值的分布)
X1,X2,…,Xn 是取自正态总体
N ( , 2 ) 的样本,
n
(d) S 2 =
1
2 2 (X -X) ~ (n) i 2 i=1
n
请回答:设总体X~N(μ,σ2),X1,X2,…,X8为
一个样本,则(
(1)
)成立。
~ t (8) (2) ~ t (7)
(3)
~ t (7)
(4)
~ t (8)
请回答:设 是样本均值,记
是来自正态总体N(μ ,σ 2)的样本,
2 2 2
(C)X ,Y 服从 分布
2 2 2
(D) X /Y 都服从F分布
2
2
练习
设总体X~N( , ),样本X 1 , X 2 ,
2
Xn来自X
样本n取多大时,有 (1)E(|X- | ) 0.1
2
(2)P(|X-| 0.1) 0.95
i 1 i 1 n
n
i 1 n
i 1
E( X )
4
x
4
1 2
e
x2 2
dx
x
x
1
3
1 2
e
x2 2
de
x2 2
3
2
1 2
e
x2 2
3 x dx 3
2
(3) 应用中心极限定理可得,若 X ~ 2 (n)
X1, X2,…, X n1 是取自X的样本, Y1,Y2,…, Yn2 是
取自Y的样本, X 和Y 分别是这两个样本的
2 均值,S12 和 S 2 分别是这两个样本的样本方差,
样本
则有
S12 12 ~ F (n1 1, n2 1) 2 2 S2 2
两个最常用统计量及三大分布的定义
1
X 和Y
分别是这两个样本的样本
和S
分别是这两个样本的样本方差,
则有
X Y ( 1 2 )
2 ( n1 1) S12 ( n2 1) S2 n1 n2 2
1 1 n1 n2
~ t ( n1 n2 2)
定理 3
(两总体样本方差比的分布)
2 设 X ~ N (1 , 12 ), Y ~ N (2 , 2 ), 且X与Y独立,
设 X: 1. 2. 若 X~N(0,1),则 X1,X2,…,Xn
四大统计量
两个正态总体
Y ~ N (μ2,σ2 2) : Y1,Y2,…,Yn2 ,它们相互独立,
(1) 若 X ~ N (μ1,σ12) : X1,X2,…,Xn1
则
(2)
当σ12 =σ22 =σ2时,
( 3)
请回答: 设X1,X2,X3,X4是总体N(0,1)的样本,则:
(C ) X ~ ( n) (D)X / s ~ t ( n 1)
练习
设X~t ( k ),问 Y=X 服从什么分布? 并确定其参数
2
练习
设随机变量X~F(m , m ), 证明 p{ X 1} p{ X 1} 0.5
练习
设随机变量X和Y都服从标准正态分布,则 (A)X+Y服从正态分布 (B)X +Y 服从 分布
记为T~t(n).
t(n) 的概率密度为
1 [( n 1) 2] x 2 n2 f ( x; n) (1 ) n (n 2) n
2. 性质 (1)具有自由度为 n 的 t 分布的随机变量 T 的 数学期望和方差为:
E( T ) = 0;
D( T ) = n / ( n - 2 ) ,
2
(2) X 和 S 相互独立.
取不同值时 的分布
2
例题分析