正态总体的抽样分布

合集下载

抽样方法用样本估计总体及正态分布

抽样方法用样本估计总体及正态分布
【解析】当x=24时,按规则可知所抽取样本 的第5个号码为:400+(24+33×4-100)= 456.
64 0.4
8.为了解学生身高情况,某校以10%的比例对全校 700名学生按性别进行分层抽样调查,测得身高情况 的统计图如下:
(1)估计该校男生的人数;
(2)估计该校学生身高在170~185cm之间的概 率;
5.对于每个个体所取不同数值较少的总体,常用条 形图表示其样本分布,而对于每个个体所取不同数 值较多或可以在实数区间内取值的总体,常用频率 分布直方图表示其分布.
6.在用样本的频率分布估计总体分布时,要清楚以 下概念:频率分布折线图,总体密度曲线,茎叶图.
用样本的数字特征估计总体的数字特征,要理解以下 概念:
(3)从样本中身高在165~180cm之间的女生中 任选2人,求至少有1人身高在170~180cm之 间的概率.
C
m=n
6.一个总体中的1000个个体编号为0,1,2,…, 999,并依次将其分为10个小组,组号为0,1,2, …,9,要用系统抽样方法抽取一个容量为10的 样本,规定如果在第0组随机抽取的号码为x,那 么依次错位地得到后面各组的号码,即第k组中 抽取的号码的后两位数为x+33k的后两位数.当 x=24时,所抽样本的第5个号码是 456 .
抽样方法用样本估计总体及 正态分布
【学习目标】
1.了解简单随机抽样,系统抽样和分层抽样的方法, 会画频率分布直方图和茎叶图.
2.了解用样本估计总体的思想,会用样本的频率分布 估计总体分布,会用样本的基本数字特征估计总体的 基本数字特征;初步体会样本频率分布和数字特征的 随机性.
3.了解正态分布曲线的特点及曲线表示的意义.
【点评】高考中关于直方图及其应用的考查大有 加强的趋势,因此既要会作相关统计数据的直方 图,又要会观察直方图,提升识图能力,同时还 要加强与概率问题的综合.

正态总体的抽样分布

正态总体的抽样分布
∞ 3x2e− 2 dx =
2π −∞

3
x2 ∞−
x2
∫ xe 2 d (− ) = −
2π −∞
2
∫ 3

x2 −
xde 2
=−
2π −∞
3 2π
⎛ x2 −
⎜⎜ xe 2 ⎝
+∞
⎞ ⎟⎟ ⎠ −∞
∫ ∫ + 3
x2 ∞−
e 2 dx =
3
x2 ∞−
e 2 d(
x
)=
3
2π −∞
π −∞
2
f
(x)
χ
2 n
分布分位点
对于给定的 α∈(0,1), 称满足条件
{ } ∫ α P
χ
2 n
>
χ
2 n

)

=
f (x)dx =
χn2 (α )
的点 χn2(α)为 χn2分布的上(右)α分位点。
χn2 分布上α 分位点有表可查见附表4。
n = 10 α
χ•210(0.005)
例如 由P215查得
P
(
χ
由度为n的F分布,F ~ Fm,n 又称:df1 = m, df2 = n.
其密度函数为:
f (x)
=
⎛ ⎜ ⎜ ⎜ ⎜ ⎜⎜⎝
Γ
⎛ ⎜⎝
m
+ 2
Γ
⎛ ⎜ ⎝
m 2
⎞ ⎟ ⎠
Γ
0,
n⎞ ⎟⎠
⎛n⎞
⎛ ⎜⎝
m n
π
⎞2 ⎟ ⎠
x
π 2
−1
⎛⎜1
+

m n

正态总体的常用抽样分布

正态总体的常用抽样分布

特点
卡方分布在正态分布两侧有更多的面 积,即其尾部比正态分布更重。随着 自由度n的增加,卡方分布趋近于正 态分布。
04
抽样分布的应用
参数估计
1 2
参数估计
通过抽样分布,我们可以估计总体参数,如均值 和方差。常用的估计方法有矩估计和最大似然估 计。
置信区间
基于抽样分布,我们可以构建总体参数的置信区 间,从而对总体参数进行区间估计。
03
样本方差的数学期望等于总体方差,其方差随 着样本量的增加而减小。
样本偏度与峰度
样本偏度是总体偏度的无偏估计,用于衡量数据的对称性。 样本峰度是总体峰度的无偏估计,用于衡量数据分布的尖锐程度。 在正态分布中,偏度和峰度均为0,但在非正态分布中,偏度和峰度可能不为0。
03
其他常用抽样分布
t分布
中心极限定理
中心极限定理的基本思想
中心极限定理表明,无论总体分布是什么类型,只要样本量足够大,从该总体中随机抽取的样本均值将趋近于正 态分布。这意味着我们可以利用正态分布的性质来分析和推断样本均值。
中心极限定理的应用
中心极限定理在统计学中具有广泛的应用价值。例如,在制定置信区间、假设检验和回归分析等统计方法时,都 需要利用中心极限定理来处理样本数据和推断总体参数。因此,正确理解和应用中心极限定理对于统计推断的准 确性和可靠性至关重要。
THANKS
样本量大小的影响
样本量大小
样本量的大小对抽样分布的形状和稳 定性有显著影响。随着样本量增加, 抽样分布的形状逐渐接近正态分布, 且分布的离散程度逐渐减小。
样本量与精度
样本量越大,估计的精度越高,即估 计的参数值越接近真实值。因此,在 制定抽样计划时,应充分考虑样本量 的大小,以确保估计的精度满足要求。

正态总体下的四大分布

正态总体下的四大分布

《概率论与数理统计》第六章样本及抽样分布(2)正态总体下的四大分布:正态分布设n x x x ,,,21 为来自正态总体),(2σμN 的一个样本,则样本函数).1,0(~/N nx udefσμ-例:设总体ξ~212(1,2),,,n N ξξξ 且是取自ξ的样本,则(D )A)1(0,1)2N ξ-B)1(0,1)4N ξ-C)()1(0,1)2N ξ-D)(0,1)N ξt 分布设n x x x ,,,21 为来自正态总体),(2σμN 的一个样本,则样本函数),1(~/--n t ns x tdefμ其中t(n-1)表示自由度为n-1的t 分布。

分布2χ设n x x x ,,,21 为来自正态总体),(2σμN 的一个样本,则样本函数),1(~)1(222--n S n wdefχσ其中)1(2-n χ表示自由度为n-1的2χ分布例:已知F 0.1(7,20)=2.04,则F 0.9(20,7)=_______0.4902_____.例.对于给定的正数α,10<<α,设αu ,)(2n αχ,)(n t α,),(21n n F α分别是)1,0(N ,)(2n χ,)(n t ,),(21n n F 分布的下α分位数,则下面结论中不正确...的是(B )(A)αα--=1u u (B))()(221n n ααχχ-=-(C))()(1n t n t αα--=(D)),(1),(12211n n F αα=-2、设X 、Y 相互独立,且都服从标准正态分布,则Z =2Y X 服从______t(1)_____分布(同时要写出分布的参数).3.设ξ和η相互独立且都服从N(0,4),而41,ξξ 和41,ηη 分别是来自总体ξ和η的样本,则统计量242141......ηηξξ++++=U 服从的分布为)4(t 。

第3节 正态总体下的抽样分布定理

第3节 正态总体下的抽样分布定理

(4) X和S2相互独立.
数理统计
n取不同值时 (n 1)S 2 的分布
2
数理统计
n取不同值时样本均值 X 的分布
数理统计
推论 设X1,X2,…,Xn是取自正态总体 N (, 2 )
的样本, 则有
X和S2 分别为样本均值和样本方差,
X ~ t(n 1)
Sn
X ~ N (0,1), / n

(1)
由定理2,
X
~
N (1
,
2 1
n1
),
Y
~
N (2
,
2 2
n2
),
且 X 与Y 相互独立,由正态分布的可加性,可得
X
Y
~
N (1
2
,
2 1
n1
2 2
)
.
n2
标准化,即得
U ( X Y ) (1 2 ) ~ N (0,1) .
2 1
2 2
n1 n2
10
数理统计
(2) 由定理2,
(n1
数理统计
第三节 正态总体下的抽样 分布定理
数理统计
定理1 设总体 X 的均值和方差均存在,EX ,
DX 2 ,对样本 ( X1, X2 ,, Xn ) 及其样本均值 X 和样本
方差 S2 ,
有 E(X) ,
2
D( X )

E(S2) 2
.
n
证 X1, X 2 ,, X n 相互独立,且与总体 X 同分布,故有
8
定理3
设两个正态总体 X
~
N
(
1
,
2 1
)
,Y
~

4.3抽样分布

4.3抽样分布

(3) X与S2相互独立
(4) X ~ t(n 1)
Sn
已知, 2未知
(5) n ( Xi )2 ~ 2 (n)
i1
已知
LOGO
例1 设总体X 服从正态分布N (12, 2 ), 抽取容量为
25的样本,求样本均值X大于12.5的概率.如果(1)已
知 12;(2)未知,但已知样本方差S2 3.6.
n1 n2


F(n1,
n

2


.
LOGO
4.3.2 正态总体的抽样分布
由于要求具体抽样分布是困难的,有时甚至是不可 能的。正态总体的抽样分布有详尽的研究,本节主要 学习正态总体的抽样分布。
掌握正态分布、 2分布、t分布、F分布的一些结论
对于正态总体抽样分布的学习非常有用. 主要学习单个正态总体的抽样分布以及多个正态总
i1
于是P
10
i1
Xi 2
4
P
1 0.52
10 i1
Xi2
16
查表求02.10(10) 16.由此可得
P
10 i1
Xi
2
4
0.10.
(2) 由题设及定理4.3.2, 9S 2
0.52
10
P i1
(Xi
X )2
1
2.85
P
0.52
10 i1
查表得02.25(9) 11.4,由此可求得
n
n
该定理的证明由正态分布的性质3.1.10可得。
注意:当样本来自非正态总体时,若总体均值为,方差 为 样 本量2(充有分限大且时不,X为近零似)服,从由N中(心, 极)2.限定理可以证明当

16几个常用的抽样分布与抽样分布定理

16几个常用的抽样分布与抽样分布定理
0
(s
0),
(s 1)
s (s) ,(12)
3
3.性质:
1)期望与方差
提示: 2
X
2 1
X
2 n
若 2 ~ 2(n),则 E( 2)= n,D( 2)=2n
证明: 因为Xi~N(0, 1)
所以
E
(
X
2 i
)
D( Xi
) [E( Xi
)]2
1 0 1
D(
X
2 i
)
E
(
X
4 i
)
[
2 1
/
2 2
~
F (n1
1, n2
1)
29
定理2结论(3)
假定
2 1
2 2
2,
就有
t T ( X Y ) (1 2 ) ~ S 1 n1 1 n2
(n1 n2 2)
其中
S2
(n11)S12 (n2 1)S22 n1 n 2 2

( X Y ) (1 2 )
13
T 的概率密度为
(s) xs1e x d x (s 0),
0
f (t)
( n 1) 2
(1
t2
)
n1
2,
(12)
t
n ( n) n
2
14
2.基本性质:
(1) f ( t ) 关于 t = 0(纵轴)对称。
(2) f ( t ) 的极限为 N(0, 1) 的密度函数,即
lim f (t) (t)
标准化
定理1:设总体 X ~ N ( , 2 ) ,X1, X2,…, Xn 是
来自总体 X 的样本,

正态总体下的抽样分布

正态总体下的抽样分布
中心极限定理
中心极限定理是抽样分布的理论基础, 它表明无论总体分布是什么,只要样 本量足够大,样本均值的分布近似正 态分布。
样本均值的性质
无偏性
样本均值的数学期望等于总体均值, 即$text{E}(bar{x}) = mu$。
最小方差性
在所有可能的样本统计量中,样本均 值具有最小的方差,即 $text{Var}(bar{x}) = frac{sigma^2}{n}$。
数学表达式
正态分布的数学表达式为$f(x) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}$,其中$mu$是均值, $sigma$是标准差。
抽样分布的概念
抽样分布
抽样分布描述的是从某一总体中随机 抽取一定数量的样本后,这些样本统 计量(如均值、方差等)的分布情况。
大样本下样本方差的分布
卡方分布
在大样本下,样本方差通常呈现卡方分布。
方差的无偏估计
在大样本下,样本方差是总体方差的无偏估计。
方差的同方差性
在大样本下,来自不同总体的样本方差通常具有同方差性,即它们具有相同的 方差。
04
小样本下的抽样分布
小样本的定义
小样本是指从总体中随机抽取的样本 量较小,通常在30个样本以下。
THANKS
感谢观看
正态分布的性质
Байду номын сангаас01
02
03
集中性
正态分布的曲线关于均值 所在直线对称,数据值主 要集中在均值附近。
均匀性
正态分布的曲线在均值两 侧均匀下降,且下降速度 逐渐减缓。
平坦性
正态分布的曲线在均值的 两侧逐渐接近水平线,表 现出平坦的趋势。

第三章 正态分布与抽样分布

第三章  正态分布与抽样分布

图3-5 正态分布的概率
关于正态分布,有几个概率应记住: 关于正态分布,有几个概率应记住: 一般正态分布: 一般正态分布:
P(µ-1.96σ≤x<µ+1.96σ)=0.95 1.96σ≤x<µ+1.96σ)= )=0.95 P(µ-2.58σ≤x<µ+2.58σ)=0.99 2.58σ≤x<µ+2.58σ)= )=0.99 P(µ-σ≤x<µ+σ)=0.6826 σ≤x<µ+σ)= )=0.6826 P(µ-2σ≤x<µ+2σ)=0.9545 2σ≤x<µ+2σ)= )=0.9545 P(µ-3σ≤x<µ+3σ)=0.9973 3σ≤x<µ+3σ)= )=0.9973
对于大样本资料,常将样本标准差S 对于大样本资料,常将样本标准差S 与样本均数配合使用,记为 X ± S ,用 与样本均数配合使用, 以说明所考察性状或指标的优良性与稳 定性。对于小样本资料, 定性。对于小样本资料,常将样本标准 误 SX 与样本均数 X 配合使用,记 配合使用, 为 X ± S ,用以表示所考察性状或指 标的优良性与抽样误差的大小。 标的优良性与抽样误差的大小。
学上已证明 总体的两个参数与x总体的两 总体的两个参数与x 个参数有如下关系: 个参数有如下关系:
µx = µ
σx =
σ
n
表 X 的抽样分布形式与原总体X分布形式的关系 的抽样分布形式与原总体X
2.2 均数标准误
均数标准误 σx = 的大小反映样本均数 X n 抽样误差的大小 标准误大, 的大小。 的抽样误差的大小。标准误大,说明各样本均 间差异程度大;反之,亦然。 数 X 间差异程度大;反之,亦然。 在实际工作中,总体标准差σ往往是未知的, 在实际工作中,总体标准差σ往往是未知的, σx 此时,可用样本标准差S 因而无法求得 。此时,可用样本标准差S估 S 于是, 计σ 。于是,以 估计 n 。记σx 为 n, S SX 称作样本标准误或均数标准误。 称作样本标准误或均数标准误。 是均数抽样 SX 误差的估计值。 误差的估计值。

正态总体的抽样分布

正态总体的抽样分布

解 ( X Y ) (6 5) ~ N (0,1)
1/10 1/10
P( X Y 1.3)
P
(X Y ) (6 5) 1/10 1/10
1.3 (6 5) 1/10 1/10
P
(X
Y) 1/10
(6 5) 1/10
0.67
(0.67)
0.7486
定理5 : 设总体X 与Y相互独立, ( X1, X 2,..., X nX )是来自
1 nX (X
nX 1 i1
Xi )2
(Y1,Y2 ,...,YnY
)是来自总体Y
~
N (Y
,
2 Y
)的一个样本,
Y
1 nY
nY
Yi ,
i 1
SY2
1 nY 1
nY i 1
(Y
Yi )2
定理4: ( X Y ) (X Y ) ~ N (0,1)
2 X
/ nX
2 Y
/ nY

由于
X
~
N
~
N
(
X
,
2 X
)的一个样本,
S
2 X
为其样本方差;
(Y1,Y2 ,...,YnY
)是来自总体Y
~
N
(
Y
,
2 Y
)的一个样本,
SY2为其样本方差;则
F
S
2 X
SY2
2 Y
2 X
~ F(nX
1, nY
1)
特别,当σX2 = σY2时,有
F
S
2 X
SY2
~
F (nX
1, nY
1)
证 由于

2.5 正态总体的抽样分布

2.5 正态总体的抽样分布

Yi ai j , i 1, 2, , n,
j 1
故Y1,Y2,...,Yn仍为正态随机变量,且
E (Yi ) aij E ( Z j ) 0.
j 1
n

0, i j , cov( Z i , Z j ) ij 1, i j ,
n n
i 1, 2, , n,
53.852 50.852 (1.7143) (1.1429) 6.3/ 6 6.3/ 6 0.8239
定理2 设 X ~ N ( , 2 ), X 1 , X 2 , , X n 为X的样本,则
2
证明
Yi N (0,1),

i 1, 2, , n. 1 Z j nZ , n
n i 1
Y1 a1 j Z j
j 1 j 1 n
n
n
2 T T T T T 2 Y Y Y ( AZ ) ( AZ ) Z ( A A ) Z Z Z Z i i, i 1

2 例6 设总体 X ~ N ( , ),从总体中抽取样本 X 1 , X 2 , , X n , X n 1 , 记 n 2 1 n 1 2 X n X i , Sn Xi X , n i 1 n 1 i 1 证明统计量


n X n 1 X n t (n 1). n 1 Sn

X 1 , X 2 , , X n为X的样本, 定理4 设总体 X ~ N ( , 2 ) , 样本均值和样本方差分别为 X 和 S 2 ,则随机变量 X t n ~ t ( n 1). S X N 0,1, 证明 根据定理1,可得 u / n

6.11 双正态总体的抽样分布

6.11 双正态总体的抽样分布
=
ത − ത − 1 − 2

1
1
+ 1
2
~(1 + 2 − 2)
其中
2
=
1 −1 12 + 2 −1 22
1 +2 −2
ത N(m1,s ) 与 ~
ത N(m2, s ) 相互独立,得 ത − ~
ത N(m1−m2, s +s )
证 由 ~




标准化变量
1 −1 2
1 ~
2
c2(n1−1) ,
T=
2
2
2
2
1
2
1
2
=
ത − ത − 1 − 2

2 −1 2
2
2
1
1
+ பைடு நூலகம்1
~ c2(n2−1)

/(n1+n2−2)
~(0,1)
2
相互独立
可加性
~(n1+n2−2)
1
V= 2 [(n1−1)12 +(n2−1)22 ] ~ c2(n1+n2−2)
概率论与数理统计华中科技大学概率统计系06数理统计的基本概念双正态总体的抽样分布抽样定理独立样本双正态总体的抽样分布推论2独立样本双正态总体的抽样分布标准化变量推论3条件同推论2且s相互独立可加性分别从方差为20和35的两个独立的正态总体中抽取容量为8和10的两个样本估计第一个样本方差35iidiid由推论2知故所求概率为查表有
3.29
4.2
3.5
(2)

൙ ෍
~ F(n1, n2)
1
1
2
2
双正态总体的抽样分布

正态总体下的抽样分布

 正态总体下的抽样分布

§1.2数理统计中常用的分布正态总体是最常见的总体, 本节介绍的几个抽样分布均对正态总体而言.1.标准正态分布2. 2分布3.t分布4.F分布o xϕ(x )定义:设X ~N (0,1),对任给的α, 0<α<1,称满足条件1、标准正态分布αϕαα==>⎰+∞dx x z X P z )(}{的点z α为标准正态分布的上α分位点.z αα例:求z0.05解:P{X≤z0.05}=1−P{X>z0.05}=1−0.05=0.95∵P{X≤1.64}=0.9495P{X≤1.65}=0.9505∴z0.05≈(1.64+1.65)/2=1.645公式: Φ(zα)=1−α常用数字575.296.1645.1005.0025.005.0===zzz定义:设X i ~N (0,1) (i =1,2,...,n ), 且它们相互独立,则称随机变量2、χ2分布221nii X χ==∑服从自由度为n 的χ2分布,记为χ2~χ2(n ).χ2分布最常用的是拟合优度检验.其中,在x > 0时收敛,称为Γ函数,具有性质1()tx te dtx +∞−−Γ=⎰(1)(),(1)1,(1/2)(1)!()x x x n n n N πΓ+=ΓΓ=Γ=Γ+=∈一般自由度为n 的χ2(n )的密度函数为12221,0()2()20,xnnn ex ng x x x −−⎧>⎪⎪=Γ⎨⎪⎪≤⎩χ2分布的密度函数图χ2~χ2(n)D Y =D෍i=1nX i 2=෍i=1n D(X i 2)=෍i=1n [E(X i 4)−(E(X i 2))2]=෍i=1n2=2n .χ2分布的基本性质(1)设Y 1~χ2 (m ), Y 2~χ2 (n ), 且Y 1 , Y 2 相互独立,则χ2 分布的可加性(2)若Y ~χ2 (n ), 则E (Y )=n ,D (Y )=2n.= 1;)(~221n m Y Y ++χY 1=෍i=1mX i 2,Y 2=෍i=m+1m+nX i 2,)(~2n m +χY 1+Y 2=෍i=1m+nX i2E Y =E෍i=1nX i 2=෍i=1nE(X i 2)=෍i=1n[D(X i )+(E(X i ))2]=෍i=1n1=n ,E(X i 4)=12πන−∞+∞x 4e −x 22dx =3故(3)设X 1,…, X n 相互独立,且都服从正态分布N (μ,σ2),则;)(~)(12122n X Y ni i χμσ∑=−=(4)若Y ~χ2 分布,则当n 充分大时,近似服从N (0,1).n n Y 2−应用中心极限定理oχ2α(n )xf (x )α设χ2~χ2(n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件αχχαχα==>⎰+∞dx x f n P n )(222)()}({的点χ2α(n )为χ2(n )分布的上α分位点.χ2分布的上α分位点当n 充分大时,22)12(1)(−+≈n z n ααχ例:设X ~N (μ,σ2), (X 1,X 2,...,X 16)是取自总体X 的样本,求概率:}2)(1612{216122σμσ≤−≤∑=i iX P 解:∵X 1,X 2,...,X 16相互独立且)1,0(~N X i σμ−)16(~)(21612χσμ∑=−∴i i X}2)(1612{216122σμσ≤−≤∑=i iX P }32)(8{1612≤−≤=∑=i i X P σμ}32)({}8)({16121612>−−≥−=∑∑==i i i i X P X P σμσμ≈0.95−0.01=0.94定义:设X ~N (0,1),Y ~χ2(n ),且X 与Y 相互独立,则称随机变量3、t 分布服从自由度为n 的t 分布,记为T ~t (n )./X T Y n=T 的密度函数为:22112()1,.2n n n t x x n n n x π+−+⎛⎫Γ ⎪⎛⎫⎝⎭=+−∞<<∞ ⎪⎛⎫⎝⎭Γ ⎪⎝⎭1908年英国统计学家W.S. Gosset (笔名Student )t分布的密度函数图T~t(n)t 分布的上α分位点设T ~t (n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件(){()}()t n P T t n f x dt ααα+∞>==⎰的点t α(n )为t 分布的上α分位点.f (x )xt α(n )αt *0f (x )1-αx-t *t 分布的双侧α分位点设T ~t (n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件*{||}1P T t α<=−的数t *为t 分布的双侧α分位点.α/2t 分布的密度函数f (x )是偶函数,故**()()P T t P T t ≤−=≥***(||)()P T t P t T t <=−<<*(),2P T t α≥=于是得即*()2P T t α>=**()()P T t P T t =<−≤−**(1())()P T t P T t =−≥−≥*12()1,P T t α=−≥=−= t α/2(n )t 分布的性质(1) 其密度函数f (x )是偶函数(3) f (x )的极限为N (0,1)的密度函数,即221lim ()()2x n f x x e φπ−→∞==(2)t 1−α(n )= −t α(n )当n >45时,t α(n )≈z α例:设X , Y 1,Y 2,Y 3,Y 4 相互独立,且X ~N (2,1),令Y i ~N (0, 4),i =1, 2, 3, 4 ,解:∵X -2~N (0, 1),~t (4),即Z 服从自由度为4 的t 分布.求Z 的分布.由t 分布的定义Y i /2~N (0, 1),i = 1, 2, 3, 4 . ,)2(4412∑=−=i iY X Z ∑=−=412)2(4i i Y X Z 4)2(2412∑=−=i i Y X例:设随机变量X 与Y 相互独立,X ~ N (0,16),Y ~ N (0,9) , X 1, X 2,…, X 9与Y 1, Y 2 ,…, Y 16分别是取自X 与Y 的简单随机样本,求统计量所服从的分布.解:)169,0(~921⨯+++N X X X )1,0(~)(431921N X X X +++⨯ 2162191YY XX Z ++++=从而16,,2,1,)1,0(~31=i N Y i )16(~3122161χ∑=⎪⎭⎫ ⎝⎛i i Y 2162221921Y Y Y X X X ++++++ ()16314311612921∑=⎪⎭⎫ ⎝⎛+++⨯=i i Y X X X )16(~tt分布用于在小样本(n<30)场合下的正态分布(大样本(n≥30)场合下可以用正态分布来近似),有时候在信息不足的情况下,只能用t分布,比如在总体方差不知的情况下,对总体均值的估计和检验通常要用t统计量.12222,()2(),0()()()220,0m n m m nm n x x m nm n n m x m n f x x +−−+⎧Γ⎪+>⎪=⎨ΓΓ⎪⎪≤⎩F 的密度函数为:所服从的分布为第一自由度为m ,第二自由度为n 的F 分布,记作F ~ F (m , n ).4、F 分布则称统计量F 分布多用于比例的估计和检验!nY mX F =定义:设随机变量X 与Y 独立,且X~χ2(m),Y~χ2(n),F 分布的密度函数图F~F(m,n)F 分布的上α分位点设F ~F (m ,n ),其密度函数为f (x ),对于给定的正数α(0<α<1),称满足条件ααα==>⎰+∞dx x f n m F F P n m F ),()()},({的点F α(m ,n )为F 分布的上α分位点.0f (x )F α(m ,n )αxF 分布的性质(1) 若F ~F (m ,n ),则(2)()~,1F F n m ),(1),(1m n F n m F αα=−}),(11{1n m F F P α−≤=∵1−α=P {F ≥F 1−α(m ,n )}}),(11{11n m F F P α−>−=αα=>⇒−}),(11{1n m F F P ),(),(11m n F n m F αα=⇒−(3)若X ~ t (n ), 则X 2~ F (1, n );mX nY F=1例:设F ~ F (24, 15) ,求F 1,F 2,F 3,使其分别满足P (F >F 1 )= 0.025 , P (F <F 2 )= 0.025 , P (F >F 3 )= 0.95 .解:(1)由m =24,n =15,α= 0. 025 ,查P192 附表6(2)无法直接查表获得,但由F 分布性质知1/F ~F (15, 24),查附表6知(3) ∵F 3 =F 0. 95(24,15), 查附表6知:∴ F 2 = 1/2.44 = 0.41 ; 由性质(2)知,025.0)11()(22=>=<F F P F F P 1F 2=F 0.025(15,24)=2.44⇒P(F <1/2.44)=0.025F 0.05(15,24)=2.11,,)24,15(1)15,24(95.0195.0−=F F .474.011.213==∴F 知F 1= F 0.025 (24, 15)= 2.70 ;抽样分布定理1. 单个正态总体的抽样分布2. 两个正态总体的抽样分布定理:设X 1,X 2,...,X n 是来自正态总体N (μ,σ2)的样本,则1. 单个正态总体的抽样分布(1)),(~2n N X σμ)1,0(~N n X σμ−⇒(2)与S 2相互独立X (3))1(~)1(222−−n S n χσ(4))1(~−−n t n S X μ1σ2෍n(X i −μ)2~χ2(n)(5)(1)∑==ni i X n X 11)1,0(~N n X σμ−⇒为n 个相互独立的正态X ∴服从正态分布∑==ni i X E n X E 1)(1)(=μ∑==n i i X D n X D 12)(1)(n2σ=),(~2n N X σμ∴随机变量的线性组合(4)),1,0(~N n X σμ− 且它们相互独立由t 分布的定义,)1(~1)1(22−−−−n t n S n nX σσμ)1(~−−n t n S X μ即22)1(σS n −~χ2(n −1)例:设(X 1,X 2,…,Xn )是取自总体X 的样本, 是样本均值,如果总体X ~N (μ,4),则样本容量n 应取多大才能使X 95.0}1.0|{|≥≤−μX P 解:)1,0(~ N n X σμ− }21.02||{}1.0|{|n n X P X P ≤−=≤−∴μμ}05.02)(05.0{n X n n P ≤−≤−=μ)05.0()05.0(n n −Φ−Φ=1)05.0(2−Φ=n ≥0.95975.0)05.0(≥Φ⇒n 96.105.0≥⇒n ⇒n ≥1536.64⇒n ≥1537解:),1(~)1(222−−n S n χσ由),,(~2nN X σμ又()⎪⎭⎫⎝⎛+−+n n N X X n 211,0~σ)1,0(~11N n n X X n +−+σ故212(1)~(1)1(1)n X Xn n St n n n σσ+⎛⎫−−−⎪+−⎝⎭于是)1(~11−+−+n t n nS X X n 即例:总体X ~N (μ,σ2),(X 1,X 2,…,X n ,X n +1)为样本,,求X n+1−തX S n n+1的分布.S 2=1n −1෍i=1n(X i −തX)2തX=1n ෍i=1nX i定理:设总体X ~N (μ1,σ12),总体Y ~N (μ2,σ22).X 1,X 2,...,是总体X 的样本,Y 1,Y 2,...,是总体Y 的样本, 且这两个样本相互独立.则1n X 2n Y 2. 两个正态总体的抽样分布(1)),(~22212121n n N Y X σσμμ+−−(2))1,1(~2122222121−−n n F S S σσ)2(~11)()(212121−++−−−n n t n n S Y X ωμμ其中2)1()1(212222112−+−+−=n n Sn S n S ω称为混合样本方差.进一步,若σ12=σ22 =σ2,有(3)),(~221221n n N Y X σσμμ+−− )1,0(~11)()(2121N n n Y X +−−−∴σμμ2211)1(σSn −~χ2(n1−1),2222)1(σSn −~χ2(n2−1)且它们相互独立22222211)1()1(Sn Sn −+−∴~χ2(n1+n 2−2)由t 分布的定义,2)1()1(11)()(21222222112121−+−+−+−−−n n Sn Sn n n Y X σσσμμ22221121112)1()1()()(n n n n Sn S n Y X +−+−+−−−−μμ即~t (n 1+n 2−2)~t (n 1+n 2−2)小结1.理解总体、个体、样本和统计量的概念,掌握样本均值和样本方差的计算及基本性质2.掌握 2分布、t分布、F分布的定义,会查表计算3.理解正态总体的某些统计量的分布。

正态总体的抽样分布

正态总体的抽样分布

则服从自由度为 n-1 的 t 分布的随机变量是

练习
设总体X的密度函数为 | x |, | x | <1 f ( x) 其他 0, X1 ,X 2 , Xn为取自X的一个样本:求
(1)E (X),D(X) (2)E(S )
2Hale Waihona Puke 练习设总体X~N(0,1),样本X 1 , X 2 ,
2
X6
2
(2) X 和 S 相互独立.
取不同值时 的分布
2
例题分析
定理 3

(与样本均值和样本方差有关
的一个分布) 的样本,
X1, X2 ,…, Xn 是取自正态总体
分别为样本均值和样本方差, 则有
且它们独立。 则由t-分布的定义:

4. 两个正态总体
(1) 若 X ~ N (μ1,σ12) : X1,X2,…,Xn1
2 2
证:EX i 0, DX i 1, X i ~ N (0,1)
2 i 4 i 2 2 i n
n
EX 1,
2 i
DX EX ( EX ) 3 1 2, i 1, 2,
所以 E 2 E ( X i2 ) EX i2 n.
D 2 D( X i2 ) DX i2 2n.
设 X: 1. 2. 若 X~N(0,1),则 X1,X2,…,Xn
四大统计量
两个正态总体
Y ~ N (μ2,σ2 2) : Y1,Y2,…,Yn2 ,它们相互独立,
(1) 若 X ~ N (μ1,σ12) : X1,X2,…,Xn1

(2)
当σ12 =σ22 =σ2时,
( 3)

6_2正态总体的抽样分布

6_2正态总体的抽样分布
§6.2 正态总体的抽样分布
一 、 正态总体样本均值和方差的分布
定理1 若(X1,X2,…,Xn)是正态总体N(, σ2)的一个样本 , X和 S 2 分别是样本均值和样本方差,则:
1° X 与 S 2 相互独立;
2° X ~ N (, 2 )
n

(n 1)S 2
2
~
2 (n 1)
1 n

(n 1)S 2
2
~
2 (n 1)
1 n
2 i 1
Xi X 2 ~ 2 (n 1)
《概率统计》
返回
下页
结束
证明 (1)
X ~ N(, 2 ) , X ~ N(0,1) n / n
(2)
令 U X , / n
V
(n 1)S2
2 ,
则 U ~ N (0,1), V ~ 2(n 1).
,
(
1 n1
1 ) 2 )
n2
标准化后即得
( X Y ) (1 2 ) ~ N (0,1) 11
n1 n2
《概率统计》
返回
下页
结束
(2) 令 U ( X Y ) (1 2 ) ,
11
n1 n2
则由(1)知 U ~ N (0,1)
令V
(n1
1)S12
2
(n2
1)
S
2 2
2
,
由于
(n1
4/5
4/5
2 2(0.56) 0.5754
《概率统计》
返回
下页
结束
二、 单个正态总体的抽样分布 定理2 设(X1,X2,…,Xn)为正态总体N(μ,σ2)的一个样本, 则

概率论与数理统计6.5正态总体下的抽样分布

概率论与数理统计6.5正态总体下的抽样分布

已知 未知
已知,用S
未知,用S
*
N分布(定理6.5)
t(n-1)分布(定理6.6)
F (n1, n2 )分布(定理6.7) F (n1 1, n2 1)分布(定理6.8)
§6.5正态总体下的抽样分布
定理 6.5.1 设 X1, X 2 , , X n 为来自正态总体
N(, 2 ) 的简单随机样本, X 是样本均值,
Xi
2
35.2
P
20 i 1
Xi
2
7.4
0.975 0.005 0.97
17
例5:设某厂的灯泡使用寿命X ~ (1000, 2),单位小时
现抽样9个样本,样本方差为1002小时2。求P X 1062
解:T
X S*
~
t(n 1)
n
P
X
1062
P
X 1000 100 3
1)
n
2
E(S 2 )
2
1 n
n i1
E( Xi
)( X
) (n 1) 2
n
2 E[
1 n
n i1
(
Xi
)(
X
)]
(n
1)
n
2
2E[( X )2 ] (n 1) 2
n
2D X (n 1) 2
n
2 2 (n 1) 2 (n 1) 2
n
n
n
E(S *2 ) E( n S 2 ) n E(S 2 ) 2
P
1
2
20 i1
Xi X
2
35.2
P
1
2
20 i1
Xi X

统计学中的中心极限定理与抽样分布

统计学中的中心极限定理与抽样分布

统计学中的中心极限定理与抽样分布统计学是一门研究收集、整理、分析和解释数据的学科。

在统计学中,中心极限定理和抽样分布是两个重要的概念和原理。

它们在统计学的应用中起着至关重要的作用。

本文将对中心极限定理和抽样分布进行详细阐述。

一、中心极限定理中心极限定理是统计学中的一项核心概念,它描述了当从总体中抽取样本时,样本均值的分布会趋近于正态分布。

简而言之,中心极限定理指出,当样本容量足够大时,无论总体的分布形态如何,样本均值的分布都会接近于正态分布。

中心极限定理的重要性在于它为统计分析提供了一个基本的理论依据。

通过中心极限定理,我们可以进行推断性统计分析,并利用正态分布的性质进行假设检验、置信区间估计等。

以投掷硬币的实验为例,如果我们重复投掷大量次数,每次记录正面朝上的次数,那么这些次数的平均值将会呈现出正态分布。

即使每次投掷的结果并非正态分布,但通过中心极限定理,样本均值的分布将趋近于正态分布。

二、抽样分布抽样分布是指对从总体中抽取的样本数据进行统计分析后得到的分布。

在统计学中,我们通常不直接分析总体,而是通过对样本的分析来推断总体的特征。

而抽样分布则是这样的推断过程中,样本统计量的分布情况。

常见的抽样分布包括 t 分布、F 分布和卡方分布等。

这些分布是在特定条件下得出的,它们在统计推断中起着重要的作用。

1. t 分布t 分布是一种在小样本条件下使用的概率分布。

它与正态分布相似,但相对于正态分布而言,t 分布的尾部较宽。

t 分布的形态取决于自由度(样本容量减1),随着自由度的增加,t 分布逐渐逼近于正态分布。

t 分布常用于小样本条件下的统计推断,例如对两个样本均值进行比较时,使用 t 检验来判断两者是否有显著性差异。

2. F 分布F 分布是一种用于比较两个或更多组数据变异性的概率分布。

F 分布的形态取决于两个自由度,分子自由度表示组间变异的自由度,分母自由度表示组内变异的自由度。

F 分布常用于方差分析,用于比较多个样本组之间的差异性。

f分布

f分布

F分布:
F分布是1924年英国统计学家Ronald.A.Fisher爵士提出,并以其姓氏的第一个字母命名的。

它是两个服从卡方分布的独立随机变量各除以其自由度后的比值的抽样分布,是一种非对称分布,且位置不可互换。

F分布有着广泛的应用,如在方差分析、回归方程的显著性检验中都有着重要的地位。

由于F分布是由2个卡方分布构造的,而卡方分布一般用于度量样本方差和误差之和。

所以引出F分布的三个重要应用:两个正态总体的抽样分布、方差分析、回归分析。

1、两个正态总体的抽样分布
设样本(x_1,x_2,⋯x_n)和(y_1,y_2,⋯y_n)分别来自总体
N(μ_1,σ_1^2) 和N(μ_2,σ_2^2),并且它们相互独立。

样本均值分别为x ̅,y ̅;样本方差分别是S_1^2, S_2^2,则可以得到下面的抽样分布:
后续的使用与t分布中提到的类似,基于此定理构造枢轴量进行区间估价和假设检验。

F分布是1924年英国统计学家R.A.Fisher提出,并以其姓氏的第一个字母命名的。

它是一种非对称分布,有两个自由度,且位置不可互换。

设X服从自由度为n1的卡方分布, Y服从自由度为n2的卡
方分布,且X,Y独立,则称随机变量F=(X⁄n1 )/(Y⁄n2 )服从自由度为(n1,n2)的F分布,记为F~F(n1,n2)。

其中n1称为第一自由度,n2称为第二自由度。

由F分布的公式可知,1/F~ F(n2,n1)。

F(n1,n2)的概率密度函数的图形为:(对于不同的自由度,图形也有差别,此处仅举2个例子)。

正态总体的抽样分布

正态总体的抽样分布
的一个简单随机样本,请证明以下结论
⑴ nX 2 2 n 1;


D
D
X2
X2

2 n2
;
S2
2 n2
2. n 1
双正态总体的抽样分布
设 X1, X 2 ,
, Xn
是取自总体
X ~N
1
,ห้องสมุดไป่ตู้
2 1
的一个简单随机样本, Y1,Y2 , ,Ym 是取自总体
P
X 40 5/ n

n 5


2
n 5

1,

n 5


0.975

n 5
u0.975
1.96
n 96.04.
所以, 取 n 97.
例2 设 X1, X 2 , , X n 是取自总体 X ~ N 0,1
X
=
1 n
n i 1
Xi
~
N


,
2
n


n X ~ N 0,1

证明(2)
由于 Xi ~ N , 2 ,
即:Xi ~ N 0,1

根据卡方分布的定义,可得
n
i1
Xi
2
=
1
2
n
Xi
i 1
2
⑴抽取容量为36的样本, 求 P 38 X 43 ;
⑵问样本容量 n 多大时, 才能使 P X 40 1 0.95 ?
解⑴ 由抽样分布及 n 36 可知
X
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Y ~ N (μ2,σ2 2) : Y1,Y2,…,Yn2 ,它们相互独立,

定理3
(两总体样本均值差的分布)
2 2
且 设 X ~ N (1 , ),Y ~ N (2 , ),
X 与Y 独立,
X1,X2,…,
X n1
2 2
是取自X的样本, Y1,Y2,…,
Yn2 是
取自Y的样本, 均值, S 2
i 1 i 1 n
i 1 n
i 1
E( X )
4


x
4
1 2
e
x2 2
dx

x


x
1
3
1 2
e
x2 2
de

x2 2
3
2



1 2

e
x2 2
3 x dx 3
2
(3) 应用中心极限定理可得,若 X ~ 2 (n)
N ( , 2 ) 的样本,
则有
N 取不同值时样本均值
X 的分布
X ~ N ( ,
2
n
)
关于
( n 1) S 2
2
~ 2 ( n 1)的简要说明
( n 1) S 2
2

1

( X i X )2 2
i 1
n
从以上两式子看出,仅 和X 不同
但是,第一个式子,X i自由,第二式
设 X: 1. 2. 若 X~N(0,1),则 X1,X2,…,Xn
四大统计量
两个正态总体
Y ~ N (μ2,σ2 2) : Y1,Y2,…,Yn2 ,它们相互独立,
(1) 若 X ~ N (μ1,σ12) : X1,X2,…,Xn1

(2)
当σ12 =σ22 =σ2时,
(3)
请回答: 设X1,X2,X3,X4是总体N(0,1)的样本,则:
则服从自由度为 n-1 的 t 分布的随机变量是

练习
设总体X的密度函数为 | x |, | x | <1 f ( x) 其他 0, X1 ,X 2 , Xn为取自X的一个样本:求
(1)E (X),D(X) (2)E(S 2 )
练习
设总体X~N(0,1),样本X 1 , X 2 , X 6 令Y=(X1 +X 2 +X 3 )2 (X 4 +X 5 +X 6 )2 求常数C,使cY ~ 分布
正态总体的抽样分布
一、样本均值分布 定理 设总体 是X的样本。
样本均值
(标准化)
二、 1.定义:
分布 设随机变量 相互独立,都服从
标准正态分布N(0,1), 则称统计量:
所服从的分布为自由度为 n 的
分布. 记为
注:
自由度是指*右端所含独立的随机变量的个数。
分布的密度函数为
其中伽玛函数
通过积分
2
并确定其参数
练习
设随机变量X~F(m , m ), 证明 p{ X 1} p{ X 1} 0.5
练习
设随机变量X和Y都服从标准正态分布,则 (A)X+Y服从正态分布 (B)X 2 +Y 2服从 2分布 (C)X ,Y 服从 分布
2 2 2
(D) X /Y 都服从F分布
2 2
[( n 1) 2] x2 f ( x; n) (1 ) n (n 2) n
n 1 2
t(n) 的概率密度为 n 1 [( n 1) 2] x2 2 f ( x; n) (1 ) n (n 2) n
2. 性质 (1)具有自由度为 n 的 t 分布的随机变量 T 的 数学期望和方差为:
2
(2) X 和 S 相互独立.
2
取不同值时 的分布
例题分析Βιβλιοθήκη 定理 3设(与样本均值和样本方差有关
的一个分布) 的样本,
X1, X2 ,…, Xn 是取自正态总体
分别为样本均值和样本方差, 则有
且它们独立。 则由t-分布的定义:

4. 两个正态总体
(1) 若 X ~ N (μ1,σ12) : X1,X2,…,Xn1
问题
设 则
相互独立, 都服从正态分布
为什么?
例2 设总体X~N(0,0.32), n =10,求
解 ∵ X/0.3~N(0,1),

三、t 分布
1. 定义: 设 X~N(0,1) , Y~
2
(n)
, 且X与Y
相互独立, 则称变量 所服从的分布为自由度为 n的 t 分布. T的密度函数为: 记为T~t(n).
1
X 和Y
分别是这两个样本的样本
和S
分别是这两个样本的样本方差,
则有
X Y ( 1 2 )
2 ( n1 1) S12 ( n2 1) S2 n1 n2 2
1 1 n1 n2
~ t ( n1 n2 2)
定理 3
(两总体样本方差比的分布)
2 设 X ~ N ( 1 , 12 ), Y ~ N (2 , 2 ), X与Y独立, 且
2 2
则称统计量
服从自由度为n1及 n2 的F分布,
n1称为第一自由度,
n2称为第二自由度,
记作 F ~F (n1,n2).
若X ~ F (n1,n2), X的概率密度为
( ) n1 n1 ( n2 )( n2 x ) n1 n2 f ( x; n1 , n2 ) ( 2 ) ( 2 ) 0
(X
i 1
n
i
X )=0
无形中多了一个条件,减少了一个自由度 故为 2 ( n 1)
定理 2
(样本方差的分布)
设 X1, X2, … , Xn 是取自正态总体 N ( , 2 ) 的样本,
X 和 S2
分别为样本均值和样本方差,
则有
(1)
( n 1) S 2

N
2
~ ( n 1)
i=1
n
(d) S 2 =
1

(X i -X)2 ~ 2 (n) 2
i=1
n
请回答:设总体X~N(μ,σ2),X1,X2,…,X8为
一个样本,则(
(1)
)成立。
~ t (8) (2) ~ t (7)
(3)
~ t (7)
(4)
~ t (8)
请回答:设 是样本均值,记
是来自正态总体N(μ ,σ 2)的样本,
练习
设总体X~N( , ),样本X 1 , X 2 , Xn来自X
2
样本n取多大时,有 (1)E(|X- | ) 0.1
2
(2)P(|X- | 0.1) 0.95
(3)
F 分布的分位点 称满足条件
对于给定的正数
的点

分布的上
分位点。
关于 F 分布分位点的重要结论
表中所给的

都是很小的数,如0.01,0.05等
较大时,如0.95,
表中查不出,可由以上结论
休息片刻
四、几个重要的抽样分布定理 定理 1 设 (样本均值的分布)
X1,X2,…,Xn 是取自正态总体
n1 n2 2
n1 1 2
1 x
n1 n2

n1 n2 2
x0
x0
2. 性质 (1) 由定义可见,
1 Y n2 ~ F( n2, n1) F X n1 (2) X的数学期望为: n2 E( X ) 若 n2 > 2 n2 2
即它的数学期望并不依赖于第一自由度n1.
来定义.
2—分布的密度函数曲线
n x 1 1 n2 x2 e 2 f ( x; n ) 2 ( n 2 ) 0
x0 x0
2. 2分布的性质
由 分布的定义,不难得到:
(2) 设
则 这个性质叫 分布的可加性.
且X1 , X2相互独立,
( ) E n, D 2n 2
2 2
证:EX i 0, DX i 1,
2 i 4 i 2 2 i n
X i ~ N (0,1)
n
EX 1,
2 i
DX EX ( EX ) 3 1 2, i 1, 2, n
所以 E 2 E ( X i2 ) EX i2 n.
D 2 D( X i2 ) DX i2 2n.
E( T ) = 0;
D( T ) = n / ( n - 2 ) ,
对 n > 2
(2)t 分布的密度函数关于 x = 0 对称,且
Lim f ( x; n) 0
x
当n充分大时,其图形类似于标准正态分布密度
函数的图形.
很大.
不难看到,当n充分大时,
t 分布近似
N (0,1)分布. 但对于较小的n, t分布与N (0,1)分布相差
则当n充分大时,
X n 2n
的分布近似正态分布 N (0,1).
(4)
分布的分位点
称满足条件的点 分布的上 分位点.
对于给定的正数 为
P443
分布表供查阅。
例 即 对于给定的 的点 为
称满足条件
分布的“上 百分位点”
上侧
分位点。
分布的下侧 当 下侧 双侧 时 分位点 分位点
分位点。 双侧
分位点。
例题分析 设X1,X2,X3,X4是总体
例题分析
Z
Y1 Y2 2(Y1 Y2 ) / 2 S 2S 2 /2 2
相关文档
最新文档