三大抽样分布及常用统计量的分布
概率论与数理统计第六章统计量,样本及抽样分布
(2) X 1
~
2 (n1 ),
X2
~
2 (n2 ),
X1,
X
独
2
立
,
则
X 1 X 2 ~ 2 (n1 n2 ).
(3) X ~ 2 (n), E( X ) n, D( X ) 2n,
.
2021/3/11
20
(4). 2分布的分位点
对于给定的正数,0 1,
称满足条件
P
2 2 (n)
k 1
,
X
k 2
,,
X
k n
独立且与X
k同分布,
E
(
X
k i
)
k
k 1,2,,n 再由辛钦大数定律可得上述结论.
再由依概率收敛性质知,可将上述性质推广为
g( A1, A2 ,, Ak ) p g(1,2 ,,k ) 其中g为连续函数.
这就是矩估计法的理论根据.
2021/3/11
18
皮肌炎图片——皮肌炎的症状表现 数理统计
10
3. 总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值而不是样本. 我 们只能观察到随机变量取的值而见不到随机变量.
2021/3/11
11
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质.
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
再由函数的性质有
lim h(t)
n
1 et2 2. 2
概率论与数理统计 7.2 数理统计中的三大分布
7.2 数理统计中的三大抽样分布
在数理统计中,以标准正态变量为基石而构 造的三个著名统计量有着广泛的应用,这是因为 这三个统计量不仅有明确背景,而且其抽样分布 的密度函数有明显的数学表达式,它们被称为统 计中的“ 三大抽样分布 ” 。
1. 2 分布
数理统计
2分布是由正态分布派生出来的一种分布.
t1 (n) t (n)
o t (n)
x
t分布的上分位点t (n)可查表
求得,例t0.025(15) 2.1315.
当n 45时,对于常用的的值,可用正态近似 t (n) z
例3:X ~ t(15)
(1)求 0.01的上侧分位数; (2) P( X ) 0.05,求 ; (3)P( X ) 0.95 ,求 .
记为 t ~ t(n). t分布概率密度函数为:
f (t)
[(n 1)
2]
(1
t
2
)
n1 2
,
t
(n 2) n n
t 分布的图像
y N (0,1) 数理统计
t(n)
t分布的性质: 1. 设t ~ t(n),则E(t) 0, D(t) n (n 2) (n 2)
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
F分布的上分位点的性质:
F1 (n1, n2 )
1 F (n2 , n1 )
F分布的上分位点可查表求得.例,
F0.95 (12,9)
1 F0.05 (9,12)
1 2.80
0.357
例4. F ~ F (24,15),求 1,2 使 P(F 2 ) 0.025 P(F 1) 0.025
5-4三大抽样分布
由 (n1
1)S12
2
~
2 (n1
1),
(n2 1)S22
2
~
2(n2
1),
且它们相互独立, 故由 2 分布的可加性知
V
(n1
1)S12
2
(n2
1)S22
2
~
2(n1
n2
2),
由于 U 与V 相互独立 , 按 t 分布的定义 .
U V /(n1 n2 2)
( X Y ) (1 2)
则有:
( X Y ) (1 2 )
(n1
1)S12
(n2
1)S
2 2
11
~ t(n1 n2 2)
n1 n2 2
n1 n2
证:X
Y
~
N
(1
2
,
2
n1
2
) n2
所以 ( X Y ) (1 2 ) ~ N (0,1) 1/ n1 1/ n2
(n1 1)S12
2
~
2 (n1
1),
定理二
设 X1, X2 , , Xn 是总体 N ( , 2 ) 的样本,
X , S 2 分别是样本均值和样本方差, 则有
(1)
(n 1)S 2
2
~
2(n 1);
(2) X 与 S 2 独立.
推论1 设 X1, X2, , Xn 是总体 N ( , 2 ) 的
样本, X , S 2 分别是样本均值和样本方差, 则有
2
P( X
2
t2
(n))
2
P(Y
t2
12
(n))
所以
t2
12
§5.4三大抽样分布
所以 Y ( y1 ,, yn )T 的各分量相互独立.
n 1 由于 x y1 , ( n 1) s 2 yi2 . x与s 2相互独立. n i 2
1 n 1 21 1 A 3 2 1 n( n 1)
n
( n 1) s 2 yi2,
i2
yi N (0, ), i 2,3, , n.
2
y2 ,, yn相互独立.
( n 1)
2
yi 2 s ~ (n 1). i 2
n
2
2
15
定理2:设( X 1 , X 2 ,, X n )是来自正态总体N ( , )的
1 n 1 21 1 3 2 1 n( n 1)
1 n 0
1 3 2 1 n( n 1)
0 0 1 n( n 1) 1 n
14
(3)
( n 1)
2
s 2 ~ 2 ( n 1).
2 i 1 2 i 2 1 2 2 n 2 n
服从自由度为n的 2分布, 记作 2 ~ 2 (n) . 注:服从 2分布的随机变量取值非负,其密度函数为 n x 1 1 x2 e 2 , x 0 n 2 n 2 ( x; n) 2 ( ) Γ ( s ) x s1e x dx , s 0, 2 0 0, x0
4
n=4
2 分布的性质:
n=6 n=10
1、随n的增大,其偏度越来越小。
2、 2分布表——P425 附表三
2
即是分布函数数值表.
2
n 1 3、 分布是Ga分布的特例,即有 ( n) Ga( , ) . 2 2 4、 2分布具有可加性:
三大抽样分布
F(n1, n2)为F(n1, n2)的上侧分位点;
1 注: F1 (n1 , n2 ) F (n2 , n1 )
F (n1 , n2 )
若X 1 , Y1 ,
, X n1 来自正态总体X, X ~ N ( 1 , 12 ),
2 , Yn2 来自正态总体Y, Y ~ N ( 2 , 2 ), 且两样本独立.
当
2 ( n)
2.t 分布
关于t分布的早期理论工作,是英国统计学家威廉· 西利· 戈塞 特(Willam Sealy Gosset)在1990年进行的。 t分布是小样本分布,小样本一般是指n<30。t分布适用于 当总体标准差未知时用样本标准差s代替总体标准差σ,由
样本平均数推断总体平均数及两个小样本之间差异的显著性
χ2 分布是海尔墨特(Hermert)和卡· 皮尔生(K· Pearson) 分别于1875年和1890年导出的。它主要适用于对拟合优度检 验和独立性检验,以及对总体方差的估计和检验。 χ2 分布是一种抽样分布。当我们对正态随机变量随机地重 复抽取个数值,将每一个值变换成标准正态变量,并对这个 新的变量分别取平方再求和之后,就得到一个服从χ2分布的 变量,即
F分布的主要性质有: ①F分布是一种非对称的分布,呈右偏态; ② F分布两个自由度:n1-1和n2-1,相应的分布记作F(n1-1,n2-
1)。通常n1-1称为分子自由度, n2-1称为分母自由度。
③随n1,n2的不断增大,F分布的右偏程度逐渐减弱,但不会趋向 正态;
④具有倒数性质即若X~F(n1,n2),则1/X~F(n1,n2);
(4) t 分布是一个分布族,对于不同的样本容量对应不同的 分布,且均值都为0;随着自由度的增大,分布也逐渐趋 于标准正态分布。
4.3抽样分布
(3) X与S2相互独立
(4) X ~ t(n 1)
Sn
已知, 2未知
(5) n ( Xi )2 ~ 2 (n)
i1
已知
LOGO
例1 设总体X 服从正态分布N (12, 2 ), 抽取容量为
25的样本,求样本均值X大于12.5的概率.如果(1)已
知 12;(2)未知,但已知样本方差S2 3.6.
n1 n2
服
从
F(n1,
n
)
2
分
布
.
LOGO
4.3.2 正态总体的抽样分布
由于要求具体抽样分布是困难的,有时甚至是不可 能的。正态总体的抽样分布有详尽的研究,本节主要 学习正态总体的抽样分布。
掌握正态分布、 2分布、t分布、F分布的一些结论
对于正态总体抽样分布的学习非常有用. 主要学习单个正态总体的抽样分布以及多个正态总
i1
于是P
10
i1
Xi 2
4
P
1 0.52
10 i1
Xi2
16
查表求02.10(10) 16.由此可得
P
10 i1
Xi
2
4
0.10.
(2) 由题设及定理4.3.2, 9S 2
0.52
10
P i1
(Xi
X )2
1
2.85
P
0.52
10 i1
查表得02.25(9) 11.4,由此可求得
n
n
该定理的证明由正态分布的性质3.1.10可得。
注意:当样本来自非正态总体时,若总体均值为,方差 为 样 本量2(充有分限大且时不,X为近零似)服,从由N中(心, 极)2.限定理可以证明当
概率与统计中的统计量与抽样分布
概率与统计中的统计量与抽样分布在概率与统计学中,统计量与抽样分布是两个重要的概念。
统计量是用来描述样本数据的特征,而抽样分布则是研究统计量在重复取样过程中的概率分布。
本文将介绍统计量和抽样分布的基本概念,并对其在概率与统计学中的应用进行讨论。
一、统计量的定义与分类统计量是用于对样本数据进行总结和描述的量。
它通过计算样本数据的函数得到,可以是一个数值、一个向量或一个矩阵。
常见的统计量包括样本均值、样本方差、样本标准差等。
样本均值是最常用的统计量之一,表示样本数据的平均水平。
对于一个具有n个观测值的样本,样本均值的计算公式为:1/n样本均值= Σ xi * -------i=1其中,xi表示第i个观测值。
样本方差是衡量样本数据分散程度的统计量。
它的计算公式为: 1/n样本方差 = Σ(xi - x)^2 * -------i=1其中,xi表示第i个观测值,x表示样本均值。
除了样本均值和样本方差,还有许多其他的统计量,如样本中位数、样本偏度、样本峰度等。
这些统计量在实际问题中起着重要的作用,可以帮助我们理解和分析数据。
二、抽样分布的基本概念抽样分布是指在某一总体中,从中抽取样本的所有可能组合,并计算其统计量的概率分布。
抽样分布的性质是概率论和数理统计中的重要内容。
它与样本容量、样本分布以及统计量的选择有关。
常见的抽样分布包括正态分布、t分布和F分布。
其中,正态分布是最重要和最常用的抽样分布,具有许多重要的性质。
对于均值为μ、方差为σ^2的正态总体,样本均值的抽样分布也服从正态分布,其均值为μ,方差为σ^2/n。
这一性质被称为中心极限定理,是许多统计推断方法的基础。
t分布是在样本容量较小、总体标准差未知的情况下使用的抽样分布。
t分布的形状与样本容量有关,当样本容量较大时,t分布逼近于标准正态分布。
F分布是用于比较两个样本方差是否显著不同的抽样分布。
F分布的形状取决于两个样本容量的大小,具有非对称的特点。
16几个常用的抽样分布与抽样分布定理
(s
0),
(s 1)
s (s) ,(12)
3
3.性质:
1)期望与方差
提示: 2
X
2 1
X
2 n
若 2 ~ 2(n),则 E( 2)= n,D( 2)=2n
证明: 因为Xi~N(0, 1)
所以
E
(
X
2 i
)
D( Xi
) [E( Xi
)]2
1 0 1
D(
X
2 i
)
E
(
X
4 i
)
[
2 1
/
2 2
~
F (n1
1, n2
1)
29
定理2结论(3)
假定
2 1
2 2
2,
就有
t T ( X Y ) (1 2 ) ~ S 1 n1 1 n2
(n1 n2 2)
其中
S2
(n11)S12 (n2 1)S22 n1 n 2 2
即
( X Y ) (1 2 )
13
T 的概率密度为
(s) xs1e x d x (s 0),
0
f (t)
( n 1) 2
(1
t2
)
n1
2,
(12)
t
n ( n) n
2
14
2.基本性质:
(1) f ( t ) 关于 t = 0(纵轴)对称。
(2) f ( t ) 的极限为 N(0, 1) 的密度函数,即
lim f (t) (t)
标准化
定理1:设总体 X ~ N ( , 2 ) ,X1, X2,…, Xn 是
来自总体 X 的样本,
抽样分布的名词解释
4.F分布:F分布是指F统计量的分布情况。F分布常用于F检验,用于比较两组样本的方差差异是否显著。
抽样分布的类型和使用场景不同,但都在统计学中扮演着重要的角色。通过对抽样分布的了解,可以帮助我们更加准确地进行统计分析,更好地掌握数据的分布情况。
抽样分布是指根据总体数据的抽样结果的分布情况。在统计学中,通过对样本的观察,可以推断出总体的分布情况。
常见的抽样分布包括正态分布、t分布、卡方分布、F分布等。
1.正态分布:正态分布是指数据呈现出高峰在中间,两侧逐渐递减的分布形态。正态分布常用于表示自然界中许多变量的分布情况,例如人群身高、体重等。
2.t分布:t分布是指在总体方差未知的情况下,样本方差的分布情况。t分布常用于统计分析中的t检验,用于比较两组样本的差异是否显著。
统计量的分布——抽样分布及其性质
$
$0
首先根据数学期望和方差的性质有4
(
+
=A
7
AB$
中国人民大学出版社!)%$6!1& '(( 蔡则元&三大抽样分布的理解与具体性质' :( &数
0
(
0
接下来对 学学习与研究 + + + 4
=A 7%E
=A 7E
=A 7()
AB3
AB$
AB3
曲天尧关于对统计推断中抽样分布的总结及判 (
,l%很显然该概率密度服从指数分布 因此) 分布为参 数7$ 的指数分布从而指数分布是作为一种特殊的)
)
根据函数的性质可得 槡 即自由
G/HF
-'
-
' 7
$
>8') )
)
度- 充分大时'-分布近似于正态分布
分布
对于'分布 给定常数 % jj$ 满足条件
科教论坛
!"#!$%&$'(') *+&,-./&$01$21(3$&)%)(%)%$3
科技风 年 月
统计量的分布
抽样分布及其性质
赵红妮
西安思源学院基础部!陕西西安!+#""""
摘4要数理统计是以概率论为基础的一个数学分支它从实际观测的数据出发研究随机现象的规律性 本文基于 正态分布的基础上研究三大抽样分布) 分布'分布和<分布的概念及性质图像结合例题对抽样分布做出更深一层的 理解与应用
关键词随机变量抽样分布正态分布
44概率论中假定随机变量的分布是在已知的基础上研 究随机变量的性质以及数字特征&而在现实生活中要研究
三大抽样分布的定义及应用
三大抽样分布的定义及应用三大抽样分布是指正态分布、t分布和卡方分布。
它们在统计学中具有重要的应用,并且广泛地被用于估计和推断总体参数。
正态分布是指具有钟形曲线的连续概率分布,其概率密度函数的形状由均值和标准差决定。
在实际应用中,正态分布广泛用于描述许多自然现象,例如人的智力分布、心脏跳动的间隔时间等等。
对于大样本量的情况下,根据中心极限定理,样本均值的分布可以近似服从正态分布。
因此,正态分布在统计推断中起到了至关重要的作用,例如用于构建置信区间、假设检验、回归分析等。
t分布是由英国统计学家威廉·戴韦提出的,是用来处理小样本量情况下的统计推断问题的一种概率分布。
t分布与正态分布相似,但是其概率密度函数的形状更加平坦,有更宽的尾部。
t分布的自由度是影响其形状的一个参数,自由度越小,尾部越厚重。
在小样本量的情况下,使用t分布进行统计推断可以更准确地估计总体参数。
例如,当样本量较小时,使用t分布来计算置信区间或进行假设检验,可以避免过度自信导致错误的推断结果。
卡方分布是由皮尔逊提出的,是应用在统计推断中的一种概率分布。
卡方分布常用于分析分类数据的相关性以及拟合度。
在这两个统计问题中,卡方分布提供了一个用于检验观察值与期望值之间的差异程度的方法。
卡方分布的自由度取决于数据的维度。
在统计推断中,卡方分布被广泛用于拟合度检验,例如用于检验样本的观察频数与理论频数是否有显著差异。
正态分布、t分布和卡方分布的应用在各个领域和学科中都非常广泛。
在医学研究中,这些分布被用于分析临床试验的数据,进行数据建模以及推断总体参数。
在市场研究中,这些分布被用于对市场数据进行概率分析和预测。
在财务管理中,这些分布被用于分析股价的波动性和风险评估。
在工程领域中,这些分布被用于分析产品的可靠性和质量控制。
总之,正态分布、t分布和卡方分布是统计学中的三大抽样分布,它们在统计推断中具有重要的应用价值。
通过使用这些分布进行数据分析和推断,我们可以准确地估计总体参数,进行假设检验,以及进行优化和决策制定等重要统计任务。
统计学中的抽样分布理论
统计学中的抽样分布理论统计学是一门深奥而又广泛应用的学科,其中抽样分布理论是其中一个重要支柱。
本文将从抽样、样本统计量和抽样分布三个方面进行论述,以便更好的理解其理论和应用。
一、抽样与样本统计量统计学的基本任务之一是推断总体特征。
但由于总体数据规模庞大,难以全面观察和分析,因此我们通常采用小样本的方式来代表总体。
这就是抽样的概念。
抽样是指从总体中随机抽取一部分数据,用这一部分数据代表总体,以此估计总体的特征。
常用的抽样包括简单随机抽样、分层抽样、整群抽样等。
在抽样中,一个样本统计量的重要性凸显出来,因为它可以帮助我们更好的估计总体的特征。
比如,一个数据集的均值和标准差就是两个重要的样本统计量。
二、抽样分布抽样分布是指在所有可能的样本中,某个样本统计量的分布情况。
这里需要区分参数(population)和统计量(sample statistic)之间的关系。
参数是总体参数,是我们想要研究的总体特征,比如总体均值、总体方差等。
统计量是在样本中计算出来的数值,比如样本均值、样本方差等。
样本统计量是对总体参数的估计,不同的样本统计量可能对总体参数的估计存在一定的差异。
抽样分布不同于总体分布。
总体分布是指总体中所有变量的分布,而抽样分布是指在所有可能的样本中,某个样本统计量的分布。
抽样分布是一个特殊的概率分布,其形状和参数取决于总体分布和样本大小。
这是因为在计算样本统计量时,会受到样本数量和样本变异的影响。
在实际使用中,我们通过抽样分布来推断总体参数。
具体方法是:首先,通过采样方法得到一个样本,计算该样本统计量的值。
然后,通过数学公式推算样本统计量的抽样分布,从而得到一个概率区间。
若该样本统计量恰好位于这个区间内,则认为该样本统计量的估计值与总体参数的差异可以用统计学上的概率来表示。
这个概率就是所谓的显著性水平(signicance level)。
三、中心极限定理中心极限定理是抽样分布理论中最为重要的定理之一。
6.2.常用统计量及抽样分布
1.
(n 1) S 2
2
~ 2 (n 1)
2. X 与 S 2 独立。 定理三 设 X 1 , X 2 , , X n 是来自正态总体N ( , 2 ) 的样本,X 是样
X , S 2 分别是样本均值和样本方差, 则有
X S/ n ~ t (n 1)
定理四 设 X 11,,X 22,,,X nn 与Y11,,Y22,,,,Ynn 是来自正态总体 N ((11,, 1212))和 N Y 是来自正态总体 N 和 设 X X , X 与Y Y 2 ) 和 N ( 2 , 2 ) 的样本,且这两个样本相互独立。设 n 1 1 n1 X i 1 X i , Y i 1 Yi 分别是这两个样本的均值; n2 n1 n 1 1 n1 2 2 2 S2 (Yi Y ) 2 S1 i1 ( X i X ) , n21 1 i 1 n1 1 分别是这两个样本的样本方差, 则有
则称随机变量
[(n1 n 2 ) / 2](n1 / n 2 ) n1 / 2 y ( n1 / 2 ) 1 , y0 ( y ) (n1 / 2)(n 2 / 2)[1 (n1 y / n 2 )]( n1 n2 ) / 2 0, 其它
其图形如右图所示
U / n1 F V / n2 服从自由度为 ((n1 ,,n 22)的2)) 服从自由度为 n1 n )的F 分布,记为 F ~ F n1 n
F (n1 , n 2 ) 分布的概率密度为
2 2 设 U ~ ( n1 ), V ~ (n 2 ), 且U , V 独立,
1 0.357 2.80
二、抽样分布定理
定理一 设 X 1 , X 2 , , X n 是来自正态总体N ( , 2 ) 的样本,X 是样 本,X 是样本均值,则有 X ~ N ( , 2 / n) 定理二 设 X 1 , X 2 , , X n 是来自正态总体N ( , 2 ) 的样本,X 是样 X , S 2 分别是样本均值和样本方差, 则有
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(21) 32.67,即 P (21) 32.67 0.05.
二、 t 分布
定义3: 设随机变量X~N(0,1),Y~ 2(n) ,且
X与Y相互独立,则称统计量 T X Y n
服从自由度为 n 的 t 分布, 记作 T~t(n). t分布的概率密度函数为
其图象如图 5-6 所示,其形状类似于标准正态分布 的概率密度函数的图象。 当 n 较大时, t 分布近似于标准正态分布。
2(卡方) — 分布
定义1: 设总体 X ~ N 0, 1 , X1, X 2 , ... , X n 是 X 的
2 2 2 2 X X X 一个样本,则统计量 1 2 n
的概率密度函数为
n x 1 1 x 2 e 2 x 0 n f ( x ) 2 2 ( n ) 2 x0 0
性质:若X~F(n1,n2),则 1 ~F(n2,n1)。
X
一、F分布的上侧分位点 对于给定的 (0< <1),称满足条件
P F(n1, n2) F(n1, n2)
F (n1, n2)
f(y)dy
的数F (n1,n2)为F分布的上侧分位点。
其几何意义如图5-7所示。 f (y)
(2)
(n 1)S 2
2
(X X )
i 1 i
2
2
~ (n 1)
2
(4.1)
与以下补充性质的结论比较: 性质 设(X1,X2,…,Xn)为取自正态总体
X~N( , 2)的样本,则
(X i ) i 1
n
2
2
~ (n)
2
2分布的上侧分位点
定义2:设 X ~ (n), 对于给定的正数(0 1 )称 , 满足条件 2 P X (n) 2 f ( x)dx
对于给定的 (0< <1),称满足条件 P T t(n) f(t)dt t (n)
t 分布的上侧分位点
的点t(n)为 t 分布的上分位点。 其几何意义见图5-7.
f(t)
O 图5-7
t(n) t
t 分布的双侧分位点
由于t分布的对称性,称满足条件
P T t 2(n)
定义5.5
与相互独立,则称随机变量 F
X n1 Y n2 服从第一自由度为n1,第二自由度为n2的F分布,
记作
三、F分布 设随机变量X~ 2(n1)、Y~ 2(n2),且
F~F(n1,n2),
其概率密度函数为:
n1 n1 n2 1 Ay 2 (1 n1 y) 2 , y 0 f(y) n2 y0 0, n1 n2 ( ) n n1 2 其中 A ( 1 ) 2 , 其图形见图5-9 (P108)。 n1 n2 n2 ( )( ) 2 2
n=1 n=4 n=10
图5-4
其图形随自由度 n 的不同而有所改变. x
0 1 3 5 7 9 11 13 15 17
性质1: 2分布的数学期望与方差
设 X ~ n ,则E( X ) = n,D( X ) = 2n.
2
性质2: 2分布的可加性
设 X1 ~ (n1), X 2 ~ (n2), 且 X1 , X 2 相互独立,
t分布的密度函数的图象相似于标准正态分布的密度
函数。当n较大时, t 分布近似于标准正态分布。
F分布
定义5.5 设随机变量X~ 2(n1)、Y~ 2(n2),且 X 与
X n1 Y 相互独立,则称随机变量 F Y n2
记作
服从第一自由度为n1,第二自由度为n2的F分布,
F~F(n1,n2).
(X X ) X nX =0
i 1
的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1
项是独立的.所以(4.1)式的自由度是n-1.
定理3:
设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则 2相互独立; (1) 样本均值 X 与样本方差 S n
2 (n1 1)S1 2 1 2 (n2 1)S2 2 2
2 S2 2 2
~ F(n1 1, n2 1)
U—分布 正态总体样本均值的分布
设总体 X ~ N ,
2
, X , X ,..., X 是 X 的一
1 2 n
个样本, 则样本均值服从正态分布
1 n Xi X n i 1 U ~ N 0,1 n n
2 1 n X X i ~ N , n i 1 n
2 —分布
定义 设总体 X ~ N 0,1 , X1, X 2 ,..., X n 是 X
2 2 的一个样本, 则称统计量 2 X12 X 2 服从自 X n
2 2 2 由度为 n 的 分布,记作 ~ (n) .
其中f (y)是F分布的概率密度。 O 图5-7
F(n1, n2) x
F 分布的上侧分位点 F(n1, n2)的值可由F 分布表查得. 附表5、6、7(P258~P266 )分 =0.1、 =0.05、 =0.01给出了F分布的上分位数.
查表时应先找到相应的 值的表.
当时n1=2, n2=18时,有 F
定理1 设(X1,X2,…,Xn)为取自正态总体X~N( , 2)
的样本,则
(X i ) i 1
n
2
2
~ (n)
2
证明: 由已知,有
Xi X i 则 ~ N(0, 1) ,且各 相互独立,
由定义1 :得
Xi ~ N( , 2)且X1,X2,…,Xn相互独立,
S S
证明 由已知条件知
2 (n1 1)S1 2 1
2
2 1 2 1
2 2 2 2
~ F(n1 1, n2 1)
2 (n2 1)S2 2 2
~ (n1 1),
(n1 1) (n2 1)
2 S1 2 1
~ (n2 1)
2
且相互独立,由F分布的定义有
2
( n )
2 的点 (n)为 2 (n)分布的上侧 分位点。
其几何意义见图5-5所示.
f(x )
其中f(x)是 2分布的概率密度。
显然,在自由度n取定以后, O 图5-5
2
(n) x
(n) 的值只与 有关。
2
例如:当 n = 21,
2 0.05
= 0.05 时,由附表3可查得,
0.01(2,
18)= 6.01
在附表5、6、7中所列的值都比较小,当 较大 时,可用下面公式 F1(n1, n2)
1 F(n2, n1) 1 1 例如, F0.99(18, 2) ≈0.166 F0.01(2,18) 6.01
量和样本方差; 且两个样本相互独立,则统计量
2 2 定理5.4 设 n1, S1 为正态总体 N( 1, 1 ) 的样本容 2 2 量和样本方差;n2, S2 为正态总体 N( 2 , 2 )的样本容
其几何意义如图5-8所示.
(5.12)
f(t)
的数t/2(n)为t分布的双侧分位点。
/2 - t/2(n)
/2
O t/2(n) 图5-8
t
在附表4 (P256)中给出了t分布的临界值表。
例如,当n=15,=0.05时,查t分布表得,
t0.05(15) =1.753 , t0.05/2(15) = 2.131 其中t0.05/2(15)可由P{t(15) ≥ t0.025(15)}=0.025查得。 但当n>45时,如无详细表格可查,可以用标准 正态分布代替t分布查t(n)的值. 即 当 n>45时, t(n) u 一般的t分布临界值表中,详列至n=30,当 n>30就用标准正态分布N(0, 1)来近似.
其中Sn
(5.10)
2 (n1 1)S1
2 2 S1、S2 分别为两总体的样本方差。
n1 n2 2
2 (n2 1)S2
,
证明:由例知 ( n1 1) S12
X Y ( 1 2 )
2
n1
2
~N (0,1)
2
~ 2ቤተ መጻሕፍቲ ባይዱ( n1 1),
n2 2 ( n2 1) S 2
( n 1) 2 t 2 f(t) (1 ) n n ( n) 2
n1 2
,
( t )
定理4
设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则统计量
X T ~t (n 1) S/ n 证: 由于 X 与S 2相互独立,且 2 X ( n 1) S 2 U ~ N(0,1), ~ (n 1) 2 n
自由度是指独立随机变量的个数, df
n
n 个相互独立的标准正态分布之平方和服从自由度
为 n 的 分布。
2
t— 分布
定义5.4
Y ~ 2(n) ,且 X 设随机变量 Y ~N(0, 1),
Y n
与 Y 相互独立,则称统计量 T X
服从自由度为n的t分布或学生分布,记作 T~t(n).
N 0,1 ~ t(n) 2 (n) n
2 称统计量 X X X 服从自由度为 n 的 分 2 2 布,记作 ~ (n).
2 2 1 2 2 2 n
其中(t )