三大抽样分布
三大抽样分布(1)概率论与数理统计习题 概率论与数理统计)
x2 x2
~ F (1,1)
4. 正态总体的样本均值与样本方差的分布
正态总体 N ( , 2 ) 的样本均值和样本方差
有以下两个重要定理.
定理一
设 X1, X 2, , X n 是来自正态总体N (, 2 )
的样本, X 是样本均值, 则有
(1) X ~ N (, 2 / n).即 X ~ N (0,1)
样本, X , S 2 分别是样本均值和样本方差, 则有
X ~ t(n 1).
S/ n
证明
因为 X ~ N (0,1), / n
(n 1)S 2
2
~ 2(n 1),
且两者独立, 由 t 分布的定义知
X (n 1)S 2 ~ t(n 1). / n 2(n 1)
n
2
πn
1
n 2
1
t2 n
n1 2
,
t
t 分布的概率密度曲线如图
显然图形是关于
t 0对称的.
当 n 充分大时, 其
图形类似于标准正
态变量概率密度的
图形. 因为lim h(t)
1
t2
e 2,
n
2π
所以当 n 足够大时 t 分布近似于 N (0,1) 分布,
1,
因为 1 F
~ F (n2 , n1 ),
所以
P
1 F
F1
(n2
,
n1
)
1
,
比较后得
F1
(n2 ,
三大抽样分布
三大抽样分布众所周知,在概率论中有二项分布、正态分布、泊松分布着三大分布,而统计学中也有三大抽样分布,分别是x2分布、t布和F分布。
这三大抽样分布的发现正好是现代统计学的形成时期,对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。
X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程,而t分布的发现来源于Gosset小样本理论的创立过程,F分布则是来源于Fisher创立方差分析理论的过程。
三大抽样分布的研究意义c.R.Rao曾经说过“在终极的分析中,一切知识都是历史,在抽象的意义下,一切科学都是数学,在理性的基础上,所有的判断都是统计学。
”这句话一语道破统计学的重要性。
三大抽样分布在统计学理论中占据着重要地位,由此可见,研究三大抽样分布对于科学研究有着重要意义。
在实际工作中,统计工作者对于三大抽样分布的研究必不可少,通过研究三大抽样分布的产生、发展和完善,能够充分了解三大抽样分布理论的重要性。
具体到统计学三大分布,对于三大分布理论的研究,能够在充分吸收前人研究成果的基础上不断进行理论创新,从而推动科学技术的进步。
纵观所有的科技进步,无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布,对于我国社会经济发展有着重要的推动作用。
三大抽样分布产生于19世纪末20世纪初,在统计学的发展过程中,每一次新的分析统计数据概率模型的发现,统计学理论都会发生一次重大飞跃。
为此,要想研究三大抽样分布,就应该对其发展过程进行研究。
统计量是样本的函数,是随机变量,有其概率分布,统计量的分布称为抽样分布。
X2分布x2的早期发展由于受到中心极限定理和正态误差理论的影响,正态分布一直在统计学中占据重要地位。
在很多数学家和哲学家心目中,正态分布是唯一可用的分析和解释统计数据的方法。
但是随着时代的发展,一些学者开始对正态性提出了质疑,随后,在多位科学家的试验验证下,正态分布与实际数据拟合不好的情况日渐凸显出来,科学家纷纷开始研究比正态分布范围更广的分布类型,波那个人产生了偏态分布,其中,x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel,他在研究气体分子运动的过程中引入了X2分布。
三大抽样分布课件
差异。
04
CATALOGUE
卡方分布
卡方分布的定义
定义
卡方分布是一种连续概率分布,描述 了随机变量的取值与自由度的平方之 间的比例关系。
公式
若随机变量X符合卡方分布,则X的概 率密度函数为f(x)=x^(n/2-1)e^(x/2)/2^(n/2)Γ(n/2),其中n为自由度 ,Γ为伽玛函数。
正态分布
正态分布的定义
01
正态分布是一种连续概率分布, 其概率密度函数呈钟形,对称轴 为均值所在直线,形状由标准差 决定。
02
正态分布是自然界中最常见的分 布形态,许多随机变量都服从或 近似服从正态分布。
正态分布的性质
01
02
03
集中性
正态分布曲线以均值为中 心,两侧分布对称。
均匀性
正态分布曲线是关于标准 差对称的,形状由标准差 决定。
t分布
t分布的定义
定义
t分布(也称为学生t分布)是一种 连续概率分布,其形状由自由度 参数决定。
描述
当数据来自正态分布的总体,且样 本量较小(通常n<30)时,t分布 近似于正态分布。
公式
t分布的密度函数和分布函数可以用 一系列复杂的数学公式来描述。
t分布的性质
形状
峰度
随着自由度的增加,t分布的形状逐渐 接近正态分布。
t分布的峰度大于正态分布的峰度,且 随着自由度的增加而减小。
偏度
t分布通常是偏态的,其偏度随着自由 度的增加而减小。
t分布在统计学中的应用
假设检验
在样本量较小时,t分布在假设 检验中常用作正态分布的替代,
用于检验统计假设。
概率论与数理统计(王明慈第二版)第5章数理统计的基本知识4-5
2
t 分布的概率密度函数图形如图所示
①关于x =0 对称; ②当k充分大时,其图形
k 30 k 3
与标准正态分布图形相似.
k 1
lim
k
ft ( x)
( x)
1
x2
e 2 ,xR
2π
t(30) N(0,1)
4/4/2020
13
例3. 设总体X和Y相互独立 ,且都服从 N (0,9),
X1, X 2 , , X 9和Y1,Y2 , ,Y9来自总体 X ,Y的样本,
自由度k:指χ 2
X
2 1
X
2中包含独立
k
变
量的个数.
特别地,当k=1时,若X1 ~ N (0,1),则X12 ~ (2 1)
4/4/2020
2
其概率密度函数:
1
k 1 x
f
2
(
x)
2
k 2
(
k 2
)
x
2
e 2 , x 0;
0,
x 0.
其图形随着参数k的变化而改变,如图所示
k2
k 6
k 1
26
第五节 正态总体统计量的分布
基本内容: 一、抽样分布——统计量的分布; 二、正态总体下的抽样分布
4/4/2020
27
一、统计量的分布
统计量是对样本信息的“加 它依赖于样本,
工”, 由于样本是随机变量,
所以统计量也是随机变量,
故统计量有一定的概率分布.
我们称统计量的分布为抽样分布.
4/4/2020
在这样的背景下,十九世纪初英国一位年经
酿酒化学技师Gosset W S,他在酒厂从事试验和
概率论与数理统计 7.2 数理统计中的三大分布
7.2 数理统计中的三大抽样分布
在数理统计中,以标准正态变量为基石而构 造的三个著名统计量有着广泛的应用,这是因为 这三个统计量不仅有明确背景,而且其抽样分布 的密度函数有明显的数学表达式,它们被称为统 计中的“ 三大抽样分布 ” 。
1. 2 分布
数理统计
2分布是由正态分布派生出来的一种分布.
t1 (n) t (n)
o t (n)
x
t分布的上分位点t (n)可查表
求得,例t0.025(15) 2.1315.
当n 45时,对于常用的的值,可用正态近似 t (n) z
例3:X ~ t(15)
(1)求 0.01的上侧分位数; (2) P( X ) 0.05,求 ; (3)P( X ) 0.95 ,求 .
记为 t ~ t(n). t分布概率密度函数为:
f (t)
[(n 1)
2]
(1
t
2
)
n1 2
,
t
(n 2) n n
t 分布的图像
y N (0,1) 数理统计
t(n)
t分布的性质: 1. 设t ~ t(n),则E(t) 0, D(t) n (n 2) (n 2)
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
F分布的上分位点的性质:
F1 (n1, n2 )
1 F (n2 , n1 )
F分布的上分位点可查表求得.例,
F0.95 (12,9)
1 F0.05 (9,12)
1 2.80
0.357
例4. F ~ F (24,15),求 1,2 使 P(F 2 ) 0.025 P(F 1) 0.025
§5.4三大抽样分布
所以 Y ( y1 ,, yn )T 的各分量相互独立.
n 1 由于 x y1 , ( n 1) s 2 yi2 . x与s 2相互独立. n i 2
1 n 1 21 1 A 3 2 1 n( n 1)
n
( n 1) s 2 yi2,
i2
yi N (0, ), i 2,3, , n.
2
y2 ,, yn相互独立.
( n 1)
2
yi 2 s ~ (n 1). i 2
n
2
2
15
定理2:设( X 1 , X 2 ,, X n )是来自正态总体N ( , )的
1 n 1 21 1 3 2 1 n( n 1)
1 n 0
1 3 2 1 n( n 1)
0 0 1 n( n 1) 1 n
14
(3)
( n 1)
2
s 2 ~ 2 ( n 1).
2 i 1 2 i 2 1 2 2 n 2 n
服从自由度为n的 2分布, 记作 2 ~ 2 (n) . 注:服从 2分布的随机变量取值非负,其密度函数为 n x 1 1 x2 e 2 , x 0 n 2 n 2 ( x; n) 2 ( ) Γ ( s ) x s1e x dx , s 0, 2 0 0, x0
4
n=4
2 分布的性质:
n=6 n=10
1、随n的增大,其偏度越来越小。
2、 2分布表——P425 附表三
2
即是分布函数数值表.
2
n 1 3、 分布是Ga分布的特例,即有 ( n) Ga( , ) . 2 2 4、 2分布具有可加性:
5-4三大抽样分布
三、t 分布 设X1~N(0,1) , X2~ (n ) , 且X1与X2相 X1 互独立,则称变量 t
1、定义:
2
X2 n
所服从的分布为自由度为 n的 t 分布.
例2:
若总体X ~ N ( 0,1),从此总体中取一个容量为
6的样本X 1 , X 2 ,X 6 , 设 Y ( X1 X 2 X 3 ) ( X 4 X 5 X 6 )
2 2 2
试决定常数C,使随机变量CY服从 分布 .
解:
因为
X 1 X 2 X 3 ~ N (0, 3), 所以
2
( y 0)
F
( y1 ym ) / m ( x1 xn ) / n
2 2
p( y )
( m2 n )
m
m 2
1
( ) ( )
m 2 n 2
( ) 2 ( y)
m n
1
m n
y
n n 2
m (n 2) (n 4)
2
( y 0)
1
1 2 2 3 43 5 4 6 5 6
2. F分布的性质
(1).F分布的数学期望
E(F )
n n2
(n>2)
即它的数学期望并不依赖于第一自由度m. (2).F分布的分位数
对于给定的 (0 1), 称满足条件
P F F1 (m, n)
F ( m , n ) 1
p( y )dy 1
的点F1 (m, n)为F (m, n)分布的1- 分位数. 如图所示.
三大抽样分布的理解与具体性质
数学学习与研究 2019. 12
பைடு நூலகம்
( ) 还有一个实用的结论,Γ
1 2
= 槡π.
若 X ~ Γ( α,β) ,我 们 可 以 计 算 出 它 的 矩 母 函 数 为
MX ( t) = ( 1 - βt) -α ,下面的分布就与这个矩母函数有关. 三、三大分布的性质
( 一) 卡方分布
1. 定义
如果 Z ~ N( 0,1) ,且 X = Z2 ,我们就说 X 服从自由度为
1 的卡方分布,记作 X ~ χ21 . 证明如下:
FX ( x) = P( X ≤ x) = P( Z2 ≤ x) = P( - 槡x ≤ Z ≤槡x) ,
FX ( x) = FZ ( 槡x) - FZ ( - 槡x) ,
求导可得,fX ( x) =
1
1
x-
1 2
e
-
x 2
,
2 2 槡π
( ) 或者 fX( x)
二、预备知识
如果一个随机变量 X 服从形状参数为 α,尺度参数为 β
的伽马分布,我们记 X ~ Γ( α,β) ,那么其概率密度函数为
f( x)
=
x
α
-1
e
-
x β
βαΓ( α)
,α,β
>
0,x ≥ 0,则 E(
X)
= αβ,Var( X)
=
∫∞
αβ2 ,其中 Γ( α) 为伽马函数,且 Γ( α) = xα-1 e -x dx,另外 0
交流平台
JIAOLIU PINGTAI
143
三大抽样分布的理解与具体性质
◎蔡则元 ( 甘肃省兰州市榆中县兰州大学榆中校区,甘肃 兰州 730107)
三大抽样分布及常用统计量的分布
(n1
1) S12
2
~
2
(n1
1),
(n2
1)S
2 2
2
~
2
(n2
1)
且S12与S22相互独立,由 2分布的性质知
(n1 1)S12
2
(n2 1)S22
2
~ 2 (n1
n2
2)
再由定义3知
T
X
Y Sn
(1
1 n1
1
2
)
~t(n1
n2
n2
- 2)
t 分布的上侧分位点
对于给定的 (0< <1),称满足条件
X
2 i
.
i2
i4
解 (1) 因为Xi~N(0,1),i=1, 2, …, n. 所以
X1-X2 ~N(0, 2),
X
2 3
X
2 4
~
2(2),
X1
X2 2
~
N(0,1),
故
X1 X2
X
2 3
X
2 4
(X1
X
X 2)
2 3
X
2 4
2
~t(2).
2
例1 设总体X~N(0,1), X1,X2,…,Xn为简单
/2
/2
- t/2(n) O t/2(n) t
图5-8
在附表4 (P256)中给出了t分布的临界值表.
例如,当n=15,=0.05时,查t分布表得,
t0.05(15)= 1.753
t0.05/2(15)= 2.131
其中t0.05/2(15)由P{t(15)≥t0.025(15)}=0.025查得.
三大抽样分布
F(n1, n2)为F(n1, n2)的上侧分位点;
1 注: F1 (n1 , n2 ) F (n2 , n1 )
F (n1 , n2 )
若X 1 , Y1 ,
, X n1 来自正态总体X, X ~ N ( 1 , 12 ),
2 , Yn2 来自正态总体Y, Y ~ N ( 2 , 2 ), 且两样本独立.
当
2 ( n)
2.t 分布
关于t分布的早期理论工作,是英国统计学家威廉· 西利· 戈塞 特(Willam Sealy Gosset)在1990年进行的。 t分布是小样本分布,小样本一般是指n<30。t分布适用于 当总体标准差未知时用样本标准差s代替总体标准差σ,由
样本平均数推断总体平均数及两个小样本之间差异的显著性
χ2 分布是海尔墨特(Hermert)和卡· 皮尔生(K· Pearson) 分别于1875年和1890年导出的。它主要适用于对拟合优度检 验和独立性检验,以及对总体方差的估计和检验。 χ2 分布是一种抽样分布。当我们对正态随机变量随机地重 复抽取个数值,将每一个值变换成标准正态变量,并对这个 新的变量分别取平方再求和之后,就得到一个服从χ2分布的 变量,即
F分布的主要性质有: ①F分布是一种非对称的分布,呈右偏态; ② F分布两个自由度:n1-1和n2-1,相应的分布记作F(n1-1,n2-
1)。通常n1-1称为分子自由度, n2-1称为分母自由度。
③随n1,n2的不断增大,F分布的右偏程度逐渐减弱,但不会趋向 正态;
④具有倒数性质即若X~F(n1,n2),则1/X~F(n1,n2);
(4) t 分布是一个分布族,对于不同的样本容量对应不同的 分布,且均值都为0;随着自由度的增大,分布也逐渐趋 于标准正态分布。
三大抽样分布
U ~ 2(n1 ),
F ( n2 , n1 )
V
~
2 (n2 ) , 使F
U / n1 V / n2
(2) 若 t ~ t(n), 则 t 2 ~ F (1, n) (P130-习8)
简证: t : t(n) X : N (0,1), Y : 2(n),使t X
Y /n t 2 X 2 , X 2 : 2(1), Y : 2(n), F分布定义
第四节 抽样分布(重点)
主要内容(2学时)
一、卡方分布( 2分布)。
二、t分布。 三、F分布。 四、正态总体的样本均值、样本方差的分布。
说明: 统计量是样本的函数,是随机变量,有其概率
分布,统计量的分布称为抽样分布.
要求: 了解 2 分布、t 分布、F 分布的定义,及来自
正态总体X的样本均值的分布等常见统计量的分布。
(50)
:
n 50 45
z0.05 1.645
2 0.05
(50)
1 2
(z0.05
2 * 50
1)
1 2
(1.645
99) 67.221
(2) P( X A) 1 0.025 0.975
A
2 0.975
(6)
1.237
例2 设X1 , X 2 , ..., X10为总体N (0, 0.32 )的一个样本,
会查 2 分布、t 分布、F 分布的上分位数。
一、卡方分布( 2 分布 )
1、定义(重点)
设 X1 , X 2 , L , Xn 是来自标准正态总体 N (0 , 1)
的一 个样本,令 2
X 12
X
2 2
L
X
2 n
数理统计中的三大抽样分布理论系统与题型题法
一、 三大抽样分布的分布函数综 述:)a 根据大数定理和中心极限定理,但样本容量n 较大时(数学上一般要求45n >),任何分布都依概率收敛于正态分布()2, N μσ,并可标准化为()0, 1N 。
)b 现实世界和工程技术中的任何数据样本流到目前为止,不外乎()0, 1N 的函数分布,集中表现为3大抽样分布规律。
)c 考研数学中规定:()0, 1N 的分位数定义为下分位数(从图形上看为左边面积),3 大抽样分布的分位数定义都为上分位数(从图形上看为右边面积)1. ()2n χ分布(分布函数不要求掌握)量纲模型:性 质:()1{}i X ()2 可加性212~()n n χ+++()3证 明()3:由于()()()~0,10; 1i i i X N E X D X ⇒==()()()()()2224421 1,2,,3i i i i x iE X E X E X D X i n E X x edx +∞--∞=-===⎡⎤⎣⎦==()()()()()()()()()224222211222113122iii n ni i i i n n i i i i D X E X E X E n E X E X n D n D X D X nχχ====⎡⎤=-=-=⎣⎦⎛⎫=== ⎪⎝⎭⎛⎫=== ⎪⎝⎭∑∑∑∑样本函数中的必需记住的数字特征()4 上分位点 α定义为()2n χ分布的分位数2. ()t n 分布(分布函数不要求掌握){}i X 独立同分布 2~(0,1), ~(); i X N Y n X Y χ和独立 性 质:()1 t 分布密度函数()()~(0,1)t n n f x N →∞⇒()2 上分位点 α定义为()t n 分布的分位数()3 ()0, 22nEX DX n n ==>- ()4 性质T 分布具有对称性, 1()(); 45t nt n n αα-=->时,()t n Z αα≈3.(), F m n 分布(分布函数不要求掌握)X 、Y 相互独立,2~(); ~()X m Y n χχ;量纲模型:例:假定()12, X X 来自正态整体()2~0, X N σ的一个样本,求()()2122124X X P X X ⎡⎤+<⎢⎥-⎢⎥⎣⎦。
三大抽样分布知识点一览
三大抽样分布知识点一览抽样分布的概念抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。
抽样分布是统计推断的理论基础。
如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。
抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。
如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。
由平均数构成的新总体的分布,称为平均数的抽样分布。
随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。
三大抽样分布1. 卡方分布χ2(n)定义:若n个相互独立的随机变量ξ₁、ξ₂、……、ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。
2. t分布定义:设X1服从标准正态分布N(0,1),X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量t=X1(X2/n)1/2所服从的分布为自由度为n的t分布。
3. F分布定义:设X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量F=(X1/m)/(X2/n)所服从的分布为F分布,其中第一自由度为m,第二自由度为n。
与正态分布一同构成数理统计中的四大分布。
由标准正态总体样本的适当组合构成的统计量形成数理统计中的其他三大基础分布。
所以,数理统计中总是以正态总体作为研究对象展开。
在数理统计中,"总体"、"抽样"、"样本"是三个基本概念,分位点是"小概率事件"发生的临界点,置信区间是参数估计和假设检验的核心计算问题。
抽样分布的名词解释
4.F分布:F分布是指F统计量的分布情况。F分布常用于F检验,用于比较两组样本的方差差异是否显著。
抽样分布的类型和使用场景不同,但都在统计学中扮演着重要的角色。通过对抽样分布的了解,可以帮助我们更加准确地进行统计分析,更好地掌握数据的分布情况。
抽样分布是指根据总体数据的抽样结果的分布情况。在统计学中,通过对样本的观察,可以推断出总体的分布情况。
常见的抽样分布包括正态分布、t分布、卡方分布、F分布等。
1.正态分布:正态分布是指数据呈现出高峰在中间,两侧逐渐递减的分布形态。正态分布常用于表示自然界中许多变量的分布情况,例如人群身高、体重等。
2.t分布:t分布是指在总体方差未知的情况下,样本方差的分布情况。t分布常用于统计分析中的t检验,用于比较两组样本的差异是否显著。
三大抽样分布(F、t、X2)
(三)三大抽样分布(l)t分布首先,我们应把注意力放在服从t分布的t变量的构造上。
设百,叼,…,凝是来自正态总体您)的一个样本.则有:对样本均值x施行标准化变换,则有:公=与=向〜)〜秋o,D当用样本标准差S代替上式中的总体标准差b,则上式U变量改为t变量,标准正态分布N①,1)也随之改为''自由度为n-1的t分布” .记为.即:――G-〃) -.[修一V尾部概率产(x>3) =0.00155. F(r >3) >0,02自由度为n-1的t分布的概率密度函数与标准正态分布N(0, 1)的概率密度函数的图形大致类似,均为对称分布,但它的峰比N(0, 1)的峰略低一些,而两侧尾部要比N①,1)的两侧尾部略粗一点,参见图1.3-8。
当自由度超过3。
后,两者区别已很小,这时可用N9, 1)代替1号-1)・(2) /分布设百,叼,…,演是来自正态总体从(人〃)的一个样本,则其样本方差一的n-l倍(也即离差M平方和2:(々- 3)2除以总体方差的分布是自由度为n-1的Z?分布,记为才 2 (% 一1),即:2-1♦一?S - = £ - 2)2 / /〜F 伽-1)自由度为n-1的1?分布的概率密度函数在正半轴上呈偏态分布,参见图1.3-9o(3)F 分布设有两个独立的正态总体N (〃i ,/)和4),它们的方差相等。
又设x P 叼,…,/是来自N (〃i ,〃)的一个样本;Xp -一,是来自》(外,〃)的一个样 本 > 两个样本相互独立。
它f 门的样本方差比的分布是自由度为n-1和的F 分布:其中n-1称为分子自由度或第1自由度;m-1称为分母自由度或第2自由度■ F 分布的概率密度函数在正半轴上呈偏态分布,参见图l.3-10o阳131。
尸储加-1)的IK 率密度函数 n-X _次(演-五)2 1 2-1〜F (力一 L W-1)。
三大抽样分布的定义及应用
三大抽样分布的定义及应用三大抽样分布是指正态分布、t分布和卡方分布。
它们在统计学中具有重要的应用,并且广泛地被用于估计和推断总体参数。
正态分布是指具有钟形曲线的连续概率分布,其概率密度函数的形状由均值和标准差决定。
在实际应用中,正态分布广泛用于描述许多自然现象,例如人的智力分布、心脏跳动的间隔时间等等。
对于大样本量的情况下,根据中心极限定理,样本均值的分布可以近似服从正态分布。
因此,正态分布在统计推断中起到了至关重要的作用,例如用于构建置信区间、假设检验、回归分析等。
t分布是由英国统计学家威廉·戴韦提出的,是用来处理小样本量情况下的统计推断问题的一种概率分布。
t分布与正态分布相似,但是其概率密度函数的形状更加平坦,有更宽的尾部。
t分布的自由度是影响其形状的一个参数,自由度越小,尾部越厚重。
在小样本量的情况下,使用t分布进行统计推断可以更准确地估计总体参数。
例如,当样本量较小时,使用t分布来计算置信区间或进行假设检验,可以避免过度自信导致错误的推断结果。
卡方分布是由皮尔逊提出的,是应用在统计推断中的一种概率分布。
卡方分布常用于分析分类数据的相关性以及拟合度。
在这两个统计问题中,卡方分布提供了一个用于检验观察值与期望值之间的差异程度的方法。
卡方分布的自由度取决于数据的维度。
在统计推断中,卡方分布被广泛用于拟合度检验,例如用于检验样本的观察频数与理论频数是否有显著差异。
正态分布、t分布和卡方分布的应用在各个领域和学科中都非常广泛。
在医学研究中,这些分布被用于分析临床试验的数据,进行数据建模以及推断总体参数。
在市场研究中,这些分布被用于对市场数据进行概率分析和预测。
在财务管理中,这些分布被用于分析股价的波动性和风险评估。
在工程领域中,这些分布被用于分析产品的可靠性和质量控制。
总之,正态分布、t分布和卡方分布是统计学中的三大抽样分布,它们在统计推断中具有重要的应用价值。
通过使用这些分布进行数据分析和推断,我们可以准确地估计总体参数,进行假设检验,以及进行优化和决策制定等重要统计任务。
§5.4 三大抽样分布
x
p(x)
2 P ( χ 2 ≤ χ p (n)) = p
例 n = 10
α = 0.05
p
2 χ p ( n)
x
2 2 P ( χ 2 ≤ χ0.05 (10) = 0.05 ) P( χ 2 ≥ χ0.05 (10) ) = 0.95 = 3.9403 = 3.9403 2 2 2 P( χ 2 ≤ χ0.95 (10) ) = 0.95 P ( χ ≥ χ0.95 (10)) = 0.05 = 18.307 = 18.307 2 2 P( χ 2 ≥ χ0.975 (10) ∪ χ 2 ≤ χ0.025 (10) ) = 0.05 = 3.2470 = 20.4832
χ 2 (m −1)
χ (n −1)
x ~ N ( µ1 ,
σ 12
m
) y ~ N (µ 2 ,
2 σ2
n
)
(2)样本均值差的分布 2 σ 12 σ 2 (x − y) − (µ1 − µ2 ) X1 = ~ N(0,1) x − y ~ N ( µ1 − µ 2 , + ) 2 m n σ12 σ2
P(
2 χ0.025 (10)
= 3.2470
≤ χ2 ≤
2 χ0.975(10) )
= 20.4832
= 0.95
二、F分布 分布
1、构成的统计量的形式 、
2 2
第一自由度
X1 / m X 1 ~ χ ( m) X 2 ~ χ ( n) ⇒ F = ~ F (m, n) X2 /n 第二自由度
2、定理 、 X1 / m 1 X2 /n F= ~ F (m, n), 则 = ~ F (n, m) F X1 / m X2 /n
5.4三大抽样分布
X 1 ~ χ 2 (n1 )
X 2 ~ χ 2 (n2 )
X1,X2 相互独立,则X1+X2 ~χ2(n1+n2) 相互独立, 例1
X ~ N (µ ,σ 2 )
2
(X1,X2,X3)为X的一个样本 为 的一个样本
2 2
求 X 1 − µ + X 2 − µ + X 3 − µ 的分布。 的分布。
1-α α α
t1−α (n)
tα (n) t1−α (n)
(2)对称性
t1−α (n) = −tα (n)
求t 0.05 (10)
三、 F—分布 分布
问题:1/F服从什么分布?
1、定义 若X~χ2(n1),Y~χ2(n2) ,X,Y独立,则 、 独立, , 独立
X n1 F= ~ F (n1 , n2 ) Y n2
称为第一自由度为n1 ,第二自由度为 2的F—分布, 第二自由度为n 分布, 称为第一自由度为 分布 其概率密度为
n1 −1 n1 + n 2 n1 / 2 2 )(n1 / n2 ) y Γ( 2 , h( y ) = n1 n2 n1 ( n1 + n2 ) / 2 Γ( 2 )Γ( 2 )(1 + n y ) 2 0, y≤0
解:a=1/20, b=1/100
2.设t 1−α (n)为t分布的1 − α分位数 P (T < t 1−α (n)) = P (| T |> t 1−α (n)) =
1-α 2α
P(T < − t 1−α (n)) =
α
三、有关正态总体的几个主要结果
X −µ X 1 , X 2 ,⋯, X n ~ N ( µ , σ 2 ) 则 U = ~ N (0, 1) 1、若 、
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P{t? t1-? (n)} = 1- ?
则称 t1-? (n)为
t(n) 的下侧1- ? 分位点.
12 February 2020
第15页
t1?? (n)
第五章 统计量及其分布
第16页
当随机变量t ?t(n) 时,称满足
P(t ? t1?? (n)) =1? ? 的 t1??(n) 是自由度为 n 的 t 分布的1? ? 分位数.
12 February 2020
第13页
第五章 统计量及其分布
第14页
? 自由度为1的 t 分布就是标准柯西分布,
它的均值不存在;
t1( x)
?
1
? (1 ?
x2)
,
?? ? x? ?.
? n?1时, t 分布的数学期望存在且为 0;
? n?2时,t 分布的方差存在,且为 n/(n?2);
? 当自由度较大 (如n?30) 时, t 分布可以用
?? b ( 3 X 3 ? 4 X 4 ) ~ N ( 0 ,1 )
?? D [ ?
a ( X 1 ? 2 X 2 )] ? 1
?? D [ b ( 3 X 3 ? 4 X 4 )] ? 1
?a =1/20 b=1/100
12 February 2020
第五章 统计量及其分布
第7页
5.4.2 F 分布
12 February 2020
第五章 统计量及其分布
t(n) 的概率密度为 :
第12页
12 February 2020
第五章 统计量及其分布
t 分布的密度函 数的图象是一个 关于纵轴对称的 分布,与标准正 态分布的密度函 数形状类似 ,只 是峰比标准正态 分布低一些尾部 的概率比标准正 态分布的大一些。
定义5.4.2 设X1 ? ?2(m), X2 ? ?2(n), X1与X2独立,
则称 F =(X1/m)/(X2/n) 的分布是自由度为 m 与 n 的 F分布,记为F ? F(m, n),其中m 称为分子自
由度,n 称为分母自由度。其概率密度为
12 February 2020
第五章 统计量及其分布
第五章 统计量及其分布
第1页
§5.4 三大抽样分布
大家很快会看到,有很多统计推断是基于正 态分布的假设的,以标准正态变量为基石而 构造的三个著名统计量在实际中有广泛的应 用,这是因为这三个统计量不仅有明确背景, 而且其抽样分布的密度函数有明显表达式, 它们被称为统计中的 “ 三大抽样分布 ” 。
12 February 2020
分位数 t1?? (n) 可以从附表 4中查到。
譬如 n=10,? =0.05,那么从附表 4上查得
t1?0.05(10) = t0.95(10)=1.812 .
由于 t 分布的密度函数关于 0 对称, 故其分位数间 有如下关系
t? (n? 1)= ? t1??(n? 1)
12 February 2020
该密度 函数的 图象也 是一只 取非负 值的偏 态分布
12 February 2020
第8页
第五章 统计量及其分布
第9页
2. F — 分布的分位点
对于 0<? <1,若存在
F1-? (m, n)>0 满足
P{F? F1-? (m, n)} = 1-? ,
则称 F1-? (m, n)为
F(m, n)的下侧1- ? 分位数
正态分布 N(0,1)近似。
lim
n? ?
tn ( x)
?
1 e? x2 2,
2?
12 February 2020
第五章 统计量及其分布
t(n) 的性质: (1) p(t) 关于 t=0 (纵轴) 对称。 (2) p(t) 的极限为 N(0,1) 的密度函数.
分位点
设T~t(n),若对0<? <1,
第3页
?2—分布的密度函数曲线
这是一个特殊的Gamma分布Γ(n/2,1/2)
?2 分布的性质:
分布可加性 若X~?2(n1),Y~?2(n2 ), X 与 Y 独立,则 X+ Y~?2(n1+n2 ).
12 February 2020
第五章 统计量及其分布
第4页
当随机变量 ?2 ? ?2(n) 时,对给定 ? (0?? ?1),称满足
第五章 统计量及其分布
注:
第17页
12 February 2020
第五章 统计量及其分布
第18页
例 设随机变量 X 和Y 相互独立且都服从正态分
布 则
N ,(而0,9)
和 X1,? ,分X9别是Y1来,?自,Y总9 体 X和Y的 s.r.s,
U ? X1 ? ? X9 ~ t (9) Y12 ? ? Y92
12 February 2020
第五章 统计量及其分布
F — 分布性质:
第10页
12 February 2020
第五章 统计量及其分布
第11页
5.4.3 t 分布
定义 5.4.3 设随机变量 X1 与X2 独立,
且X1 ? N(0,1), X2 ? ?2(n), 则称
t=X1/? X2/n
的分布为自由度为 n 的t 分布,记为 t ?t(n) 。
? 证明:
X
?
1 9
9 i?1
Xi
~
N( 0,1 ),
Yi ~ N ( 0 ,1 ) 3
? ? 故
Y~ ?
9 i?1
(Yi )2 3
?
1 9
9 i ?1
第五章 统计量及其分布
第2页
5.4.1 ?2 分布(卡方分布)
定义5.4.1 设 X1, X2,…, Xn, 独立同分布于标准
正态分布N(0,1) ,则?2= X12+… Xn2的分布称 为自由度为 n 的?2分布,记为 ?2 ? ?2(n) 。
ቤተ መጻሕፍቲ ባይዱ
12 February 2020
第五章 统计量及其分布
P(?2 ? ?1?? 2(n)) 的 ?1? ? 2(n) 是自由度为n? 1的卡方分布 的1?? 分位数.
分位数 ?1?? 2(n) 可以从附表3 中查到。
12 February 2020
第五章 统计量及其分布
第5页
该密度函 数的图像 是一只取 非负值的 偏态分布
E? 2 ? n,
Var( ? 2 ) ? 2n
12 February 2020
第五章 统计量及其分布
第6页
例 设 X1 , X2 ,是X取3 , 自X4总体 N(0,4)的简单随机样
本.
X ? a(X1 ? 2X2)2 ? b(3X3 ? 4X4)2
当a= , b= 时,则
X ~ ? 2 (2).
解:由题意得
?? ?
a ( X 1 ? 2 X 2 ) ~ N ( 0 ,1 )