三大抽样分布
三大抽样分布(1)概率论与数理统计习题 概率论与数理统计)
x2 x2
~ F (1,1)
4. 正态总体的样本均值与样本方差的分布
正态总体 N ( , 2 ) 的样本均值和样本方差
有以下两个重要定理.
定理一
设 X1, X 2, , X n 是来自正态总体N (, 2 )
的样本, X 是样本均值, 则有
(1) X ~ N (, 2 / n).即 X ~ N (0,1)
样本, X , S 2 分别是样本均值和样本方差, 则有
X ~ t(n 1).
S/ n
证明
因为 X ~ N (0,1), / n
(n 1)S 2
2
~ 2(n 1),
且两者独立, 由 t 分布的定义知
X (n 1)S 2 ~ t(n 1). / n 2(n 1)
n
2
πn
1
n 2
1
t2 n
n1 2
,
t
t 分布的概率密度曲线如图
显然图形是关于
t 0对称的.
当 n 充分大时, 其
图形类似于标准正
态变量概率密度的
图形. 因为lim h(t)
1
t2
e 2,
n
2π
所以当 n 足够大时 t 分布近似于 N (0,1) 分布,
1,
因为 1 F
~ F (n2 , n1 ),
所以
P
1 F
F1
(n2
,
n1
)
1
,
比较后得
F1
(n2 ,
常用的三种抽样分布
常用的三种抽样分布
概述
在统计学中,抽样分布是指从总体中抽取一定数量的样本,并计算样本统计量的分布。
根据中心极限定理,当样本数足够大时,样本的均值和标准差会呈正态分布。
然而,并非所有的抽样分布都符合正态分布。
本文将介绍统计学中常用的三种抽样分布,包括正态分布、t分布和χ²〔卡方〕分布。
1. 正态分布〔Normal Distribution〕
正态分布是最常见的一种抽样分布,也被称为高斯分布。
它具有以下特点: - 均值为μ,标准差为σ; - 对称分布,其曲线呈钟型,两侧尾部逐渐下降; - 总体分布和抽样分布均为正态分布; - 标准正态分布
的均值为 0,标准差为 1。
可以通过标准化计算将任意正态分布转换为标准正态分布。
正态分布在实际应用中非常重要,尤其是在假设检验和置信区间计算中的应用广泛。
2. t分布〔Student’s t-Distribution〕
t分布是由英国统计学家William Sealy Gosset〔也被称为。
三大抽样分布
三大抽样分布众所周知,在概率论中有二项分布、正态分布、泊松分布着三大分布,而统计学中也有三大抽样分布,分别是x2分布、t布和F分布。
这三大抽样分布的发现正好是现代统计学的形成时期,对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。
X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程,而t分布的发现来源于Gosset小样本理论的创立过程,F分布则是来源于Fisher创立方差分析理论的过程。
三大抽样分布的研究意义c.R.Rao曾经说过“在终极的分析中,一切知识都是历史,在抽象的意义下,一切科学都是数学,在理性的基础上,所有的判断都是统计学。
”这句话一语道破统计学的重要性。
三大抽样分布在统计学理论中占据着重要地位,由此可见,研究三大抽样分布对于科学研究有着重要意义。
在实际工作中,统计工作者对于三大抽样分布的研究必不可少,通过研究三大抽样分布的产生、发展和完善,能够充分了解三大抽样分布理论的重要性。
具体到统计学三大分布,对于三大分布理论的研究,能够在充分吸收前人研究成果的基础上不断进行理论创新,从而推动科学技术的进步。
纵观所有的科技进步,无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布,对于我国社会经济发展有着重要的推动作用。
三大抽样分布产生于19世纪末20世纪初,在统计学的发展过程中,每一次新的分析统计数据概率模型的发现,统计学理论都会发生一次重大飞跃。
为此,要想研究三大抽样分布,就应该对其发展过程进行研究。
统计量是样本的函数,是随机变量,有其概率分布,统计量的分布称为抽样分布。
X2分布x2的早期发展由于受到中心极限定理和正态误差理论的影响,正态分布一直在统计学中占据重要地位。
在很多数学家和哲学家心目中,正态分布是唯一可用的分析和解释统计数据的方法。
但是随着时代的发展,一些学者开始对正态性提出了质疑,随后,在多位科学家的试验验证下,正态分布与实际数据拟合不好的情况日渐凸显出来,科学家纷纷开始研究比正态分布范围更广的分布类型,波那个人产生了偏态分布,其中,x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel,他在研究气体分子运动的过程中引入了X2分布。
三大抽样分布课件
差异。
04
CATALOGUE
卡方分布
卡方分布的定义
定义
卡方分布是一种连续概率分布,描述 了随机变量的取值与自由度的平方之 间的比例关系。
公式
若随机变量X符合卡方分布,则X的概 率密度函数为f(x)=x^(n/2-1)e^(x/2)/2^(n/2)Γ(n/2),其中n为自由度 ,Γ为伽玛函数。
正态分布
正态分布的定义
01
正态分布是一种连续概率分布, 其概率密度函数呈钟形,对称轴 为均值所在直线,形状由标准差 决定。
02
正态分布是自然界中最常见的分 布形态,许多随机变量都服从或 近似服从正态分布。
正态分布的性质
01
02
03
集中性
正态分布曲线以均值为中 心,两侧分布对称。
均匀性
正态分布曲线是关于标准 差对称的,形状由标准差 决定。
t分布
t分布的定义
定义
t分布(也称为学生t分布)是一种 连续概率分布,其形状由自由度 参数决定。
描述
当数据来自正态分布的总体,且样 本量较小(通常n<30)时,t分布 近似于正态分布。
公式
t分布的密度函数和分布函数可以用 一系列复杂的数学公式来描述。
t分布的性质
形状
峰度
随着自由度的增加,t分布的形状逐渐 接近正态分布。
t分布的峰度大于正态分布的峰度,且 随着自由度的增加而减小。
偏度
t分布通常是偏态的,其偏度随着自由 度的增加而减小。
t分布在统计学中的应用
假设检验
在样本量较小时,t分布在假设 检验中常用作正态分布的替代,
用于检验统计假设。
三大抽样分布知识点一览
三大抽样分布知识点一览抽样分布的概念抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。
抽样分布是统计推断的理论基础。
如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。
抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。
如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。
由平均数构成的新总体的分布,称为平均数的抽样分布。
随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。
三大抽样分布1. 卡方分布χ2(n)定义:若n个相互独立的随机变量ξ₁、ξ₂、……、ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。
2. t分布定义:设X1服从标准正态分布N(0,1),X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量t=X1(X2/n)1/2所服从的分布为自由度为n的t分布。
3. F分布定义:设X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量F=(X1/m)/(X2/n)所服从的分布为F分布,其中第一自由度为m,第二自由度为n。
与正态分布一同构成数理统计中的四大分布。
由标准正态总体样本的适当组合构成的统计量形成数理统计中的其他三大基础分布。
所以,数理统计中总是以正态总体作为研究对象展开。
在数理统计中,"总体"、"抽样"、"样本"是三个基本概念,分位点是"小概率事件"发生的临界点,置信区间是参数估计和假设检验的核心计算问题。
概率论与数理统计 7.2 数理统计中的三大分布
7.2 数理统计中的三大抽样分布
在数理统计中,以标准正态变量为基石而构 造的三个著名统计量有着广泛的应用,这是因为 这三个统计量不仅有明确背景,而且其抽样分布 的密度函数有明显的数学表达式,它们被称为统 计中的“ 三大抽样分布 ” 。
1. 2 分布
数理统计
2分布是由正态分布派生出来的一种分布.
t1 (n) t (n)
o t (n)
x
t分布的上分位点t (n)可查表
求得,例t0.025(15) 2.1315.
当n 45时,对于常用的的值,可用正态近似 t (n) z
例3:X ~ t(15)
(1)求 0.01的上侧分位数; (2) P( X ) 0.05,求 ; (3)P( X ) 0.95 ,求 .
记为 t ~ t(n). t分布概率密度函数为:
f (t)
[(n 1)
2]
(1
t
2
)
n1 2
,
t
(n 2) n n
t 分布的图像
y N (0,1) 数理统计
t(n)
t分布的性质: 1. 设t ~ t(n),则E(t) 0, D(t) n (n 2) (n 2)
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
F分布的上分位点的性质:
F1 (n1, n2 )
1 F (n2 , n1 )
F分布的上分位点可查表求得.例,
F0.95 (12,9)
1 F0.05 (9,12)
1 2.80
0.357
例4. F ~ F (24,15),求 1,2 使 P(F 2 ) 0.025 P(F 1) 0.025
§5.4三大抽样分布
所以 Y ( y1 ,, yn )T 的各分量相互独立.
n 1 由于 x y1 , ( n 1) s 2 yi2 . x与s 2相互独立. n i 2
1 n 1 21 1 A 3 2 1 n( n 1)
n
( n 1) s 2 yi2,
i2
yi N (0, ), i 2,3, , n.
2
y2 ,, yn相互独立.
( n 1)
2
yi 2 s ~ (n 1). i 2
n
2
2
15
定理2:设( X 1 , X 2 ,, X n )是来自正态总体N ( , )的
1 n 1 21 1 3 2 1 n( n 1)
1 n 0
1 3 2 1 n( n 1)
0 0 1 n( n 1) 1 n
14
(3)
( n 1)
2
s 2 ~ 2 ( n 1).
2 i 1 2 i 2 1 2 2 n 2 n
服从自由度为n的 2分布, 记作 2 ~ 2 (n) . 注:服从 2分布的随机变量取值非负,其密度函数为 n x 1 1 x2 e 2 , x 0 n 2 n 2 ( x; n) 2 ( ) Γ ( s ) x s1e x dx , s 0, 2 0 0, x0
4
n=4
2 分布的性质:
n=6 n=10
1、随n的增大,其偏度越来越小。
2、 2分布表——P425 附表三
2
即是分布函数数值表.
2
n 1 3、 分布是Ga分布的特例,即有 ( n) Ga( , ) . 2 2 4、 2分布具有可加性:
5-4三大抽样分布
三、t 分布 设X1~N(0,1) , X2~ (n ) , 且X1与X2相 X1 互独立,则称变量 t
1、定义:
2
X2 n
所服从的分布为自由度为 n的 t 分布.
例2:
若总体X ~ N ( 0,1),从此总体中取一个容量为
6的样本X 1 , X 2 ,X 6 , 设 Y ( X1 X 2 X 3 ) ( X 4 X 5 X 6 )
2 2 2
试决定常数C,使随机变量CY服从 分布 .
解:
因为
X 1 X 2 X 3 ~ N (0, 3), 所以
2
( y 0)
F
( y1 ym ) / m ( x1 xn ) / n
2 2
p( y )
( m2 n )
m
m 2
1
( ) ( )
m 2 n 2
( ) 2 ( y)
m n
1
m n
y
n n 2
m (n 2) (n 4)
2
( y 0)
1
1 2 2 3 43 5 4 6 5 6
2. F分布的性质
(1).F分布的数学期望
E(F )
n n2
(n>2)
即它的数学期望并不依赖于第一自由度m. (2).F分布的分位数
对于给定的 (0 1), 称满足条件
P F F1 (m, n)
F ( m , n ) 1
p( y )dy 1
的点F1 (m, n)为F (m, n)分布的1- 分位数. 如图所示.
三大抽样分布的理解与具体性质
数学学习与研究 2019. 12
பைடு நூலகம்
( ) 还有一个实用的结论,Γ
1 2
= 槡π.
若 X ~ Γ( α,β) ,我 们 可 以 计 算 出 它 的 矩 母 函 数 为
MX ( t) = ( 1 - βt) -α ,下面的分布就与这个矩母函数有关. 三、三大分布的性质
( 一) 卡方分布
1. 定义
如果 Z ~ N( 0,1) ,且 X = Z2 ,我们就说 X 服从自由度为
1 的卡方分布,记作 X ~ χ21 . 证明如下:
FX ( x) = P( X ≤ x) = P( Z2 ≤ x) = P( - 槡x ≤ Z ≤槡x) ,
FX ( x) = FZ ( 槡x) - FZ ( - 槡x) ,
求导可得,fX ( x) =
1
1
x-
1 2
e
-
x 2
,
2 2 槡π
( ) 或者 fX( x)
二、预备知识
如果一个随机变量 X 服从形状参数为 α,尺度参数为 β
的伽马分布,我们记 X ~ Γ( α,β) ,那么其概率密度函数为
f( x)
=
x
α
-1
e
-
x β
βαΓ( α)
,α,β
>
0,x ≥ 0,则 E(
X)
= αβ,Var( X)
=
∫∞
αβ2 ,其中 Γ( α) 为伽马函数,且 Γ( α) = xα-1 e -x dx,另外 0
交流平台
JIAOLIU PINGTAI
143
三大抽样分布的理解与具体性质
◎蔡则元 ( 甘肃省兰州市榆中县兰州大学榆中校区,甘肃 兰州 730107)
三大抽样分布
F(n1, n2)为F(n1, n2)的上侧分位点;
1 注: F1 (n1 , n2 ) F (n2 , n1 )
F (n1 , n2 )
若X 1 , Y1 ,
, X n1 来自正态总体X, X ~ N ( 1 , 12 ),
2 , Yn2 来自正态总体Y, Y ~ N ( 2 , 2 ), 且两样本独立.
当
2 ( n)
2.t 分布
关于t分布的早期理论工作,是英国统计学家威廉· 西利· 戈塞 特(Willam Sealy Gosset)在1990年进行的。 t分布是小样本分布,小样本一般是指n<30。t分布适用于 当总体标准差未知时用样本标准差s代替总体标准差σ,由
样本平均数推断总体平均数及两个小样本之间差异的显著性
χ2 分布是海尔墨特(Hermert)和卡· 皮尔生(K· Pearson) 分别于1875年和1890年导出的。它主要适用于对拟合优度检 验和独立性检验,以及对总体方差的估计和检验。 χ2 分布是一种抽样分布。当我们对正态随机变量随机地重 复抽取个数值,将每一个值变换成标准正态变量,并对这个 新的变量分别取平方再求和之后,就得到一个服从χ2分布的 变量,即
F分布的主要性质有: ①F分布是一种非对称的分布,呈右偏态; ② F分布两个自由度:n1-1和n2-1,相应的分布记作F(n1-1,n2-
1)。通常n1-1称为分子自由度, n2-1称为分母自由度。
③随n1,n2的不断增大,F分布的右偏程度逐渐减弱,但不会趋向 正态;
④具有倒数性质即若X~F(n1,n2),则1/X~F(n1,n2);
(4) t 分布是一个分布族,对于不同的样本容量对应不同的 分布,且均值都为0;随着自由度的增大,分布也逐渐趋 于标准正态分布。
三大抽样分布
U ~ 2(n1 ),
F ( n2 , n1 )
V
~
2 (n2 ) , 使F
U / n1 V / n2
(2) 若 t ~ t(n), 则 t 2 ~ F (1, n) (P130-习8)
简证: t : t(n) X : N (0,1), Y : 2(n),使t X
Y /n t 2 X 2 , X 2 : 2(1), Y : 2(n), F分布定义
第四节 抽样分布(重点)
主要内容(2学时)
一、卡方分布( 2分布)。
二、t分布。 三、F分布。 四、正态总体的样本均值、样本方差的分布。
说明: 统计量是样本的函数,是随机变量,有其概率
分布,统计量的分布称为抽样分布.
要求: 了解 2 分布、t 分布、F 分布的定义,及来自
正态总体X的样本均值的分布等常见统计量的分布。
(50)
:
n 50 45
z0.05 1.645
2 0.05
(50)
1 2
(z0.05
2 * 50
1)
1 2
(1.645
99) 67.221
(2) P( X A) 1 0.025 0.975
A
2 0.975
(6)
1.237
例2 设X1 , X 2 , ..., X10为总体N (0, 0.32 )的一个样本,
会查 2 分布、t 分布、F 分布的上分位数。
一、卡方分布( 2 分布 )
1、定义(重点)
设 X1 , X 2 , L , Xn 是来自标准正态总体 N (0 , 1)
的一 个样本,令 2
X 12
X
2 2
L
X
2 n
数理统计中的三大抽样分布理论系统与题型题法
一、 三大抽样分布的分布函数综 述:)a 根据大数定理和中心极限定理,但样本容量n 较大时(数学上一般要求45n >),任何分布都依概率收敛于正态分布()2, N μσ,并可标准化为()0, 1N 。
)b 现实世界和工程技术中的任何数据样本流到目前为止,不外乎()0, 1N 的函数分布,集中表现为3大抽样分布规律。
)c 考研数学中规定:()0, 1N 的分位数定义为下分位数(从图形上看为左边面积),3 大抽样分布的分位数定义都为上分位数(从图形上看为右边面积)1. ()2n χ分布(分布函数不要求掌握)量纲模型:性 质:()1{}i X ()2 可加性212~()n n χ+++()3证 明()3:由于()()()~0,10; 1i i i X N E X D X ⇒==()()()()()2224421 1,2,,3i i i i x iE X E X E X D X i n E X x edx +∞--∞=-===⎡⎤⎣⎦==()()()()()()()()()224222211222113122iii n ni i i i n n i i i i D X E X E X E n E X E X n D n D X D X nχχ====⎡⎤=-=-=⎣⎦⎛⎫=== ⎪⎝⎭⎛⎫=== ⎪⎝⎭∑∑∑∑样本函数中的必需记住的数字特征()4 上分位点 α定义为()2n χ分布的分位数2. ()t n 分布(分布函数不要求掌握){}i X 独立同分布 2~(0,1), ~(); i X N Y n X Y χ和独立 性 质:()1 t 分布密度函数()()~(0,1)t n n f x N →∞⇒()2 上分位点 α定义为()t n 分布的分位数()3 ()0, 22nEX DX n n ==>- ()4 性质T 分布具有对称性, 1()(); 45t nt n n αα-=->时,()t n Z αα≈3.(), F m n 分布(分布函数不要求掌握)X 、Y 相互独立,2~(); ~()X m Y n χχ;量纲模型:例:假定()12, X X 来自正态整体()2~0, X N σ的一个样本,求()()2122124X X P X X ⎡⎤+<⎢⎥-⎢⎥⎣⎦。
三大抽样分布充分统计量
7/7/2020
第五章 统计量及其分布
注:
X
~
2 N(,
)
X
~
N(0,1)
n n
第23页
7/7/2020
第五章 统计量及其分布
第24页
推论5.4.1 设 x1, x2,…, xn 是来自N(, 2) 的
样本,其样本均值和样本方差分别为 x = xi/n 和 s2= (xix)2/(n1)
则有
n(X) t(n1)
则称 t1-(n)为
t(n) 的下侧1- 分位点.
7/7/2020
第15页
t1 ( n )
第五章 统计量及其分布
第16页
当随机变量t t(n) 时,称满足
P(t t1(n)) =1 的 t1(n) 是自由度为 n 的 t 分布的1分位数.
分位数 t1(n) 可以从附表4中查到。
譬如 n=10,=0.05,那么从附表4上查得
则:
n 1 in 1 ( X i X ) 2 ,S n 21
n 11 in 1 ( X i X ) 2
1 n
1n
2
E(X) E(X ) , Var(X) Var(X)
n i1
i
n2 i1
i
n
E(Sn2
)
n 12, n
E(Sn21) 2,
7/7/2020
第五章 统计量及其分布
第20页
5.4.4 一些重要结论
7/7/2020
第五章 统计量及其分布
第27页
课堂练习
设X1, X2, …, Xn 是来自总体 N(, 2)的一个样本,
则
n
i 1
Xi
2
16几个常用的抽样分布与抽样分布定理
(s
0),
(s 1)
s (s) ,(12)
3
3.性质:
1)期望与方差
提示: 2
X
2 1
X
2 n
若 2 ~ 2(n),则 E( 2)= n,D( 2)=2n
证明: 因为Xi~N(0, 1)
所以
E
(
X
2 i
)
D( Xi
) [E( Xi
)]2
1 0 1
D(
X
2 i
)
E
(
X
4 i
)
[
2 1
/
2 2
~
F (n1
1, n2
1)
29
定理2结论(3)
假定
2 1
2 2
2,
就有
t T ( X Y ) (1 2 ) ~ S 1 n1 1 n2
(n1 n2 2)
其中
S2
(n11)S12 (n2 1)S22 n1 n 2 2
即
( X Y ) (1 2 )
13
T 的概率密度为
(s) xs1e x d x (s 0),
0
f (t)
( n 1) 2
(1
t2
)
n1
2,
(12)
t
n ( n) n
2
14
2.基本性质:
(1) f ( t ) 关于 t = 0(纵轴)对称。
(2) f ( t ) 的极限为 N(0, 1) 的密度函数,即
lim f (t) (t)
标准化
定理1:设总体 X ~ N ( , 2 ) ,X1, X2,…, Xn 是
来自总体 X 的样本,
抽样分布的名词解释
4.F分布:F分布是指F统计量的分布情况。F分布常用于F检验,用于比较两组样本的方差差异是否显著。
抽样分布的类型和使用场景不同,但都在统计学中扮演着重要的角色。通过对抽样分布的了解,可以帮助我们更加准确地进行统计分析,更好地掌握数据的分布情况。
抽样分布是指根据总体数据的抽样结果的分布情况。在统计学中,通过对样本的观察,可以推断出总体的分布情况。
常见的抽样分布包括正态分布、t分布、卡方分布、F分布等。
1.正态分布:正态分布是指数据呈现出高峰在中间,两侧逐渐递减的分布形态。正态分布常用于表示自然界中许多变量的分布情况,例如人群身高、体重等。
2.t分布:t分布是指在总体方差未知的情况下,样本方差的分布情况。t分布常用于统计分析中的t检验,用于比较两组样本的差异是否显著。
三大抽样分布(F、t、X2)
(三)三大抽样分布(l)t分布首先,我们应把注意力放在服从t分布的t变量的构造上。
设百,叼,…,凝是来自正态总体您)的一个样本.则有:对样本均值x施行标准化变换,则有:公=与=向〜)〜秋o,D当用样本标准差S代替上式中的总体标准差b,则上式U变量改为t变量,标准正态分布N①,1)也随之改为''自由度为n-1的t分布” .记为.即:――G-〃) -.[修一V尾部概率产(x>3) =0.00155. F(r >3) >0,02自由度为n-1的t分布的概率密度函数与标准正态分布N(0, 1)的概率密度函数的图形大致类似,均为对称分布,但它的峰比N(0, 1)的峰略低一些,而两侧尾部要比N①,1)的两侧尾部略粗一点,参见图1.3-8。
当自由度超过3。
后,两者区别已很小,这时可用N9, 1)代替1号-1)・(2) /分布设百,叼,…,演是来自正态总体从(人〃)的一个样本,则其样本方差一的n-l倍(也即离差M平方和2:(々- 3)2除以总体方差的分布是自由度为n-1的Z?分布,记为才 2 (% 一1),即:2-1♦一?S - = £ - 2)2 / /〜F 伽-1)自由度为n-1的1?分布的概率密度函数在正半轴上呈偏态分布,参见图1.3-9o(3)F 分布设有两个独立的正态总体N (〃i ,/)和4),它们的方差相等。
又设x P 叼,…,/是来自N (〃i ,〃)的一个样本;Xp -一,是来自》(外,〃)的一个样 本 > 两个样本相互独立。
它f 门的样本方差比的分布是自由度为n-1和的F 分布:其中n-1称为分子自由度或第1自由度;m-1称为分母自由度或第2自由度■ F 分布的概率密度函数在正半轴上呈偏态分布,参见图l.3-10o阳131。
尸储加-1)的IK 率密度函数 n-X _次(演-五)2 1 2-1〜F (力一 L W-1)。
5.4三大抽样分布
X 1 ~ χ 2 (n1 )
X 2 ~ χ 2 (n2 )
X1,X2 相互独立,则X1+X2 ~χ2(n1+n2) 相互独立, 例1
X ~ N (µ ,σ 2 )
2
(X1,X2,X3)为X的一个样本 为 的一个样本
2 2
求 X 1 − µ + X 2 − µ + X 3 − µ 的分布。 的分布。
1-α α α
t1−α (n)
tα (n) t1−α (n)
(2)对称性
t1−α (n) = −tα (n)
求t 0.05 (10)
三、 F—分布 分布
问题:1/F服从什么分布?
1、定义 若X~χ2(n1),Y~χ2(n2) ,X,Y独立,则 、 独立, , 独立
X n1 F= ~ F (n1 , n2 ) Y n2
称为第一自由度为n1 ,第二自由度为 2的F—分布, 第二自由度为n 分布, 称为第一自由度为 分布 其概率密度为
n1 −1 n1 + n 2 n1 / 2 2 )(n1 / n2 ) y Γ( 2 , h( y ) = n1 n2 n1 ( n1 + n2 ) / 2 Γ( 2 )Γ( 2 )(1 + n y ) 2 0, y≤0
解:a=1/20, b=1/100
2.设t 1−α (n)为t分布的1 − α分位数 P (T < t 1−α (n)) = P (| T |> t 1−α (n)) =
1-α 2α
P(T < − t 1−α (n)) =
α
三、有关正态总体的几个主要结果
X −µ X 1 , X 2 ,⋯, X n ~ N ( µ , σ 2 ) 则 U = ~ N (0, 1) 1、若 、
三种重要的统计分布和分位数
0.5 n=2
n=4
0.4
n=8
n=16
0.3
0.2
0.1
00
5
10
15
20
图 13.1 不同自由度 2 分布的密度函数 **********************************************************
2 分布有重要意义的原因之一是下面的定理。
定理 设 X1, X2,, X n 是来自正态总体 N , 2 的样本,其样本均值和样本方
Y
~
2 n或Y
~
2 n
。
2 分布随机变量具有可加性,即若 X1`, X2 独立, X1 ~ 2 m, X 2 ~ 2 n ,则 X1 X 2 ~ 2 m n。且若 X ~ 2 n ,则 E X n, Var X 2n。
**********************************************************
最大似然估计量,并判断是否为无偏估计,若不是无偏估计尝试给出无偏校正, 并比较估计的有效性。
验证 1
2X
和2
n1 n
max
1 k n
Xk
都是参数 的无偏估计,并比较它们的有效
性。
例 14.4.2 设元件的寿命服从指数分布 f x e x x 0。为了了解元件寿
2
1 2
P
X
u0.975
1
2P
X
u0.975
1 2 1 0.975 0.95.
**********************************************************
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三大抽样分布
教程
一、复习特征函数
1:()it t Ee ξξϕ=与概率分布函数()F x ξ相互唯一确定。
2:独立随机变量和的特征函数等于每个特征函数的乘积。
()
()()11
1
,...,...n n
n
X X X X X X t t t ϕϕϕ++=
独立
综合利用上面特征函数性质可以得到很多结论 例题1:证明,()()222~,~,X N a d cX N ca c d →
证明:
syms a t x real syms pi
syms d positive
characterfunction=int(exp(i*t*x)*1/sqrt(2*pi)/d*exp(-(x-a)^2/2/d^2),x,-inf,inf) characterfunction =
exp(1/2*i*t*(i*t*d^2+2*a)) 变形一下,结合性质1得到()()2222
~,d iat t
X t e
X N a d ϕ-=↔
由特征函数定义知
()()()()()()()22
22
()222
2
~,cd d iact ct i ac t t i ct X it cX cX X t Ee Ee ct e e
cX N ac c d ϕϕ-
-
=====↔
例题2
()()22
111222~,,~,X N a d X N a d ,12,X X 独立,则
()()()()2222
2
2
2
1212
12121
2
1
222
2
d d d d ia t t ia t t i a a t t X X X X t t t e
e e
ϕϕϕ+--+-+===
()
2
212121
2
12~,X X N a a d d N a a ⎛⎫↔+++=+ ⎪⎝⎭
推论:{},1,2,...,i X i n =为独立随机变量序列且对每个i 有()
2~,i i i X N a d ,则
()
2
2111
1...~...,......n n n
n X X N a a d d N a a ⎛⎫++++++=++ ⎪⎝⎭
推论
()
2
2111
1...~...,......n n n
n X X N a a d d N a a ⎛⎫++++++=++ ⎪⎝⎭
{}n X X ,...,1为独立随机变量序列,且对每个i 有()2~,i i i X N a d ,则
()
∑∑
∑
===n
i i
i
n i i i n
i i i d c a c N X c 122
1
1
,~
例题:定义取值非负随机变量X ,如果概率密度函数
()()
()x I e x x f x
),0[1∞--Γ=λαααλ(参数都为正数),称()~,X Ga αλ服从伽玛分布(显然,
参数为λ的指数分布e(λ)=Ga(1,λ)是其特例)。
求伽玛分布特征函数 clear
syms alfa lamda x positive syms t real
characterfunction=simple(int(exp(i*t*x)*lamda^alfa/gamma(alfa)*x^(alfa-1)*exp(-lamda*x),x,0,i nf));
characterfunction=simplify(characterfunction); pretty(characterfunction)
人工化简得
()()()
()()1,01x
X X it t f x x e I x α
ααλλϕλα----∞⎛⎫
=-↔= ⎪
Γ⎝⎭
注:11~(,)X Ga αλ,22~(,)X Ga αλ,两者独立,如何一下看出
1212~(,)X X Ga ααλ++,写出12X X +概率密度函数。
例题:()1,0~N X i ,{}n X X ,...,1为独立同分布随机变量序列,
()()()()()
n
X X X X X
t t t t n
n
21
22
1
221...ϕϕϕϕ==++ 而
()2
/12
2/112122
2
121
--∞
∞
-⎪
⎭
⎫ ⎝⎛
-===⎰it dx e
e
Ee
t x itx itX X π
ϕ
因此
()()()()2/1,2/~...2/112
212
/ (21)
221n Ga X X it t t n n n
X X X
n
++↔⎪⎭
⎫ ⎝⎛-==-++ϕϕ
二:三大抽样分布
背景:由中心极限定理看出,正态分布在现实生活中应用极广。
卡方分布、学生分布、F 分布都是在总体假定为正态分布的时候,和样本均值以及样本方差有关的一些统计量的概率分布。
定义1:n 个独立同分布的标准正态分布随机变量的平方和的分布称为自由度为n 的卡方分布()2n χ。
问题,若总体()2~,,0X N a d d >,()1,...,n X X 为样本,问()
2
2
1n
i i X a d
=-∑
服从什么
分布?
我们下次将证明()
2
2
1~n
i n i X X d
=-∑
定义2:学生分布
()2~0,1,~()X N Y n χ,X 、Y
()~t n 为自由度n 的学生分布 练习
1:假定总体X 服从指数分布e(λ),样本1...n X X ++的特征函数是什么?概率密度函数是什么?
1...n
X X n
++的特征函数是什么,概率密度函数是什么?n 趋向无穷大时候,情况如
何?
2:按照提示解答问题:
随机变量~(0,1)X N ,称2
X 为自由度1的卡方分布()2
1χ,它是什么伽玛分布?
如果{},1,2,...,i Y i n = i.i.d ,()2
~1i Y χ
,称1...n Y Y ++服从自由度为n 的卡方分布()2n χ,
它又是什么伽玛分布,它的特征函数是什么,按照特征函数和概率分布一一对应结论,求
()2n χ的概率密度。