统计学三大分布及正态分布的关系
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学三大分布与正态分布的关系
[1]
张柏林 41060045 理实1002班
摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质,
然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之.
1.三大分布函数[2]
1.12χ分布
2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。
定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,)
,则称统计量222
212n =+X X χ++…X 为服从自由度为n 的2χ分布,
记为22~()n χχ. 2χ分布的概率密度函数为
122210(;),2()200n x n x e x n f x n x --⎧≥⎪⎪=Γ⎨⎪⎪<⎩
其中伽玛函数1
(),0t x x e t dt x +∞
--Γ=
>⎰
,2χ分布的密度函数图形是一个只取非负值的偏态分布,如下图.
卡方分布具有如下基本性质:
性质1:22(()),(())2E n n D n n χχ==;
性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++;
性质3:2
n χ→∞→时,(
n )正态分布; 性质4:设)(~2
2n α
χχ,对给定的实数),10(<<αα称满足条
件:αχχα
χα
==>⎰+∞
)
(2
22)()}({n dx x f n P 的点)(2
n α
χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查
用.
2()n χ分布的上α分位数 1.2t 分布
t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student ”的笔名
首次发表的,这个分布在数理统计中也占有重要的位置.
定义:设2
~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量/X
T Y n
=
服从自由度为n 的t 分布,记为~()T t n .
t 分布的密度函数为
1
221
(
)2(;)(1),.()2
n n x t x n t n n n π+-+Γ=+-∞<<+∞Γ
t 分布的密度函数图
t 分布具有如下一些性质:
性质1:()n f t 是偶函数,2
2
1,()()2t n n f t t e
ϕπ-→∞→=;
性质2:设)(~n t T α,对给定的实数),10(<<αα称满足条件;
ααα==>⎰
+∞)
()()}({n t dx x f n t T P 的点)(n t α为)(n t 分
布的水平α的上侧分位数. 由密度函数)(x f 的对称性,可得).()(1n t n t αα-=-类似地,我们可以给出t 分布的双侧分位数
,
)()()}(|{|)
()
(2/2/2/αααα=+
=
>⎰
⎰
+∞
-∞
-n t n t dx x f dx x f n t T P 显然有.2
)}({;2
)}({2/2/α
ααα=-<=>n t T P n t T P 对
不同的α与n ,t 分布的双侧分位数可从附表查得.
t 分布的上α分位数
1.3F 分布
F 分布是随机变量的另一种重要的小样本分布,应用也相当广泛. 它可用来
检验两个总体的方差是否相等,多个总体的均值是否相等. F 分布还是方差分析和正交设计的理论基础.
定义:设22~(),~()X n Y m χχ,,X Y 相互独立,令则称统计量//X n
F Y m
=服从为第一自由度为n ,第二自由度为m 的F 分布.
F 分布的密度函数图
F 分布具有如下一些性质:
性质1:若~(,),1/~(,)F F n m F F m n 则; 性质2:若)(~n t X ,则2~(1,)X F n ;
性质3:设),(~m n F F α,对给定的实数),10(<<αα称满足条件;
ααα==
>⎰
+∞
)
,()()},({m n F dx x f m n F F P
的点),(m n F α为),(m n F 分布的水平α的上侧分位数.
F 分布的上α分位数
F 分布的上侧分位数的可自附表查得.
性质4:.)
,(1
),(1m n F n m F αα-=此式常常用来求F 分布表中没有列出的某些上侧
分位数.
1.4正态分布
正态分布是数理统计中的一种重要的理论分布,是许多统计方法的理论基础. 高斯(Gauss )在研究误差理论时首先用正态分布来刻画误差的分布,所以正态分布又称为高斯分布. 正态分布有两个参数,μ和σ,决定了正态分布的位置和形态. 为了应用方便,常将一般的正态变量X 通过u 变换转化成标准正态变量u ,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布N (0,1)
. 正态分布的密度函数和分布函数
若连续型随机变量X 具有概率密度()f x 为
22
()2(),,x f x x μσ--=-∞<<+∞其中,(0)μσσ>为常数,则称X 服从参数
为μσ,的正态分布,记为2~()X N μσ,.