统计学三大分布与正态分布的关系
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班
摘要:本文首先将介绍2χ分布,t 分布,F 分布与正态分布的定义及基本性质,然后
用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之、
1、 三大分布函数[2]
1、12χ分布
2()n χ分布就是一种连续型随机变量的概率分布。这个分布就是由别奈
梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它就是由正态分布派生出来的,主要用于列联表检验。
定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,)
,则称统计量222
212n =+X X χ++…X 为服从自由度为n 的2χ分布,记为22~()n χχ、
2χ分布的概率密度函数为
12221
0(;),
2()200n x
n x e x n
f x n x --⎧≥⎪⎪=Γ⎨⎪⎪<⎩ 其中伽玛函数1
(),0t x x e
t dt x +∞
--Γ=
>⎰,2χ分布的密度函数图形就是一个只取非负
值的偏态分布,如下图、
卡方分布具有如下基本性质:
性质1:22(()),(())2E n n D n n χχ==;
性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++;
性质3:2
n χ→∞→时,(
n )正态分布; 性质4:设)(~2
2n α
χχ,对给定的实数),10(<<αα称满足条
件:αχχα
χα
==>⎰+∞
)
(2
22)()}({n dx x f n P 的点)(2
n α
χ为)(2n χ分布的水平α的上侧分位数、 简称为上侧α分位数、 对不同的α与n , 分位数的值已经编制成表供查用、
2()n χ分布的上α分位数 1、2t 分布
t 分布也称为学生分布,就是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置、
定义:设2
~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量/X
T Y n
=
服从自由度为n 的t 分布,记为~()T t n 、
t 分布的密度函数为
12
21
(
)2(;)(1),.()2
n n x t x n t n n n π+-+Γ=+-∞<<+∞Γ
t 分布的密度函数图
t 分布具有如下一些性质:
性质1:()n f t 就是偶函数,2
2
1,()()2t n n f t t e ϕπ-→∞→=;
性质2:设)(~n t T α,对给定的实数),10(<<αα 称满足条
件;αα
α==>⎰+∞
)
()()}({n t
dx x f n t T P 的点)(n t α为)
(n t 分布的水平α的上侧分位数、 由密度函数
)(x f 的对称性,可得 ).()(1n t n t αα-=-类似地,我
们可以给出t 分布的双侧分位数
,
)()()}(|{|)
()
(2/2/2/αααα=+
=
>⎰
⎰
+∞
-∞
-n t n t dx x f dx x f n t T P 显然有.2
)}({;2
)}({2/2/α
ααα=-<=>n t T P n t T P
对不同的α与n , t 分布的双侧分位数可从附表查得、
t 分布的上α分位数 1、3F 分布
F 分布就是随机变量的另一种重要的小样本分布,应用也相当广泛、 它可用
来检验两个总体的方差就是否相等,多个总体的均值就是否相等、 F 分布还就是方差分析与正交设计的理论基础、
定义:设22~(),~()X n Y m χχ,,X Y 相互独立,令则称统计量//X n
F Y m
=服从为第一自由度为n ,第二自由度为m 的F 分布、
F 分布的密度函数图
F 分布具有如下一些性质:
性质1:若~(,),1/~(,)F F n m F F m n 则; 性质2:若)(~n t X ,则2~(1,)X F n ; 性质3:设),(~m n F F α,对给定的实数
),10(<<αα称满足条件;
ααα==
>⎰
+∞
)
,()()},({m n F dx x f m n F F P
的点),(m n F α为),(m n F 分布的水平α的上侧分位数、
F
分布的上α分位数
F 分布的上侧分位数的可自附表查得、
性质4:.)
,(1
),(1m n F n m F αα-=
此式常常用来求F 分布表中没有列出的某些上侧
分位数、 1、4正态分布
正态分布就是数理统计中的一种重要的理论分布 ,就是许多统计方法的理论基础、 高斯(Gauss)在研究误差理论时首先用正态分布来刻画误差的分布,所以正态分布又称为高斯分布、 正态分布有两个参数,μ与σ,决定了正态分布的位置与形态、 为了应用方便,常将一般的正态变量X 通过u 变换转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布N (0,1)
、 正态分布的密度函数与分布函数
若连续型随机变量X 具有概率密度()f x 为
22
()21
(),,2x f x e
x μσπσ
--=-∞<<+∞其中,(0)μσσ>为常数,则称X 服从参数
为μσ,的正态分布,记为2~()X N μσ,、
正态分布的密度函数图
特征1:正态曲线(normal curve)在横轴上方均数处最高; 特征2:正态分布以均数为中心,左右对称;
特征3:正态分布有两个参数,即均数μ与标准差σ、 μ就是位置参数,σ
固定不变时,μ越大,曲线沿横轴越向右移动;反之,μ越小,则曲线沿横轴越向左移动、 σ就是形状参数,当μ固定不变时,σ越大,曲线越平阔;σ越小,曲线
越尖峭、 通常用2N μσ(,)表示均数为μ,方差为2σ的正态分布、 用