数学中三种分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.分布
若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和
构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution),其中参数
n称为自由度,正如正态分布中均值或方差不同就是另一个正态分布一样,自由度不同就是另一个分布。记为或者
卡方分布是由正态分布构造而成的一个新的分布,当自由度n很大时,
分布近似为正态分布。
对于任意正整数k, 自由度为k的卡方分布是一个随机变量X的机率分布。[1]
2.特点
概率密度函数
其中,是伽玛函数。期望和方差分布的均值为自由度n,记为E() = n。
分布的方差为2倍的自由度(2n),记为D() = 2n。
3. 性质
1)分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数n 的增大,
分布趋近于正态分布;卡方分布密度曲线下的面积都是1.
2) 分布的均值与方差可以看出,随着自由度n的增大,χ2分布向正无穷方向延伸(因为均值n越来越大),分布曲线也越来越低阔(因为方差2n越来越大)。
3)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。
4) 若互相独立,则:服从分布,自由度为;
服从分布,自由度为
3概率表
分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在χ2分
布中得对每个分布定制相应的概率值,这通过χ2分布表中列出不同的自由度来表示,在χ2分布表中还需要如标准正态分布表中给出不同P 值一样,列出概率值,只不过这里的概率值是χ2值以上χ2分布曲线以下的概率。由于χ2分布概率表中要列出很多χ2分布的概率值,所以χ2分布中所给出的P 值就不象标准正态分布中那样给出了400个不同的P 值,而只给出了有代表性的13个值,因此χ2分布概率表的精度就更差,不过给出了常用的几个值,足够在实际中使用了。
查χ2分布概率表时,按自由度及相应的概率去找到对应的χ2值。如上图所示的单侧概率χ2 0.05(7)=14.1的查表方法就是,在第一列找到自由度7这一行,在第一行中找到概率0.05这一列,行列的交叉处即是14.1。
表中所给值直接只能查单侧概率值,可以变化一下来查双侧概率值。例如,要在自由度为章7 的卡方分布中,得到双侧概率为0.05所对应的上下端点可以这样来考虑:双侧概率指的是在上端和下端各划出概率相等的一部分,两概率之和为给定的概率值,这里是0.05,因此实际上上端点以上的概率为0.05/2=0.025,用概率0.025查表得上端点的值为16,记为χ2 0.05/2(7)=16。下端点以下的概率也为0.025,因此可以用0.975查得下端点为1.69,记为χ2 1-0.05/2(7)=1.69。
当然也可以按自由度及χ2值去查对应的概率值,不过这仅往往只能得到一个大概的结果,因为χ2分布概率表的精度有限,只给了13 个不同的概率值进行查表。例如,要在自由度为18 的χ2分布查找χ2=30 对应的概率,则先在第一列找到自由度18,然后看这一行可以发现与30 接近的有28.9与31.5,它们所在的列是0.05与0.025,所以要查的概率值应于介于0.05与0.025之间,当然这是单侧概率值,它们的双侧概率值界于0.1与0.05之间。如果要更精确一些可以采用插值的方法得到,这在正态分布的查表中有介绍。
为什么从正态总体中抽取出的样本的方差服从χ2分布
在抽样分布理论一节里讲到,从正态总体进行一次抽样就相当于独立同分布的n 个正态随机变量ξ1,ξ2,…,ξn的一次取值,将n 个随机变量针对总体均值与方差进行标准化得(i=1,…,n),显然每个都是服从标准正态分布的,因此按照χ2分布的定义,应该服从参数为n 的χ2分布。
如果将中的总体方差σ2用样本方差 s2代替,即得,它是否也服从χ2分布呢?理论上可以证明,它是服从χ2分布的,但是参数不是n 而是n-1 了,究其原因在于它是n-1 个独立同分布于标准正态分布的随机变量的平方和
我们常常把一个式子中独立变量的个数称为这个式子的“自由度”,确定一个式子自由度的方法是:若式子包含有n 个独立的随机变量,和由它们所构成的k 个样本统计量,则这个表达式的自由度为n-k。比如中包含ξ1,ξ2,…,ξn这n 个独立的随机变量,同时还有它们的平均数ξ 这一统计量,因此自由度为n-1。
简介
u分布
正态分布(normal distribution)是数理统计中的一种重要的理论分布,是许多统计方法的理论基础。正态分布有两个参数,μ和σ,决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X通过u变换[(X-μ)/σ]转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standard normal distribution),亦称u分布。
根据中心极限定理,通过上述的抽样模拟试验表明,在正态分布总体中以固定n,抽取若干个样本时,样本均数的分布仍服从正态分布,即N(μ,σ)。所以,对样本均数的分布进行u变换,也可变换为标准正态分布N (0,1)
t分布
由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布。
假设X服从标准正态分布N(0,1),Y服从χ2(n)分布,那么Z=X/sqrt(Y/n)的分布称为自由度为n的t分布,记为Z~t(n)。
2特征编辑
1.以0为中心,左右对称的单峰分布;
2.t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线,如图.
t(n)分布与标准正态N(0,1)的密度函数
对应于每一个自由度ν,就有一条t分布曲线,每条曲线都有其曲线下统计量t的分布规律,计算较复杂。
学生的t分布(或也t分布),在概率统计中,在置信区间估计、显著性检验等问题的计算中发挥重要作用。
t分布是由统计学家哥赛特于1908年首次出版,而他在工作健力士啤酒厂在都柏林。他被禁止以他个人的名义出版,因此,该文件是根据书面笔名学生"student"。因此t分布又称为学生分布。
t分布情况出现时(如在几乎所有实际的统计工作)的总体标准偏差是未知的,并要从数据估算。教科书问题的处理标准偏差,因为如果它被称为是两类:( 1 )那些在该样本规模是如此之大的一个可处理的数据为基础估计的差异,就好像它是一定的( 2 )这些说明数学推理,在其中的问题,估计标准偏差是暂时忽略的,因为这不是一点,这是作者或导师当时的解释。
t分布的概述及其历史