卡方分布概念及表和查表方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

若n个相互独立的随机变量ξ₁,ξ₂,...,ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。

目录

1简介

2定义

3性质

4概率表

简介

分布在数理统计中具有重要意义。分布是由阿贝(Abbe)于1863年首先提出的,后来由海尔墨特(Hermert)和现代统计学的奠基人之一的卡·皮尔逊(C K·Pearson)分别于1875年和1900年推导出来,是统计学中的一个非常有用的著名分布。

定义

若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为分布(chi-square distribution),

卡方分布是由正态分布构造而成的一个新的分布,当自由度很大时,分布近似为正态分布。

对于任意正整数x,自由度为的卡方分布是一个随机变量X的机率分布。

性质

1) 分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数

的增大,分布趋近于正态分布;卡方分布密度曲线下的面积都是1。

2) 分布的均值与方差可以看出,随着自由度的增大,分布向正无穷方向延伸(因为均值越来越大),分布曲线也越来越低阔(因为方差越来越大)。

3)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。

4) 若互相独立,则:服从分布,自由度为

5) 分布的均数为自由度,记为 E( ) = 。

6) 分布的方差为2倍的自由度( ),记为 D( ) = 。

概率表

分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在

分布中得对每个分布编制相应的概率值,这通过分布表中列出不同的自由度来表示,

查分布概率表时,按自由度及相应的概率去找到对应的值。如上图所示的单侧概率(7)=的查表方法就是,在第一列找到自由度7这一行,在第一行中找到概率这一列,行列的交叉处即是。

表中所给值直接只能查单侧概率值,可以变化一下来查双侧概率值。例如,要在自由度为7的卡方分布中,得到双侧概率为所对应的上下端点可以这样来考虑:双侧概率指的是在

上端和下端各划出概率相等的一部分,两概率之和为给定的概率值,这里是,因此实际上上端点以上的概率为2=,用概率查表得上端点的值为16,记为2(7)=16。下端点以下的概率也为,因此可以用查得下端点为,记为2(7)=。

当然也可以按自由度及值去查对应的概率值,不过这往往只能得到一个大概的结果,因为分布概率表的精度有限,只给了13个不同的概率值进行查表。例如,要在自由度为18 的分布查找=30对应的概率,则先在第一列找到自由度18,然后看这一行可以发现与30接近的有与,它们所在的列是与,所以要查的概率值应于介于与之间,当然这是单侧概率值,它们的双侧概率值界于与之间。如果要更精确一些可以采用插值的方法得到,这在正态分布的查表中有介绍。

为什么从正态总体中抽取出的样本的方差服从分布

在抽样分布理论一节里讲到,从正态总体进行一次抽样就相当于独立同分布的n个正态随机变量ξ1,ξ2,…,ξn的一次取值,将n个随机变量针对总体均值与方差进行标准化得(i=1,…,n),显然每个都是服从标准正态分布的,因此按照分布的定义,应该服从参数为的分布。

如果将总体中的方差σ2用样本方差s2代替,它是否也服从分布呢理论上可以证明,它是服从分布的,但是参数不是n而是n-1了,究其原因在于它是n-1个独立同分布于标准正态分布的随机变量的平方和。

我们常常把一个式子中独立变量的个数称为这个式子的“自由度”,确定一个式子自由度的方法是:若式子包含有n个变量,其中k个被限制的样本统计量,则这个表达式的自由度为 n-k。比如中包含ξ1,ξ2,…,ξn这n个变量,其中ξ1-ξn-1相互独立,ξn为其余变量的平均值,因此自由度为n-1。

附卡方表

注:1. 当n充分大时,χ2(n)的值近似等于【Zα+ SQRT(2n-1)】的平方/2

2. =,=。

相关文档
最新文档