t分布的概念及表和查表方法

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在概率论和统计学中,学生t -分布(t -distribution ),可简称为t 分布,用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。

t 分布曲线形态与n(确切地说与自由度df )大小有关。与标准正态分布曲线相比,自由度df 越小,t 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df 愈大,t 分布曲线愈接近正态分布曲线,当自由度df= ∞时,t 分布曲线为标准正态分布曲线。

目录

1历史

2定义

3扩展

4特征

5置信区间

6计算

历史

在概率论和统计学中,学生t -分布( Student's t -distribution )经常应用在对呈正态分布的总体的均值进行估计。它是对两个样本均值差异进行显著性测试的学生 t 测定的基础。 t 检定改进了 Z 检定 ( en:Z-test ),不论样本数量大或小皆可应用。在样本数量大 (超过 120 等)

因为误差无法压低,此时可以用变异数分析代替学生t 检

定。

时,可以应用 Z 检定,但 Z 检定用在小的样本会产生很大的误差,因此样本很小的情况下得改用学生 t 检定。在数据有三组以上时,

当母群体的标准差是未知的但却又需要估计时,我们可以运用

t- 分布。

学生

学生t- 分布可简称为t 分布。其推导由威廉·戈塞于 1908 年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生( Student )这一笔名。之后t 检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。

定义

由于在实际工作中,往往σ是未知的,常用 s 作为σ的估计值,为了与 u 变换区别,称为 t 变换,统计量 t 值的分布称为 t 分布。

假设 X服从标准正态分布 N( 0,1 ), Y服从分布,那么的分布称为自由度为 n的 t 分布,记为。

分布密度函数,

其中, Gam(x)为伽马函数。

扩展

正态分布( normal distribution )是数理统计中的一种重要的理论分布,是许多统计方法的理论基

础。正态分布有两个参数,μ和σ,决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X通过 u变换[(X- μ)/ σ]转化成标准正态变量 u,以使原来各种形态的正态分布都转换为μ=0,σ=1 的标准正态分布( standard normal distribution ),亦称 u 分布。

根据中心极限定理,通过上述的抽样模拟试验表明,在正态分布总体中以固定 n,抽取若干个样本时,样本均数的分布仍服从正态分布,即N(μ, ) 。所以,对样本均数的分布进行 u 变换,也可变换为标

准正态分布 N (0,1) 。

特征

1.以 0 为中心,左右对称的单峰分布;

2.t 分布是一簇曲线,其形态变化与n(确切地说与自由度 df )大小有关。自由度 df 越小,t 分布曲线

越低平;自由度 df 越大, t 分布曲线越接近标准正态分布( u 分布)曲线,如图:

t(n) 分布与标准正态 N(0,1) 的密度函数。

3. 随着自由度逐渐增大, t 分布逐渐接近标准正态分布。

对应于每一个自由度 df ,就有一条 t 分布曲线,每条曲线都有其曲线下统计量 t 的分布规律,计算较复杂。

学生的 t- 分布(或也 t 分布),在概率统计中,在置信区间估计、显著性检验等问题的计算中发挥重要作用。

t 分布情况出现时(如在几乎所有实际的统计工作)的总体标准偏差是未知的,并要从数据估算。教科书问题的处理标准偏差,因为如果它被称为是两类:

( 1 )那些在该样本规模是如此之大的一个可处理的数据为基础估计的差异,就好像它是一定的;

( 2 )这些说明数学推理,在其中的问题,估计标准偏差是暂时忽略的,因为这不是一点,这是作者或导师当时的解释。

置信区间

假设数量A在当T呈t-分布(T的自由度为n- 1)满足

这与是相同的。A是这个概率分布的第 95 个百分点。

那么

等价于

因此μ的 90%置信区间为:。

计算

下表列出了自由度为 1-30 以及 80、100、120等t- 分布的单侧和双侧区间值。例如,当样本数量 n=5 时,则自由度 df=4 ,我们就可以查找表中以 4开头的行。该行第 5列值为,对应的

单侧值为 95%(双侧值为 90%)。这也就是说, T小于的概率为 95%(即单侧),记为 Pr(-∞ < T < = ;同时, T值介于和之间的概率为 90%(即双侧),记为 Pr( - < T < = 。

这是根据分布的对称性计算得到的。

Pr(T < - = 1 - Pr(T > - = 1 - =

因此,

Pr( - < T < = 1 - 2 =

注意关于表格的最后一行的值:自由度为无限大( n=120)的 t- 分布和正态分布等价(查表时注意:v 是指自由度,并分单侧和双侧两种类型)

(右侧的示意图是单侧检验的情形)

下图是左右、双侧等检验的情形)

如何查 t 分布表

1、本表是自由度V和下侧概率P给出t 分布的分位数t p(v) 。

例:对于V=20和P=,t p(v)= 。

2、当P<时,t p(v)= -t 1-p(v) 。

例:(20)= (20)= 。

3、与双侧概率α相应的分位数为t 1-α/2 (v) 。

例:对于V=20和α=,t 1-α/2(v)=(20)== 。

注:对于自由度V和t 给出t 分布函数P(t ;v)的数值,方法类似“自由度V 和下侧概率P 给出t 分布的分位数t p(v) ”,此表忽略,见标准。

相关文档
最新文档