(完整版)t分布的概念及表和查表方法.doc

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

t分布介绍

在概率论和统计学中,学生 t - 分布(t -distribution ),可简称为 t 分布,用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。

t 分布曲线形态与 n(确切地说与自由度 df )大小有关。与标准正态分布曲线相比,自由度df 越小, t 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度 df 愈大, t 分布曲线愈接近正态分布曲线,当自由度 df= ∞时, t 分布曲线为标准正态分布曲线。

中文名t 分布应用在对呈正态分布的总体

外文名t -distribution 别称学生 t 分布

学科概率论和统计学相关术语t 检验

目录

1历史

2定义

3扩展

4特征

5置信区间

6计算

历史

在概率论和统计学中,学生 t -分布( Student's t-distribution )经常应用在对呈正态分布的总体的均值进行估计。它是对两个样本均值差异进行显著性测试的学生t 测定的基础。 t 检定改进了Z 检定(en:Z-test ),不论样本数量大或小皆可应用。在样本数量大(超过 120 等)时,可以应用Z 检定,但 Z 检定用在小的样本会产生很大的误差,因此样本很小的情况下得改用学生t 检定。在数据有三组以上时,因为误差无法压低,此时可以用变异数分析代替学生t 检定。

当母群体的标准差是未知的但却又需要估计时,我们可以运用学生t-分布。

学生 t-分布可简称为t 分布。其推导由威廉·戈塞于 1908 年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student )这一笔名。之后t 检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。

定义

由于在实际工作中,往往σ是未知的,常用s 作为σ的估计值,为了与u 变换区别,称为t 变换,统计量 t 值的分布称为t 分布。

假设 X 服从标准正态分布N (0,1 ), Y 服从分布,那么的分布称为自由度为n 的 t 分布,记为。

分布密度函数,

其中, Gam(x) 为伽马函数。

扩展

正态分布( normal distribution)是数理统计中的一种重要的理论分布,是许多统计方法的理论基础。

正态分布有两个参数,μ和σ,决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X 通过 u 变换 [(X- μ)/ σ]转化成标准正态变量u ,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布( standard normal distribution),亦称u分布。

根据中心极限定理,通过上述的抽样模拟试验表明,在正态分布总体中以固定n,抽取若干个样本时,样本均数的分布仍服从正态分布,即N(μ,)。所以,对样本均数的分布进行u 变换,也可变换为标准正态分布N (0,1) 。

特征

1 .以 0 为中心,左右对称的单峰分布;

2 .t 分布是一簇曲线,其形态变化与n(确切地说与自由度df)大小有关。自由度df 越小, t 分布曲线越低平;自由度df 越大,t 分布曲线越接近标准正态分布(u 分布)曲线,如图:

t(n) 分布与标准正态N(0,1) 的密度函数。

3.随着自由度逐渐增大, t 分布逐渐接近标准正态分布。

对应于每一个自由度df,就有一条t 分布曲线,每条曲线都有其曲线下统计量t 的分布规律,计算较

复杂。

学生的 t-分布(或也t 分布),在概率统计中,在置信区间估计、显著性检验等问题的计算中发挥重

要作用。

t分布情况出现时(如在几乎所有实际的统计工作)的总体标准偏差是未知的,并要从数据估算。教

科书问题的处理标准偏差,因为如果它被称为是两类:

(1 )那些在该样本规模是如此之大的一个可处理的数据为基础估计的差异,就好像它是一定的;

( 2 )这些说明数学推理,在其中的问题,估计标准偏差是暂时忽略的,因为这不是一点,这是作

者或导师当时的解释。

置信区间

假设数量 A 在当 T 呈 t-分布( T 的自由度为 n- 1 )满足这

与是相同的。 A 是这个概率分布的第 95 个百分点。

那么

等价于

因此μ的 90% 置信区间为:。

计算

下表列出了自由度为1-30 以及80、100 、120 等t-分布的单侧和双侧区间值。例如,当样本数量n=5 时,则自由度df=4 ,我们就可以查找表中以 4 开头的行。该行第 5 列值为 2.132 ,对应的单侧值为95%

(双侧值为90% )。这也就是说,T 小于 2.132 的概率为95%(即单侧),记为Pr(- ∞< T < 2.132) = 0.95 ;同时, T 值介于-2.132 和2.132 之间的概率为90% (即双侧),记为Pr(-2.132 < T < 2.132) = 0.9 。

这是根据分布的对称性计算得到的。

Pr( T < -2.132) = 1 - Pr( T > -2.132) = 1 - 0.95 = 0.05

因此,

Pr(-2.132 < T < 2.132) = 1 - 2(0.05) = 0.9

注意关于表格的最后一行的值:自由度为无限大(n=120 )的t-分布和正态分布等价。

( 查表时注意 :v 是指自由度,并分单侧和双侧两种类型)

( 右侧的示意图是单侧检验的情形)

(下图是左右、双侧等检验的情形)

单侧75% 80% 85% 90% 95% 97.5% 99% 99.5% 99.75% 99.9% 99.95%

双侧50% 60% 70% 80% 90% 95% 98% 99% 99.5% 99.8% 99.9% (V) 1 1.000 1.376 1.963 3.078 6.314 12.71 31.82 63.66 127.3 318.3 636.6

2 0.816 1.061 1.386 1.886 2.920 4.30

3 6.965 9.925 14.09 22.33 31.60

3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 7.453 10.21 12.92

4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610

5 0.727 0.920 1.15

6 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869

6 0.718 0.906 1.134 1.440 1.943 2.44

7 3.143 3.707 4.317 5.20

8 5.959

7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408

8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041

9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781

10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587

相关文档
最新文档