t分布的概念表和查表方法
(完整版)t分布的概念及表和查表方法.doc
t分布介绍在概率论和统计学中,学生 t - 分布(t -distribution ),可简称为 t 分布,用于根据小样本来估计呈正态分布且方差未知的总体的均值。
如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。
t 分布曲线形态与 n(确切地说与自由度 df )大小有关。
与标准正态分布曲线相比,自由度df 越小, t 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度 df 愈大, t 分布曲线愈接近正态分布曲线,当自由度 df= ∞时, t 分布曲线为标准正态分布曲线。
中文名t 分布应用在对呈正态分布的总体外文名t -distribution 别称学生 t 分布学科概率论和统计学相关术语t 检验目录1历史2定义3扩展4特征5置信区间6计算历史在概率论和统计学中,学生 t -分布( Student's t-distribution )经常应用在对呈正态分布的总体的均值进行估计。
它是对两个样本均值差异进行显著性测试的学生t 测定的基础。
t 检定改进了Z 检定(en:Z-test ),不论样本数量大或小皆可应用。
在样本数量大(超过 120 等)时,可以应用Z 检定,但 Z 检定用在小的样本会产生很大的误差,因此样本很小的情况下得改用学生t 检定。
在数据有三组以上时,因为误差无法压低,此时可以用变异数分析代替学生t 检定。
当母群体的标准差是未知的但却又需要估计时,我们可以运用学生t-分布。
学生 t-分布可简称为t 分布。
其推导由威廉·戈塞于 1908 年首先发表,当时他还在都柏林的健力士酿酒厂工作。
因为不能以他本人的名义发表,所以论文使用了学生(Student )这一笔名。
之后t 检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。
定义由于在实际工作中,往往σ是未知的,常用s 作为σ的估计值,为了与u 变换区别,称为t 变换,统计量 t 值的分布称为t 分布。
t分布与t检验
t分布从数理统计的理论上讲,并且上节的实例也已说明,在总体均数为μ,总体标准差为σ的正态总体中随机抽取n相等的许多样本,分别算出样本均数,这些样本均数呈正态分布。
而当样本含量n不太小时,即使总体不呈正态分布,样本均数的分布也接近正态。
在下式中,由于μ与(样本均数的标准差)都是常量,又X呈正态分布,所以u也呈正态分布。
但实际上总体标准差往往是不知道的,上式分母中的σ要由S替代,成为,那么由于样本标准差有抽样波动,SX也有抽样波动,于是,在用S代替σ后上式等号右边的变量便不呈正态分布而呈t分布,其定义公式是(6.5)t分布也是左右对称,但在总体均数附近的面积较正态分布的少些,两端尾部的面积则比正态分布的多些。
t分布曲线随自由度而不同(如图6.1)。
随着自由度的增大,t分布逐渐接近正态分布,当自由度为无限大时,t分布成为正态分布。
图6.1t分布(实线)与正态分布(虚线)与正态分布相似,我们把t分布左右两端尾部面积之和α=0.05(即每侧尾部面积为0.025)相应的t值称为5%界,符号为t0.05,,,这里ν是自由度。
把左右两端尾部面积之和α为0.01相应的t值称为1%界,符号为t0.01,,。
t的5%界与1%界可查附表3,t值表。
例如当自由度为10-1=9时,t0.05,9=2.262,t0.01,9=3.250。
可信区间的估计一、参数估计的意义一组调查或实验数据,如果是计量资料可求得平均数,标准差等统计指标,如果是计数资料则求百分率藉以概括说明这群观察数据的特征,故称特征值。
由于样本特征值是通过统计求得的,所以又称为统计量以区别于总体特征值。
总体特征值一般称为参数(总体量)。
我们进行科研所要探索的是总体特征值即总体参数,而我们得到的却是样本统计量,用样本统计量估计或推论总体参数的过程叫参数估计。
本章第一节例6.1通过检查110个健康成人的尿紫质算得阳性率为10%,这是样本率,可用它来估计总体率,说明健康成人的尿紫质阳性率水平,这样的估计叫“点估计”。
(完整版)t分布的概念及表和查表方法
t分布介绍在概率论和统计学中,学生t-分布(t-distribution),可简称为t分布,用于根据小样本来估计呈正态分布且方差未知的总体的均值。
如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。
t分布曲线形态与n(确切地说与自由度df)大小有关。
与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。
目录1历史2定义3扩展4特征5置信区间6计算历史在概率论和统计学中,学生t-分布(Student's t-distribution)经常应用在对呈正态分布的总体的均值进行估计。
它是对两个样本均值差异进行显著性测试的学生t测定的基础。
t检定改进了Z检定(en:Z-test),不论样本数量大或小皆可应用。
在样本数量大(超过120等)时,可以应用Z检定,但Z检定用在小的样本会产生很大的误差,因此样本很小的情况下得改用学生t检定。
在数据有三组以上时,因为误差无法压低,此时可以用变异数分析代替学生t检定。
当母群体的标准差是未知的但却又需要估计时,我们可以运用学生t-分布。
学生t-分布可简称为t分布。
其推导由威廉·戈塞于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。
因为不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名。
之后t检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。
定义由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布。
假设X服从标准正态分布N(0,1),Y服从分布,那么的分布称为自由度为n 的t分布,记为。
分布密度函数,其中,Gam(x)为伽马函数。
扩展正态分布(normal distribution)是数理统计中的一种重要的理论分布,是许多统计方法的理论基础。
标准误、t 分布
教 学 内 容 标准误 t分布
二、 t 分布: 三)、应用: 2、t 检验: 2)、配对计量资料的比较: t = ( d-0)/Sd v=n-1
例: 某药对Hb的影响研究结果 病人编号 治疗前 治疗后 差数 d 1 140 113 27 2 138 150 -12
3 140 150 … … .. 10 120 123 问:某药对Hb有无影响? -10 … -3
t = (X1-X2)/SX1-X2
P = 95% f
-t0.05,v -t0.01,v
0
t0.05,v tt0 Nhomakorabea01,v
(-t0.05,v , t0.05,v) 有 95%的 t 值,P=95%=0.95 (-t0.01,v , t0.01,v) 有 99%的 t 值,P=99%=0.99
P > 0.1
教 学 内 容 标准误 t分布
P 值含义与两类错误:
P 值含义:由H0所规定的总体做随机抽样,获得等于及大
于(或等于及小于)依据现有样本信息所计算得到的检验统 计量的概率。 I类错误:H0正确,但由于抽样的偶然性得到 t>=tα , P<=α 的检验结果,拒绝了H0 (即“弃真”) ,接受了H1, 这种错误称I类错误(“弃真”错误),其概率大小为α ; II类错误:H0不正确,但由于抽样的偶然性得到 t<tα , P>α 的检验结果,接受了H0 (即“存伪”) ,拒绝了H1, 这种错误称I类错误(“弃真”错误),其概率大小为 。
教 学 内 容 标准误 t分布
教 学 内 容
一、样本均数的标准误:样本均数的标准差。其大小与标 准差成正比,与样本含量n的算术平方根成反比。 σ X =σ /n1/2 或 SX = S/n1/2
t分布上册分位点查表负值
t分布上册分位点查表负值理解: 分位数(Quantile),亦称分位点,是指将一个随机变量的概率分布范围分为几个等份的数值点,常用的有中位数(即二分位数)、四分位数、百分位数等。
其中分位数又有上分位数和下分位数之分以一组离散随机变量概率分布为例:X:{1,2,3,4,5,7,8},总体为7个二分位数就是4,意思是X有1/2=50%的可能小于或等于4,同样往上看,X有1/2=50%的可能大于4所以同时这也是上分位数,二分位数没有上下之分同理四分位数对应的概率是:1/4=25%,但是此时有上下之分,X的上四分位数g就是X有25%的概率大于这个数g,25%*7=1.75,那怎么办?那我就要找一个数,确保X至少有25%的概率大于这个数,1.75取2,2/7》=0.27,取7,8,再往下是5这里查过之后,发现其实存在一点争议,就是在离散的情形里,上分位数取大于还是大于等于的问题,什么时候取等,到底取不取等,或者需不需要乘百分比这个问题一直都有不同说法,分位数取5,可以表示X至少有25%的概率大于5,或者,还可以说取7,可以表示X至少有25%的概率大于等于7,其中这个概率就是p值由于p值常常不是整数,所以表示主要用的是为百分位数总结一下:在抽样分布和概率的基础上,以想象一个一个密度函数曲线上分位点就是该点以上概率密度曲线与x轴的面积(概率)为α的点。
下分位点就是该点以下概率密度曲线与x轴的面积(概率)为α的点。
如标准正态分布的上α分位点:设X~N(0,1),对于百任给的α,(0<α<1),称满足P(X>Zα)= α的点Zα为标准正态分布的上α分位点。
理工类这边的书用的最多的是下侧分位点,有些数三的概率统计用的时上侧分位点现在再来看看定义分位数:指的就是连续分布函数中的一个点,这个点对应概率p。
若概率0<p<1,随机变量X的概率分布的分位数Za,是指满足条件p(X≤Za)=α的实数通常写作:(分布类型为t,对应该分布类型的自由度为n)t (n)0.95(分位数要求 p 值)= g (某分位数的值)表示对于自由度为n的t分布,p值为0.95的分位数为g,即:某随机变量满足自由度为n的t分布,有95%的可能比g小在查表得时候一般过程是:已知分布类型如:t,F,还知道自由度和要求的百分数=5%,95%,97.5%等然后找到对应百分数的百分位数=g关于表格:t分布的密度函数是关于y轴对称的,因此对任实数a>0,P(t>a)=P(ta)=2P(t>a).现在看到的t分布表制作有这样两种:列出的是使P(t>T)=α的T的值,将T记作t(α)(自由度不写了);列出的是使P(|t|>T)=α的T的值,将T记作t(α)在(1)表格中查到的t(α/2)与在(2)表格中查到的t(α)是同一个数,都是这个t分布的上α/2分位点。
数理统计查表方法
数理统计查表方法
数理统计中常用的查表方法有两种:查正态分布表和查t分布表。
1. 查正态分布表:正态分布表是用来计算正态分布的累积概率(即给定值以下的概率)和临界值(即给定累积概率对应的值)。
一般的正态分布表会给出标准正态分布(均值为0,标准差为1)的值。
如果需要计算其他均值和标准差的正态分布,可以通过标准化处理后再查询表格。
在查表时,一般需要根据给定的概率或值,在表格中找到对应的行和列,得到对应的数值。
2. 查t分布表:t分布表是用来计算t分布的累积概率和临界值的。
t分布主要应用于样本较小或总体方差未知的情况下。
和正态分布表类似,t分布表也提供了不同自由度下的t分布的临界值和累积概率。
在查表时,需要根据给定的自由度和概率或值,在表格中找到相应的数值。
需要注意的是,表格只提供了一部分数值,如果要查询的数值不在表中,通常需要进行插值来估算。
此外,现代计算机软件和统计学软件通常都提供了更精确和快捷的计算方法,可以避免手动查表的过程。
t 分布
⑴ 自由度为(n-1),而不是n。
⑵ t分布表具有对称性,t值大于等 于某一特定值的概率与t值小于等于该
特定值相反数的概率相等。
9
数学期望与方差:
设T~t (n),则E(T)=0,D(T)= n/(n-2) (n≥2)
小组成员: 主讲: 叶娇旗14、 PPT制作: 侯晓爽04、刘雨49、李舒婷03、 收集资料:花蕾17、王茜13
t 分布
主讲人:叶娇旗 营销131班
1
定义:
设X~N(0, 1), Y~ 2(n),X与Y相互独立, 则称随机变量 X T Y n 所服从的分布为自由度为n的t分布。 记为T~t(n).又称为学生氏分布
2
图像:
3
特点:
1、t分布的概率密度函数是偶函数,所以图形关于y轴对称。 2、其形态变化与n(确切地说与自由度ν)大小有关 自由度n越小,t分布曲线越低平; 自由度n越大,t分布曲线越接近标准正态分布曲线
10
0.05
0.05
-1.812
0
1.812
6Leabharlann t分布表举例:例:变量 X表示面包房每日出售的面包量,在15天内,出 售面包的样本方差为16。假定真实的出售量为70条,求任 意15天内出售面包平均数量为74条的概率。 分析:本例中已知样本方差S² =16,则S=4,总体均值(真 实的出售量)=70,运用t变量公式得:
4
t分布的均值与标准正态分布均值相
同,为0,但方差为k/(k-2)。由此,在 求t分布的方差时定义自由度必须大于2。
标准正态分布的方差等于1,因此,t
分布方差总大于标准分布的方差,也就 是说,t分布比正态分布略“胖”些。
5
t分布表的使用:
t分布与t检验
t分布从数理统计的理论上讲,并且上节的实例也已说明,在总体均数为μ,总体标准差为σ的正态总体中随机抽取n相等的许多样本,分别算出样本均数,这些样本均数呈正态分布。
而当样本含量n不太小时,即使总体不呈正态分布,样本均数的分布也接近正态。
在下式中,由于μ与(样本均数的标准差)都是常量,又X呈正态分布,所以u也呈正态分布。
但实际上总体标准差往往是不知道的,上式分母中的σ要由S替代,成为,那么由于样本标准差有抽样波动,SX也有抽样波动,于是,在用S代替σ后上式等号右边的变量便不呈正态分布而呈t分布,其定义公式是(6.5)t分布也是左右对称,但在总体均数附近的面积较正态分布的少些,两端尾部的面积则比正态分布的多些。
t分布曲线随自由度而不同(如图6.1)。
随着自由度的增大,t分布逐渐接近正态分布,当自由度为无限大时,t分布成为正态分布。
图6.1t分布(实线)与正态分布(虚线)与正态分布相似,我们把t分布左右两端尾部面积之和α=0.05(即每侧尾部面积为0.025)相应的t值称为5%界,符号为t0.05,,,这里ν是自由度。
把左右两端尾部面积之和α为0.01相应的t值称为1%界,符号为t0.01,,。
t的5%界与1%界可查附表3,t值表。
例如当自由度为10-1=9时,t0.05,9=2.262,t0.01,9=3.250。
可信区间的估计一、参数估计的意义一组调查或实验数据,如果是计量资料可求得平均数,标准差等统计指标,如果是计数资料则求百分率藉以概括说明这群观察数据的特征,故称特征值。
由于样本特征值是通过统计求得的,所以又称为统计量以区别于总体特征值。
总体特征值一般称为参数(总体量)。
我们进行科研所要探索的是总体特征值即总体参数,而我们得到的却是样本统计量,用样本统计量估计或推论总体参数的过程叫参数估计。
本章第一节例6.1通过检查110个健康成人的尿紫质算得阳性率为10%,这是样本率,可用它来估计总体率,说明健康成人的尿紫质阳性率水平,这样的估计叫“点估计”。
t界值表规律
t界值表规律摘要:一、引言二、t 界值表的规律三、t 界值表在统计学中的应用四、t 界值表在实际问题中的应用五、t 界值表的局限性与改进六、总结正文:一、引言t 界值表是统计学中一个重要的工具,它可以帮助我们在进行假设检验和置信区间估计时,快速找到临界值,从而判断数据的显著性。
本文将详细介绍t 界值表的规律及其在统计学中的应用。
二、t 界值表的规律1.t 分布的基本概念:t 分布是一种连续概率分布,它是正态分布的推广。
t 分布的自由度(df)决定了其形状,自由度越小,分布越尖,自由度越大,分布越平坦。
2.t 界值表的构成与特点:t 界值表是t 分布表的一种,它列出了在不同自由度和显著性水平下,t 分布的临界值。
t 界值表的特点是随着自由度的增加,临界值呈指数增长。
3.t 界值表的计算方法:t 界值表的计算方法主要基于t 分布的性质和数学公式。
常见的计算方法有查表法、计算器法、计算机程序法等。
4.t 界值表的应用范围:t 界值表广泛应用于统计学中的假设检验和置信区间估计,尤其在样本量较小的情况下,具有很高的实用价值。
三、t 界值表在统计学中的应用1.t 检验原理:t 检验是一种常用的假设检验方法,它利用t 界值表判断样本均值是否与总体均值存在显著差异。
t 检验的原理是计算样本均值与总体均值的t 统计量,然后查表得到临界值,最后比较t 统计量与临界值的大小,以判断差异是否显著。
2.t 界值表在假设检验中的应用:在进行假设检验时,我们需要根据样本数据计算t 统计量,然后查表得到相应的显著性水平下的临界值,最后比较t 统计量与临界值的大小,以判断原假设是否成立。
3.t 界值表在置信区间估计中的应用:在置信区间估计中,我们需要计算样本均值的置信区间,而置信区间的计算需要用到t 界值表。
首先,根据样本数据计算t 统计量,然后查表得到相应的置信水平下的临界值,最后利用t 界值表中的公式计算置信区间。
四、t 界值表在实际问题中的应用1.学生t 界值表的应用案例:在教育研究中,我们常常需要对学生成绩进行统计分析。
t分布的概念及表和查表方法
ttt分布,用于根据-distribution-分布(),可简称为在概率论和统计学中,学生的均值。
如果总体方差已知(例如在样本数量足小样本来估计呈正态分布且方差未知的总体够多时),则应该用正态分布来估计总体均值。
)大小有关。
与标准正态分布曲线相比,自(确切地说与自由度tdf分布曲线形态与n愈大,曲线双侧尾部翘得愈高;自由度df由度df越小,t分布曲线愈平坦,曲线中间愈低,分布曲线为标准正态分布曲线。
∞时,分布曲线愈接近正态目录历史1定义2扩展3特征4置信区间56计算历史t t)经常应用在对呈正态分布的总体-distribution分布-(Student's 在概率论和统计学中,学生检定Z测定的基础。
tt检定改进了的均值进行估计。
它是对两个样本均值差异进行显著性测试的学生,但Z检定(超过(en:Z-test),不论样本数量大或小皆可应用。
在样本数量大120等)时,可以应用在数据有三组以上时,t检定。
因此样本很小的情况下得改用学生Z 检定用在小的样本会产生很大的误差,检定。
t因为误差无法压低,此时可以用变异数分析代替学生t-分布。
当母群体的标准差是未知的但却又需要估计时,我们可以运用学生tt分布。
其推导由威廉·戈塞于1908年首先发表,-分布可简称为当时他还在都柏林的健力士学生t检验以)这一笔名。
之后酿酒厂工作。
因为不能以他本人的名义发表,所以论文使用了学生(Student及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。
定义由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布。
假设X服从标准正态分布N(0,1),Y服从分布,那么的分布称为自由度为n的t分布,记为。
分布密度函数,其中,Gam(x)为伽马函数。
扩展正态分布(normal distribution)是数理统计中的一种重要的理论分布,是许多统计方法的理论基础。
t检验例题
t检验例题【最新版】目录1. t 检验简介2. t 检验的步骤3. t 检验例题解析正文一、t 检验简介t 检验,又称为 t 分布检验,是一种用于检验两组样本均值差异是否显著的统计方法。
它适用于总体分布未知、样本量较小的情况。
t 检验的基本思想是通过计算样本均值的 t 分布来判断样本均值与总体均值之间是否存在显著差异。
二、t 检验的步骤1.假设设定:H0:两组样本均值相等H1:两组样本均值不相等2.收集数据:收集两组样本的数据,并计算它们的均值。
3.计算 t 值:根据样本均值、标准差和自由度,计算 t 值。
4.查表比较:将计算得到的 t 值与 t 分布表中的临界值进行比较。
5.判断结论:如果 t 值大于临界值,则拒绝原假设,认为两组样本均值存在显著差异;如果 t 值小于临界值,则不能拒绝原假设,认为两组样本均值没有显著差异。
三、t 检验例题解析假设我们有两组样本数据,分别是 A 组:2, 3, 4, 5;B 组:1, 3, 5, 7。
现在我们想要检验这两组样本的均值是否存在显著差异。
1.假设设定:H0:A 组和 B 组的均值相等H1:A 组和 B 组的均值不相等2.收集数据:A 组均值 = (2+3+4+5)/4 =3.5,B 组均值 =(1+3+5+7)/4 = 4。
3.计算 t 值:根据公式 t = (样本均值差 - 总体标准差差) / (标准差 / √n),我们可以得到 t 值。
其中,总体标准差差 = (标准差 A^2 + 标准差 B^2) / (n-1) = ((2^2+1^2)/3 + (3^2+5^2)/4) / (4-1) = 2.83,标准差 A = 1.41,标准差 B = 2.24,n = 4。
带入公式,得到 t 值约为-1.41。
4.查表比较:根据自由度(n-1 = 3)和显著性水平(一般取 0.05),查找 t 分布表,得到临界值约为 -1.999。
5.判断结论:由于计算得到的 t 值(-1.41)大于临界值(-1.999),我们不能拒绝原假设,认为 A 组和 B 组的均值没有显著差异。
t分布
∑f X X= ∑f
i i
i
17266.0 = = 172.66 100
数学可以证明,当样本含量较大时(n>50), 数学可以证明,当样本含量较大时(n>50), 样本均数的均数近似等于总体均数。 样本均数的均数近似等于总体均数。 样本均数的标准差(标准误 : 样本均数的标准差 标准误): 标准误
CI
SX =
∑f X −
2
(∑ f X )
2
n
∑ f −1
2981298− (17266 2 / 100 ) = = 1.23(cm) 100−1
•不服从标准正态,常用 作为σ 不服从标准正态 常用s 作为σ 实际工作中, 往往是未知的 往往是未知的, 实际工作中,σ往往是未知的 分布 的估计值,称为t变换 t值的分布为 分布。 变换, 值的分布为t分布 的估计值,称为•服从 ,的t分布 变换 值的分布为 分布。 服从n-1的 分布 服从
U=
t分布的特征: 分布的特征:
X −µ
σX
X −µ t= SX
是以0为中心对称分布的一簇曲线; 是以 为中心对称分布的一簇曲线; 为中心对称分布的一簇曲线 其形态变化与自由度(n-限制条件个数 有关。 其形态变化与自由度 限制条件个数) 有关。 限制条件个数
t值
自由度一定时, 的值, 自由度一定时,t0.05/2或t0.01/2的值, 可以从t界值表中查到 界值表中查到。 可以从 界值表中查到。(P246) t 分布主要用于: 分布主要用于: •总体均数置信区间的估计 总体均数置信区间的估计 • t 检验
100个样本均数的频数表及均数,标准差的计算表 个样本均数的频数表及均数, 个样本均数的频数表及均数
4-3假设检验5-1t分布5-2单个样本t检验
医学统计学
假设检验的基本步骤: 1.提出假设、确定检验水准和单双侧 假设 H0 : 14.1 和 H1 : 14.1 . 称H0为无效假设(或零假设,原假设); 称H1为备择假设(或对立假设). 预先给定概率值α,称为检验水准(亦称显著性 水准)。 在实际工作中,α常取0.05。α可根据不同的 研究目的给予不同的设置,如方差齐性检验,正态 性检验α常取0.1或0.2。
医学统计学
一般来说,当n>45时,t 分布与标准正态分 布就非常接近了.
t分布曲线是单峰分布,以0为中心,左右两侧对称 曲线的中间比标准正态曲线(u分布曲线)低,两 侧翘得比标准正态曲线略高。 t分布曲线随自由度υ而变化,自由度υ=n-1越小, t分布与u分布差别越大;当逐渐增大时,t分布逐 渐逼近于u分布,当υ=∞时,t分布就完全成正态 分布 。 t分布曲线是一簇曲线,而不是一条曲线。 t分布下面积分布规律:查t分布表。 t-分布曲线下面积为1。
医学统计学
3. 确定P 值 n 1 30 1 29 查 t 值表: t0.05 2(29) 2.045
2
2
t 2( )
t 2,( )
t 1.854 t0.05 2(35) P 0.05
4. 做推断结论
按0.05水准,接受H0,据样本信息不能认为 该山区成年男子平均脉搏高于一般成年男子。
医学统计学
分析: 0 72
X 72.4 s 6.5 n 30
选用 t 统计量 解 1.提出原假设和备择假设,规定显著性水平
H0 : 0 72 H1 : 0 72
在显著水平: 0.05
2. 计算统计量
t X 0 s n 74.2 72 6.5 30 1.854
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t分布介绍
在和中,学生t-分布(t-distribution),可简称为t分布,用于根据小样本来估计呈且方差未知的总体的均值。
如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。
t分布曲线形态与n(确切地说与自由度df)大小有关。
与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。
目录
1
2
3
4
5
6
历史
在和统计学中,学生t-分布(Student's t-distribution)经常应用在对呈的总体的进行估计。
它是对两个差异进行测试的学生t测定的基础。
t检定改进了Z检定(en:Z-test),不论样本数量大或小皆可应用。
在样本数量大(超过120等)时,可以应用Z检定,但Z检定用在小的样本会产生很大的误差,因此样
本很小的情况下得改用学生t检定。
在数据有三组以上时,因为误差无法压低,此时可以用代替学生t检定。
当母群体的是未知的但却又需要估计时,我们可以运用学生t-分布。
学生t-分布可简称为t分布。
其推导由于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。
因为不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名。
之后t检验以及相关理论经由的工作发扬光大,而正是他将此分布称为学生分布。
定义
由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布。
假设X服从标准正态分布N(0,1),Y服从分布,那么的分布称为自由度为n 的t分布,记为。
分布密度函数,
其中,Gam(x)为伽马函数。
扩展
(normal distribution)是数理统计中的一种重要的理论分布,是许多的理论基础。
正态分布有两个参数,μ和σ,决定了正态分布的位置和形态。
为了应用方便,常将一般的正态变量X通过u变换[(X-μ)/σ]转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的(standard normal distribution),亦称u分布。
根据,通过上述的抽样模拟试验表明,在正态分布总体中以固定n,抽取若干个样本时,样本均数的
分布仍服从正态分布,即N(μ, )。
所以,对样本均数的分布进行u变换,也可变换为标准正态分布N (0,1)。
特征
1.以0为中心,左右对称的单峰分布;
2.t分布是一簇曲线,其形态变化与n(确切地说与自由度df)大小有关。
自由度df越小,t分布曲线越低平;自由度df越大,t分布曲线越接近标准正态分布(u分布)曲线,如图:
t(n)分布与标准正态N(0,1)的密度函数。
3. 随着自由度逐渐增大,t分布逐渐接近标准正态分布。
对应于每一个自由度df,就有一条t分布曲线,每条曲线都有其曲线下统计量t的分布规律,计算较复杂。
学生的t-分布(或也t分布),在概率统计中,在置信区间估计、显著性检验等问题的计算中发挥重要作用。
t分布情况出现时(如在几乎所有实际的统计工作)的总体标准偏差是未知的,并要从数据估算。
教科书问题的处理,因为如果它被称为是两类:
(1 )那些在该样本规模是如此之大的一个可处理的数据为基础估计的差异,就好像它是一定的;
(2 )这些说明,在其中的问题,估计标准偏差是暂时忽略的,因为这不是一点,这是作者或导师当时的解释。
置信区间
假设数量A在当T呈t-分布(T的为n−1)满足
这与是相同的。
A是这个的第95个百分点。
那么
等价于
因此μ的90%为:。
计算
下表列出了自由度为1-30以及80、100、120等t-分布的单侧和双侧区间值。
例如,当样本数量n=5时,则自由度df=4,我们就可以查找表中以4开头的行。
该行第5列值为2.132,对应的单侧值为95%(双侧值为90%)。
这也就是说,T小于2.132的概率为95%(即单侧),记为Pr(−∞ <T < 2.132) = 0.95;同时,T值介于-2.132和2.132之间的概率为90%(即双侧),记为Pr(−2.132 <T < 2.132) = 0.9。
这是根据分布的对称性计算得到的。
Pr(T< −2.132) = 1 − Pr(T> −2.132) = 1 − 0.95 = 0.05
因此,
Pr(−2.132 <T< 2.132) = 1 − 2(0.05) = 0.9
注意关于表格的最后一行的值:自由度为无限大(n=120)的t-分布和正态分布等价。
(查表时注意:v是指自由度,并分单侧和双侧两种类型)
(右侧的示意图是单侧检验的情形)
(下图是左右、双侧等检验的情形)
单侧75% 80% 85% 90% 95% 97.5% 99% 99.5% 99.75% 99.9% 99.95% 双侧50% 60% 70% 80% 90% 95% 98% 99% 99.5% 99.8% 99.9% (V) 1 1.000 1.376 1.963 3.078 6.314 12.71 31.82 63.66 127.3 318.3 636.6
2 0.816 1.061 1.386 1.886 2.920 4.30
3 6.965 9.925 14.09 22.33 31.60
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 7.453 10.21 12.92
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
5 0.727 0.920 1.15
6 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
6 0.718 0.906 1.134 1.440 1.943 2.44
7 3.143 3.707 4.317 5.20
8 5.959
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
如何查t 分布表
1、本表是自由度V 和下侧概率P 给出t 分布的分位数t p (v)。
例:对于V=20和P=0.999,t p (v)=3.55181。
2、当P<0.5时,t p (v)= -t 1-p (v)。
例:t 0.001(20)= -t 0.999(20)= -3.55181。
3、与双侧概率α相应的分位数为t 1-α/2(v)。
例:对于V=20和α=0.002,t 1-α/2(v)=t 0.999(20)==3.55181。
注:对于自由度V 和t 给出t 分布函数P(t ;v)的数值,方法类似“自由度V 和下侧概率P 给出t 分布的分位数t p (v)”,此表忽略,见标准。