t检验使用条件及在SPSS中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其中, 和 为两个样本的容量, , 和 分别为样本方差。
第二种情况,当两总体方差不相等时,采用数学定义
可见,两独立样本t检验的结论在很大程度上取决于两个总体的方差是否相等,这就就就要求在进行t检验之前要检验两个总体的方差是否相等,也称为方差齐性检验。
其中要判断两总体方差是否相等,就可以用F检验。F检验的原假设是两个总体的方差相等,在执行检验过程中,若概率P值小于给定的显著水平,则拒绝原假设,即认为方差不相等,否则认为方差相等。
3)配对样本t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。
下文将分别介绍三种t检验的使用条件以及在SPSS中的实现。
一、
1.1
1)单样本t检验的目的
利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值之间存在显著性差异,它是对总体均值的检验。
2、区分单侧检验和双侧检验。单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能性大。t检验中的p值是接受两均值存在差异这个假设可能犯错的概率。在统计学上,当两组观察对象总体中的确不存在差别时,这个概率与我们拒绝了该假设有关。一些学者认为如果差异具有特定的方向性,我们只要考虑单侧概率分布,将所得到t-检验的P值分为两半。另一些学者则认为无论何种情况下都要报告标准的双侧t检验概率。
a)构造新的统计量D= ,对用的样本 .这样就转化为单样本t检验问题,即检验D的均值是否与0有显著性差异。首先检验差值统计量是否符合正态分布,如果不符合,则
b)提出假设
: (原假设,null hypothesis)
: ≠ (备择假设,alternative hypothesis,)
c)选择检验统计量
2.2
步骤1)两独立样本t检验之前,对于数据的正确处理是一个非常关键的任务,spss要求两组数据在一个变量中,即在一个列中,同时要定义一个存放总体标志的标识变量。
步骤2)选择“检验变量”和“分组变量”,在“定义组”时,此处使用指定值,因为原始数据已经定义相关组。置信区间通常是默认的95%。
步骤3)结果解释:表中给出了t检验的两个结果,一个是方差相等时的t检验结果,一个是方差不相等时的t检验结果,到底应该采用哪种t检验结果取决于“方差方程的levene检验”结果,表中通过F检验的观察值为65.469,概率值为0,小于显著性水平,认为方差存在显著差异。

1、选用的检验方法必须符合其适用条件(注意:t检验的前提是资料服从正态分布)。理论上,即使样本量很小时,也可以进行t检验。(如样本量为10,一些学者声称甚至更小的样本也行),只要每组中变量呈正态分布,两组方差不会明显不同。如上所述,可以通过观察数据的分布或进行正态性检验估计数据的正态假设。方差齐性的假设可进行F检验,或进行更有效的Levene's检验。如果不满足这些条件,只好使用非参数检验代替t检验进行两组间均值的比较。
c)计算统计量的观测值和概率
在给定原假设的条件下,将检验值0代入 ,将样本均值、样本方差、样本容量代入公式,得到t统计量的观测值,查t分布界值表计算出概率P值。
d)给出显著性水平 ,作出统计判断
给出显著性水平 ,与检验统计量的概率P值作比较。当检验统计量的概率值小于显著性水平时,则拒绝原假设,认为两个总体的均值有显著性差异;反之,如果检验统计量的概率值大于显著性水平,则接受原假设,认为两个总体的均值之间没有显著性差异。
5、假设检验和可信区间的关系结论具有一致性差异:提供的信息不同区间估计给出总体均值可能取值范围,但不给出确切的概率值,假设检验可以给出H0成立与否的概率。
6、涉及多组间比较时,慎用t检验。
科研实践中,经常需要进行两组以上比较,或含有多个自变量并控制各个自变量单独效应后的各组间的比较,(如性别、药物类型与剂量),此时,需要用方差分析进行数据分析,方差分析被认为是T检验的推广。在较为复杂的设计时,方差分析具有许多t-检验所不具备的优点。(进行多次的T检验进行比较设计中不同格子均值时)。
: = (原假设,null hypothesis)
: ≠ (备择假设,alternative hypothesis,)
b)选择检验统计量
属于总体均值和方差都未知的检验采用t统计量:
,其中, 和 分别为样本均值和方差,t的自由度为n-1
SPSS中还将显示均值标准误差,计算公式为 ,即t统计量的分母部分。
t检验使用条件及在SPSS中的应用
t检验是对均值的检验,有三种用途,分别对应不同的应用场景:
1)单样本t检验(One Sample T Test):对一组样本,检验相应总体均值是否等于某个值;
2)相互独立样本t检验(Independent-Sample T Test):利用来自某两个总体的独立样本,推断两个总体的均值是否存在显著性差异;
二、
2.1
1)独立样本t检验的目的
利用来自某两个总体的独立样本,推断两个总体的均值是否存在显著性差异;
2)独立样本t检验的前提
样本来自的总体应服从或近似服从正态分布
两组样本相互独
两样本的总体方差相等,若两样本的总体方差不相等时,采用近似t检验。
独立样本t检验涉及的是两个总体,并采用t检验的方法,同时要求两组样本相互独立,即从一个总体中抽取一组样本对另一个总体抽取的样本没有影响,两组样本的个案数目可以不相等。如果两个样本有一个不符合正态分布或不清楚总体分布的形状,就不能用t检验,而要改用两个独立样本的非参数检验。
3、假设检验的结论不能绝对化。当一个统计量的值落在临界域内,这个统计量是统计上显著的,这时拒绝虚拟假设。当一个统计量的值落在接受域中,这个检验是统计上不显著的,这是不拒绝虚拟假设H0。因为,其不显著结果的原因有可能是样本数量不够拒绝H0,有可能犯第Ⅰ类错误。
4、正确理解P值与差别有无统计学意义。P越小,不是说明实际差别越大,而是说越有理由拒绝H0,越有理由说明两者有差异,差别有无统计学意义和有无专业上的实际意义并不完全相同。
3.2
步骤1)调出窗口
步骤2)置信区间默认的是95%,缺失值的处理方法选择是第一种方法。
步骤3)结果解释
第一个表格是数据的基本描述。
第二个是数据前后变化的相关系数,那个概率P值是相关系数的概率值,概率小于显著性水平0.05,所以拒绝原假设,即认为用中草药青木香治疗前后的舒张压有显著的相关性;。
第三个表格是数据相减后与0的比较,通过概率值为0,小于显著性水平0.05,则拒绝原假设,相减的差值与0有较大差别,则表明数据变化前后有显著的变化。
1.2
首先是检验样本的分布是否符合正态分析,检验方法见《正态性检验和正态转换的方法以及在SPSS中的实现》,如果符合正态分布或近似符合正态分布,则进行t检验,否则进行非参数检验。
步骤1)在比较均值中选择单样本t检验,弹出单样本t检验对话框。
步骤2)选择待检验的变量和检验值。点击“选项”可以选择置信区间(决定显著性水平)和缺失值的处理方式。
d)计算统计量的观测值和概率
将样本均值代入t统计量,ቤተ መጻሕፍቲ ባይዱ到t统计量的观测值,查t分布界值表计算出概率P值。
e)给出显著性水平 ,作出统计判断
给出显著性水平 ,与检验统计量的概率P值作比较。当检验统计量的概率值小于显著性水平时,则拒绝原假设,认为两样本差值的均值与检验值 之间有显著性差异;反之,如果检验统计量的概率值大于显著性水平,则接受原假设,认为两样本差值的均值与检验值 之间没有显著性差异。
c)计算统计量的观测值和概率
将样本均值、样本方差、 带入t统计量,得到t统计量的观测值,查t分布界值表计算出概率P值。
d)给出显著性水平 ,作出统计判断
给出显著性水平 ,与检验统计量的概率P值作比较。当检验统计量的概率值小于显著性水平时,则拒绝原假设,认为总体均值与检验值 之间有显著性差异;反之,如果检验统计量的概率值大于显著性水平,则接受原假设,认为总体均值与检验值 之间没有显著性差异。
在方差不相等的条件下,,则采用“方差不相等”这一行对应的t检验结果,再通过t检验的结果知,概率值都是小于显著性水平,认为两个总体的均值存在显著差异。最后的两列给出95%置信区间与总体均值差的上下限。
三、
3.1
1)两配对样本t检验的目的
检验两相关样本均数所代表的未知总体均数是否有差别。
2)两配对样本t检验的前提
3)独立样本t检验的步骤
a)提出假设
独立样本t检验需要检验两个总体的均值是否存在显著性差异,为此,提出假设:
: = (原假设,null hypothesis)
: ≠ (备择假设,alternative hypothesis,)
b)选择检验统计量
第一种情况:当两总体方差未知且相等,采用合并的方差作为两个总体方差的估计,数学定义为
配对设计的数据一一对应,前后顺序不能颠倒,样本容量相同
配对样本的差值d变量服从正态分布
3)两配对样本t检验步骤
其检验思路就是做差值,转化为单样本t检验,最后转化为差值序列总体均值是否与0有显著差异做检验。具体来讲,配对样本t检验是通过求出每对观测值之差,所有样本的观测值之差形成一个新的单样本,显然,如果两个样本的均值没有差异,则两个样本值之差的均值应该接近0,这实际就转化为了单样本t检验,检验值为0。所以配对样本t检验就是检验差值来自总体的均值是否为零,这就要求差值来自的总体服从正态分布。
按分析顺序排除个案(翻译不是很好,原文是Exclude cases analysis by analysis):在检验过程中,仅提出参与分析的缺失值。
按列表提出个案(Exclude caseslistwise):剔除含缺失值的个案。
步骤3)点击确定,解读分析结果
从分析结果看出,样本的总数n为2993,平均值Mean为22,大于步骤2中给定的均值20。在95%的置信区间里,给定的显著性水平为0.05。从结果中可以看出,Sig.(2-tailed)=0.000<0.05,拒绝原假设,H0:u=u0。即人均住房面积的平均值与20平方米有显著差异。
2)单样本t检验的前提
样本来自的总体应服从和近似服从正态分布,且只涉及一个总体。如果样本不符合正态分布或不清楚总体分布的形状,就不能用单样本t检验,而要改用单样本的非参数检验。
3)单样本t检验的步骤
a)提出假设
单样本t检验需要检验总体的均值是否与指定的检验值之间存在显著性差异,为此,给定检验值 ,提出假设:
相关文档
最新文档