sas第九章 t检验和方差分析
北京大学医学部spss_t检验与方差分析 ppt课件
2020/10/28
2
精品资料
假设检验基本思想:首先假设两样本来自同一总
体,通过计算估计这一假设成立的可能性大还是小。 若这一假设成立是小概率事件则认为假设不成立, 两样本来自不同总体;若是大概率事件,两样本来 自同一总体。
假设μ1=μ2
2020/10/28
7
比较一组或两组数值变量的数据库形式
单一样本
独立样本
配对样本
2020/10/28
8
独立样本和配对样本T检验的数据库比较
测量结果变量, 包括两个组测量 结果数值
一组测 二组测 量结果 量结果
分 组 变 量
2020/10/28
独立样本T检验
配对样本T检验
9
SPSS过程: Compare Means
统计量值与p值
t x 2.584
One-Sample Test
Test Value = 72
95% Confidence Interval of the
Mean Difference dfSig. (2-taiDleifdf)erencLeower Upper
24
.0162.40383 .48424.3235
2020/10/28
15
T检验 H0: μ1= μ2 H1: μ1≠μ2 α=0.05
t=1.873,P=0.080。
P>0.05,不拒绝H0,尚不能认为两总体均数不相等, 不能认为病人与健康人平板时间不同。
2020/10/28
16
配对T检验
例:某研究者欲研究控制饮食是否对高血脂病人有疗效, 对18名高血脂病人控制饮食一年,观察这18名病人控 制饮食前后血清胆固醇的变化,数据见t3,控制饮食对 降血脂是否有效?
(整理)sas第九章 t检验和方差分析.
第九章 t 检验和方差分析在科研中,我们往往是根据样本之间的差异,去推断其总体之间是否有差异。
样本差异可能是由抽样误差所致,也可能是由本质的不同所致。
应用统计学方法来处理这类问题,称为“差异的显著性检验”。
若已知总体为正态分布,进行差异的显著性检验,称为“参数性检验”,SAS 中MEANS 、TTEST 、ANOVA 、GLM 等均属此类检验;若未知总体分布,进行差异的显著性检验,称为“非参数性检验”,SAS 中采用NPAR1WAY 过程。
第一节 t 检验9.1.1 简介t 检验是用于两组数据均值间差异的显著性检验。
它常用于以下场合:1.样本均值与总体(理论)均值差别的显著性检验检验所测得的一组连续资料是否抽样于均值已知的总体根据大量调查的结果或以往的经验,可得到某事物的平均数(例如生理生化的正常值),以此作总体均值看待。
SAS 中采用MEANS 过程,计算出观察与总体均值的差值,再对该差值的均值进行t 检验。
2.同一批对象实验前后差异的显著性检验(自身对照比较)或配对资料差异的显著性检验(配对比较检验) 比如,在医学研究中,我们常常对同一批病人治疗前后的某些生理生化指标(如血压、体温等)进行测量,以观察疗效;或对同一批人群进行预防接种,以观察预防效果;或把实验对象配成对进行测定,比较其实验结果。
SAS 中采用MEANS 过程,计算出两样本观察的差值(如治疗前、后实验数据的差值),再对该差值的均值进行t 检验。
3.两样本均值差异的显著性检验作两样本均值差异比较的两组原始资料各自独立,没有成对关系。
两组样本所包含的个数可以相等,也可以不相等。
每组观测值都是来自正态总体的样本。
设1X 与2X 为两样本的均值,1n 与2n 为两样本数,21s ,22s 为两样本方差,分两种情形,其数学模型为:(1)方差齐(相等)时:)/1/1(21221n n s x x t +-=)2/(])1()1[(212222112-+-+-=n n s n s n s(2)方差不齐时: 22212121//n s n s x x t +-=SAS 中采用TTEST 过程,先作方差齐性检验(F 检验),然后根据方差齐(EQUAL)和方差不齐(UNEQUAL)输出t 值和P 值以及基本统计量。
t检验与单因素方差分析ppt课件
σ=1
f(X)
0.5 0.4 0.3 0.2 0.1 0 -6 -5 -4 -3 -2 -1 0 1 2 3 4
σ=1.5
σ=2
5 6
X
正态分布形态随参数σ变换示意图
17
18
t分布
2.58 1.96
19
应用条件: t 检验:1.单因素设计的小样本(n<50)计 量资料 2.样本来自正态(近似正态)分布总体 3.总体标准差未知 4.两样本均数比较时,要求两样本相 应的总体方差相等(方差齐性) u 检验:1.大样本 2.样本小,但总体标准差已知
两样本 比较
两组资料的秩和检验
中位数检验
完全随机设计资 料 多组均 数比较 配伍组设计资料 拉丁方设计资料 正交设计
单因素方差分析
H检验,多个样本两两比较的秩和检验 两因素方差分析 M检验 三向方差分析 多向方差分析
7
《中华医学杂志》对来稿统计学处理的有关要求
8
《中华医学杂志》对来稿统计学处理的有关要求 Nhomakorabea60
U检验的公式:
61
【例5】测定功能性子宫出血实热组与虚寒组的皮 质醇含量(ug/dl),已知实热组:n1=144, x1=26.7,s1=4.72;虚寒组:x1=121,x2=15.4, s2=2.47。问两组皮质醇含量有无差别?
3
2.选择检验方法、计算统计量 假设检验的方法应针对不同研究目的、设 计及资料的类型选定,并计算相应的检验 统计量。 如在总体方差已知的情况下,进行两均数 的比较用z检验或u检验;在总体方差未知 情况下,进行两均数的比较用 t 检验等。
4
3.确定P值、作出推论 根据计算的检验统计量,确定P值,P值是 在H0成立的情况下随机抽样,获得大于及 等于或(和)小于及等于现有样本资料求得的 检验统计量的概率。
spsst检验与方差分析
假设检验的基本思想
▪ 提出一个假设 ▪ 如果假设成立,得到现有样本的可能性
• 可能性很小(小概率事件),在一次试验中本不 该得到,居然得到了,说明我们的假设有问题, 拒绝之。
• 有可能得到手头的结果,故根据现有的样本无法 拒绝事先的假设(没理由)
Yang Zhao, Department of Epidemiology & Biostatistics
Descriptive Statistics
N 101 101
Minimum 2.70
Maximum 7.22
Mean Std. Dev iation
4.6995
.86162
➢Explore过程
✓对数据进行初步检查,判断有无离群点或极端值; ✓对前提条件假定,如正态分布和方差齐性进行检验,不满 足正态分布和方差齐性时,提示数据转换方法,然后决定 使用参数方法或非参数方法; ✓了解组间差异的特征.
➢T Test
4. 结论的概率性
▪ 无论做出何种推断结论,总是有风险的!
▪ 拒绝H0时可能犯I类错误; ▪ 不拒绝H0时可能犯II类错误;
▪ 检验统计量位于检验界值的附近时,下结论更应慎重; ▪ 不拒绝H0,并不意味着接受H0。
• 不拒绝H0,只是说明现有的样本不足以拒绝H0假设,或者 说,两个总体差异并不大,假设检验不能从现有的样本中 发现差别。所以不能拒绝H0。
二、Compare Means---均数比较
➢Means过程
Options对话框
对分组变量进行单 因素方差分析,并 计算Eta统计量
线性趋势检验
结果输出
体重 * 疾病
Case Processing Summary
sas第九章t检验和方差分析
第九章 t 检验和方差分析在科研中,我们往往是根据样本之间的差异,去推断其总体之间是否有差异。
样本差异可能是由抽样误差所致,也可能是由本质的不同所致。
应用统计学方法来处理这类问题,称为“差异的显著性检验”。
若已知总体为正态分布,进行差异的显著性检验,称为“参数性检验”,SAS 中M EANS 、TTEST 、ANOVA 、GLM 等均属此类检验;若未知总体分布,进行差异的显著性检验,称为“非参数性检验”,SAS 中采用NPAR 1WAY 过程。
第一节 t 检验9.1.1 简介t 检验是用于两组数据均值间差异的显著性检验。
它常用于以下场合: 1.样本均值与总体(理论)均值差别的显著性检验检验所测得的一组连续资料是否抽样于均值已知的总体 根据大量调查的结果或以往的经验,可得到某事物的平均数(例如生理生化的正常值),以此作总体均值看待。
SAS 中采用MEAN S 过程,计算出观察与总体均值的差值,再对该差值的均值进行t 检验。
2.同一批对象实验前后差异的显著性检验(自身对照比较)或配对资料差异的显著性检验(配对比较检验)比如,在医学研究中,我们常常对同一批病人治疗前后的某些生理生化指标(如血压、体温等)进行测量,以观察疗效;或对同一批人群进行预防接种,以观察预防效果;或把实验对象配成对进行测定,比较其实验结果。
SAS 中采用MEAN S 过程,计算出两样本观察的差值(如治疗前、后实验数据的差值),再对该差值的均值进行t 检验。
3.两样本均值差异的显著性检验作两样本均值差异比较的两组原始资料各自独立,没有成对关系。
两组样本所包含的个数可以相等,也可以不相等。
每组观测值都是来自正态总体的样本。
设与为两样1X 2X 本的均值,1n 与为两样本2n 数,21s ,22s 为两样本方差,分两种情形,其数学模型为:(1)方差齐(相等)时:)/1/1(21221n n s x x t +-=)2/(])1()1[(212222112-+-+-=n n s n s n s(2)方差不齐时: 22212121//n s n s x x t +-=SAS 中采用TTES T 过程,先作方差齐性检验(F 检验),然后根据方差齐(EQUAL )和方差不齐(UNEQU AL)输出t 值和P 值以及基本统计量。
第九章----方差分析
若组间变异明显大于组内变异, 则不能认为组 间变异仅反映随机误差的大小, 处理因素也在起 作用。根据计算出的检验统计量F值, 查界值表 得到相应的P值, 按所取检验水准α作出统计推断 结论。
检验统计量F值服从F分布。
F<Fα,(ν组间, ν组内),则P > α, 不拒绝H0, 还不能认 为各样本所来自的总体均数不同;
1、各样本是相互独立的随机样本, 且来自 正态分布的总体;
2、相互比较的各样本的总体方差相等, 即 具有方差齐性。 独立性、随机性、正态性、方差齐性
五、方差分析的用途
1、用于进行两个或多个样本均数的比较; 2、分析两因素或多因素间的交互作用; 3、用于回归方程的线性假设检验。
六、方差分析的优点
1、不受比较组数的限制,可比较多组均数; 2、可同时分析多个因素的作用; 3、可分析因素间的交互作用.
一、多个样本均数间的比较能否用 t 检 验或 u 检验?为什么?
原因:
五个样本均数进行比较, 每次两个均数作一次 t 检验, 共需作10(C52=10)次 t 检验。若每次比 较的检验水准α=0.05, 则每次比较不犯Ⅰ型错误 的概率为(1-α)=0.95。当这些检验独立进行 时, 则10次比较均不犯Ⅰ型错误的概率为0.9510= 0.5987, 此时犯Ⅰ型错误的概率, 即总的检验水准 α变为1-0.5987=0.4013比0.05大的多。犯Ⅰ型错 误的概率增大, 可能将原本无差别的两个总体推 断为有差别, 误判为有统计意义。因此多重比较 不宜用的 t 检验或 u检验作两两比较。
已知各组均数、标准差和样本含量时F值 的简便计算方法。
当原始数据未知, 只知各组均数、标准差和 样本含量时, 可进行如下计算, 分两种情况: 1、各组样本含量ni相等; 2、各组样本含量ni不等。
sas第九章 t检验和方差分析
第九章t 检验和方差分析在科研中,我们往往是根据样本之间的差异,去推断其总体之间是否有差异。
样本差异可能是由抽样误差所致,也可能是由本质的不同所致。
应用统计学方法来处理这类问题,称为“差异的显著性检验”。
若已知总体为正态分布,进行差异的显著性检验,称为“参数性检验”,SAS 中MEANS 、TTEST 、ANOVA 、GLM 等均属此类检验;若未知总体分布,进行差异的显著性检验,称为“非参数性检验”,SAS 中采用NPAR1WAY 过程。
第一节 t 检验9.1.1 简介t 检验是用于两组数据均值间差异的显著性检验。
它常用于以下场合:1.样本均值与总体(理论)均值差别的显著性检验检验所测得的一组连续资料是否抽样于均值已知的总体根据大量调查的结果或以往的经验,可得到某事物的平均数(例如生理生化的正常值),以此作总体均值看待。
SAS 中采用MEANS 过程,计算出观察与总体均值的差值,再对该差值的均值进行t 检验。
2.同一批对象实验前后差异的显著性检验(自身对照比较)或配对资料差异的显著性检验(配对比较检验)比如,在医学研究中,我们常常对同一批病人治疗前后的某些生理生化指标(如血压、体温等)进行测量,以观察疗效;或对同一批人群进行预防接种,以观察预防效果;或把实验对象配成对进行测定,比较其实验结果。
SAS 中采用MEANS 过程,计算出两样本观察的差值(如治疗前、后实验数据的差值),再对该差值的均值进行t 检验。
3.两样本均值差异的显著性检验作两样本均值差异比较的两组原始资料各自独立,没有成对关系。
两组样本所包含的个数可以相等,也可以不相等。
每组观测值都是来自正态总体的样本。
设1X 与2X 为两样本的均值,1n 与2n 为两样本数,21s ,22s 为两样本方差,分两种情形,其数学模型为:(1)方差齐(相等)时:)/1/1(21221n n s x x t +-=)2/(])1()1[(212222112-+-+-=n n s n s n s(2)方差不齐时: 22212121//n s n s x x t +-=SAS 中采用TTEST 过程,先作方差齐性检验(F 检验),然后根据方差齐(EQUAL)和方差不齐(UNEQUAL)输出t 值和P 值以及基本统计量。
SPSS:数据分析3、T检验(TTest)方差分析(ANOVA)(Chi-squareTe。。。
SPSS:数据分析3、T检验(TTest)⽅差分析(ANOVA)(Chi-squareTe。
⽬录1、数据采集2、数据是否服从正态分布3、T检验(T Test)4、⽅差分析(ANOVA)5、卡⽅检验(Chi-square Test)6、灰⾊关联度分析(Grey Relation Analysis,GRA)7、弗⾥德曼检验(Friedman Test)8、箱图(Box)1、数据采集1、数据分类定性观察、访谈、调查定量⼿动测量、⾃动测量、问卷打分主观等级、排序、感觉、有⽤性客观时间、数量、错误率、分数⾃变量不同的实验条件因素,研究的因素因变量不同的实验条件所影响的、要观测的因素连续数量值(preference)时间、数量、错误率------离散数量值(usability问卷打分等级数量值(usability)等级、排序变量类型Norminal Data 定类变量 | 变量的不同取值仅仅代表了不同类的事物,这样的变量叫定类变量。
问卷的⼈⼝特征中最常使⽤的问题,⽽调查被访对象的“性别”,就是定类变量。
对于定类变量,加减乘除等运算是没有实际意义的。
Ordinal Data 定序变量 | 变量的值不仅能够代表事物的分类,还能代表事物按某种特性的排序,这样的变量叫定序变量。
问卷的⼈⼝特征中最常使⽤的问题“教育程度“,以及态度量表题⽬等都是定序变量,定序变量的值之间可以⽐较⼤⼩,或者有强弱顺序,但两个值的差⼀般没有什么实际意义。
Interval Data 定距变量 | 变量的值之间可以⽐较⼤⼩,两个值的差有实际意义,这样的变量叫定距变量。
有时问卷在调查被访者的“年龄”和“每⽉平均收⼊”,都是定距变量。
Ratio Data 定⽐变量 | 有绝对0点,如质量,⾼度。
定⽐变量与定距变量在市场调查中⼀般不加以区分,它们的差别在于,定距变量取值为“0”时,不表⽰“没有”,仅仅是取值为0。
定⽐变量取值为“0”时,则表⽰“没有”。
方差和T检验
T检验在正态或近似正态分布的计量资料中,经常在使用前一章统计描述过程分析后,还要进行组与组之间平均水平的比较。
本章介绍的T 检验方法,主要应用在两个样本间比较。
如果需要比较两组以上样本均数的差别,这时就不能使用上述的T检验方法作两两间的比较。
对于两组以上的均数比较,可以使用方差分析方法。
用户可以指定一个或多个变量作为分组变量。
如果分组变量为多个,还应指定这些分组变量之间的层次关系。
层次关系可以是同层次的或多层次的。
同层次意味着将按照各分组变量的不同取值分别对个案进行分组;多层次表示将首先按第一分组变量分组,然后对各个分组下的个案按照第二组分组变量进行分组。
计算公式SPSS单样本T检验:检验某个变量的总体均值和某指定值之间是否存在显著差异。
统计的前提样本总体服从正态分布。
也就是说单样本本身无法比较,进行的是其均数与已知总体均数间的比较。
计算公式如下。
单样本T检验的零假设为H0总体均值和指定检验值之间不存在显著差异。
采用T检验方法,按照下面公式计算T统计量:如果相伴概率值P小于或等于用户设想的显性水平a,则拒绝H,可以认为总体均值和检验值之间存在显著性差异独立样本是指两个样本之间彼此独立没有任何关联,两个独立样本各自接受相同的测量,研究者的主要目的是了解两个样本之间是否有显著差异存在。
这个检验的前提如下。
1、两个样本应是互相独立的,即从一总体中抽取一批样本对从另一总体中抽取一批样本没有任何影响,两组样本个案数目可以不同,个案顺序可以随意调整。
1、两个总体应该服从正态分布。
2、T验的零假设H0为两总体均值之间不存在显著差异。
具体的计算中需要通过两步来完成:第一,利用F检验判断两总体的方差是否相同;第二,根据第一步的结果,决定T统计量和自由度计算公式,进而对T检验的结论作出判断SPSS采用Levene F方法检验两总体方差是否相同。
(1)两总体方差未知且相同情况下,T统计量计算公式为(2)两总体方差未知且不同情况下,T统计量计算公式为T统计仍然服从T分布,但自由度采用修正的自由度,公式为从两种情况下的T统计量计算公式可以看出,如果待检验的两样本均值差异较小,t值较小,则说明两个样本的均值不存在显著差异;相反,t值越大,说明两样本的均值存在显著差异。
SAS第三讲第9-10章
9.9 8.5 9.8 9.2 8.2
12.0 8.5 10.9 10.4 10.0
PROC ANOVA; CLASS a b; MODEL x=a b; RUN;
例6.用SNK法(Q 例6.用SNK法(Q检验)作均数间 的两两比较
研究酵解作用对血糖浓度的影响, 研究酵解作用对血糖浓度的影响,我 们从8名健康人中抽取了血液并制备成血滤 们从 名健康人中抽取了血液并制备成血滤 每一个受试者的血滤液又分成4份 液。每一个受试者的血滤液又分成 份,然 后随机地把各份血滤液分别放置0、 、 后随机地把各份血滤液分别放置 、45、 90、135分钟后测定其中血糖浓度(资料 分钟后测定其中血糖浓度( 、 分钟后测定其中血糖浓度 见表9-9)。 )。试比较放置时间对血糖浓度有 见表 )。试比较放置时间对血糖浓度有 无影响。 无影响。
MDOEL y=a b a*b MDOEL y=a b c a*b a*c b*c a*b*c; ; 模型中, 是主效应, 模型中, a ,b ,c 是主效应, a*b,a*c, , , b*c,a*b*c 是交互效应,y 是因变量。 是交互效应, 是因变量。 ,
语句是选择语句, ( 4) MEANS语句是选择语句 , 计算 ) 语句是选择语句 并输出所列的效应对应的因变量均数, 并输出所列的效应对应的因变量均数 , 若 指明了选择项, 指明了选择项 , 则将进行主效应均数间的 检验。常用的选择项如下: 检验。常用的选择项如下: SNK(Q检验)均数间两两比较 检验) ( 检验 DUNCAN 一组均数与其余各组比较 ALPHA=p用以确定检验的显著性水平。 用以确定检验的显著性水平。 = 用以确定检验的显著性水平 缺省值是0.05。 缺省值是 。
方差分析的基本概念
SPSSt检验与方差分析
t检验与方差分析一、t检验(一)两样本均数比较的t检验AnalyzeCompare Means◆ Independent-Samples T TestTest Variable xGrouping Variable(s) group(二)配对t检验AnalyzeCompare Means◆ Paired-Samples T TestPaired Variables x1 -x2(三) 样本均数与总体均数AnalyzeCompare Means◆ One-Samples T TestTest Variable xTest Value ?是否为正态的检验?二、方差分析(一)完全随机设计方差分析1 数据格式数据输成2列(见表10-1),1列为“数据”,2列为“分组”,其中,分别以1、2、3来表示“甲”、“乙”、“丙”。
表10-1从菜单选择AnalyzeGeneral Linear Models…Univariate…Dependent:因变量。
本例选“数据”;Fixed Factors:固定因素。
可选多个因素,本例只有一个因素“分组”。
选Model…,选Custom两两比较Post Hoc…:多重比较1.1随机区组设计的方差分析数据格式:3列,分别表示“浓度”、“处理组”、“单位组”,见下表;♦从菜单选择AnalyzeGeneral linear Models Univariate…;♦选“浓度”为Dependent Variable,选“处理组”、“单位组”为Fixed Factors;选Model…,选Custom两两比较Post Hoc…:多重比较是否为正态性检验。
t检验与单方差分析PPT资料
事实上,小概率事件在随机抽样中还是可能发生的,
如果该P值太小,成为了我们所定义的小概率事件(小于等于α水准),则我们怀疑所做的假设不成立,从而拒绝H0。
察在假设条件下随机样本的特征信息是否属小概率事
• 二是与H0相对立的备择假设 (alternative hypothesis),记为H1。
统计方法应当注意其适用条件
近,不存在差别)考试后的成绩是否存在差异?
均数为正,因此可推断出是使得病人血压下
三、计算检验统计量和P值
三、完全随机的两样本t检验
完全随机的两样本t检验
目的:
推断两个样本是否来自相同的总体,更具体地说,
是要检验两样本所代表的总体均数是否相等。
检验假设
无效假设H0:μ1=μ2
检验结果
多个子集,利用studentized
range分布来进行
件,若为小概率事件,则怀疑假设成立有悖于该样本
基本思想:先建立一个关于样本所属总体的假设,考
D=X- u0
所提供特征信息,因此拒绝假设
•因此,认为两者的差别无统计学意义,但是这并不意味着可以接受H0
• 二是与H0相对立的备择假设 (alternative hypothesis),记为H1。
检验假设H0本来是成立的,而根据样本信息拒
绝H0的可能性大小的度量,换言之,α是拒绝
了实际上成立的H0的概率。
常用的检验水准为α = 0.05,其意义是:在所设
H0的总体中随机抽得一个样本,其均数比手头
样本均数更偏离总体均数的概率不超过5%
假设检验的基本步骤
三、计算检验统计量和P值
检验统计量的特点:
基本思想:先建立一个关于样本所属总体的假设,考
T检验及单因素方差分析
H0:μ = μ 0 H1:μ ≠ μ 0 2.计算检验统计量
3.查相应界值表,确定P值,下结论
查附表1,t0.05 / 2.34 = 2.032,t < t0.05 / 2.34,P >0.05,按 α =0.05水准,接受H1,两者之间无显著差异。
独立样本T检验 SPSS操作
1、将数据组织成如图所示的样式,第二列数据是分组,第一组数据和第 二组数据放在一起
2、根据成对的变量自定义进行选择配对,将相关数据导入。点击选项, 设置置信区间,默认为95%,处理缺失值。全部设定好之后选择确定按钮 获得配对均值比较结果。
3、第一个表格是数据的基本描述。 第二个是数据前后变化的相关系数,概率大于显著性水平0.05,则说明数
据变化前后没有显著变化,线性相关程度较弱。 第三个表格是数据相减后与0的比较,概率值为0,小于显著性水平0.05,
表5-3为方差齐次性检验结果,从显著性慨率看,p>0.05,说明各组的方差在 a=0.05水平上没有显著性差异,即方差具有齐次性。这个结论在选择多重比 较方法时作为一个条件。
表5-4方差分析表: 第1栏是方差来源,包括组间变差“Between Groups”;组内变差“Within Groups”和总变差“Total”。 第2栏是离差平方和“Sum of Squares”,组间离差平方和87.600,组内离 差平方和为24.000,总离差平方和为111.600,是组间离差平方和与组内离 差平方和相加之和。 第3栏是自由度df,组间自由度为4,组内自由度为10;总自由度为14。 第4栏是均方“Mean Square”,是第2栏与第3栏之比;组间均方为21.900, 组内均方为2.400。 第5栏是F值9.125(组间均方与组内均方之比)。 第6栏:F 值为9.125,对应的概率值P为0.002<0.01。于是在0.01显著性水 平上拒绝H0假设,即5种品种虫数的平均值有显著性差异。
sas第九章 t检验和方差分析
sas第九章 t检验和方差分析sas第九章t检验和方差分析第九章t检验和方差分析在科研中,我们往往就是根据样本之间的差异,回去推测其总体之间与否存有差异。
样本差异可能将就是由抽样误差所致,也可能将就是由本质的相同所致。
应用领域统计学方法去处置这类问题,称作“差异的显著性检验”。
若未知总体为正态分布,展开差异的显著性检验,称作“参数性检验”,sas中means、ttest、anova、glm等均属于此类检验;若未明总体原产,展开差异的显著性检验,称作“非参数性检验”,sas中使用npar1way过程。
第一节t检验9.1.1概述t检验是用于两组数据均值间差异的显著性检验。
它常用于以下场合:1.样本均值与总体(理论)均值差别的显著性检验检验所测得的一组连续资料是否抽样于均值已知的总体根据大量调查的结果或以往的经验,可以获得某事物的平均数(比如生理生化的正常值),以此并作总体均值对待。
sas中采用means过程,计算出观察与总体均值的差值,再对该差值的均值进行t检验。
2.同一批对象实验前后差异的显著性检验(自身对照比较)或接合资料差异的显著性检验(接合比较检验)比如说,在医学研究中,我们常常对同一批病人化疗前后的某些生理生化指标(例如血压、体温等)展开测量,以观测疗效;或对同一批人群展开预防接种,以观测防治效果;或把实验对象硝酸锶对展开测量,比较其实验结果。
sas中采用means过程,计算出两样本观察的差值(如治疗前、后实验数据的差值),再对该差值的均值进行t检验。
3.两样本均值差异的显著性检验作两样本均值差异比较的两组原始资料各自独立,没有成对关系。
两组样本所包含的个数可以相等,也可以不相等。
每组观测值都是来自正态总体的样本。
2设x1与x2为两样本的均值,n1与n2为两样本数,s12,s2为两样本方差,分后两种情形,其数学模型为:(1)方差齐(相等)时:t?x1?x2s(1/n1?1/n2)22s2?[(n1?1)s12?(n2?1)s2]/(n1?n2?2)(2)方差不齐时:t?x1?x2s/n1?s/n22122sas中采用ttest过程,先作方差齐性检验(f检验),然后根据方差齐(equal)和方差不齐(unequal)输出t值和p值以及基本统计量。
T检验及其与方差分析的区别
T检验及其与方差分析的区别假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同。
t 检验:1.单因素设计的小样本(n<50)计量资料2.样本来自正态分布总体3.总体标准差未知4.两样本均数比较时,要求两样本相应的总体方差相等•根据研究设计t检验可由三种形式:–单个样本的t检验–配对样本均数t检验(非独立两样本均数t检验)–两个独立样本均数t检验(1)单个样本t检验•又称单样本均数t检验(one sample t test),适用于样本均数与已知总体均数μ0的比较,其比较目的是检验样本均数所代表的总体均数μ是否与已知总体均数μ0有差别。
•已知总体均数μ0一般为标准值、理论值或经大量观察得到的较稳定的指标值。
•单样t检验的应用条件是总体标准s未知的小样本资料( 如n<50),且服从正态分布。
(2)配对样本均数t检验•配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。
•配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
•应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率。
•配对设计处理分配方式主要有三种情况:①两个同质受试对象分别接受两种处理,如把同窝、同性别和体重相近的动物配成一对,或把同性别和年龄相近的相同病情病人配成一对;②同一受试对象或同一标本的两个部分,随机分配接受两种不同处理,如例5.2资料;③自身对比(self-contrast)。
即将同一受试对象处理(实验或治疗)前后的结果进行比较,如对高血压患者治疗前后、运动员体育运动前后的某一生理指标进行比较。
(3)两独立样本t检验两独立样本t 检验(two independent samples t-test),又称成组t 检验。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章 t 检验和方差分析在科研中,我们往往是根据样本之间的差异,去推断其总体之间是否有差异。
样本差异可能是由抽样误差所致,也可能是由本质的不同所致。
应用统计学方法来处理这类问题,称为“差异的显著性检验”。
若已知总体为正态分布,进行差异的显著性检验,称为“参数性检验”,SAS 中MEANS 、TTEST 、ANOVA 、GLM 等均属此类检验;若未知总体分布,进行差异的显著性检验,称为“非参数性检验”,SAS 中采用NPAR1WAY 过程。
第一节 t 检验9.1.1 简介t 检验是用于两组数据均值间差异的显著性检验。
它常用于以下场合:1.样本均值与总体(理论)均值差别的显著性检验检验所测得的一组连续资料是否抽样于均值已知的总体根据大量调查的结果或以往的经验,可得到某事物的平均数(例如生理生化的正常值),以此作总体均值看待。
SAS 中采用MEANS 过程,计算出观察与总体均值的差值,再对该差值的均值进行t 检验。
2.同一批对象实验前后差异的显著性检验(自身对照比较)或配对资料差异的显著性检验(配对比较检验)比如,在医学研究中,我们常常对同一批病人治疗前后的某些生理生化指标(如血压、体温等)进行测量,以观察疗效;或对同一批人群进行预防接种,以观察预防效果;或把实验对象配成对进行测定,比较其实验结果。
SAS 中采用MEANS 过程,计算出两样本观察的差值(如治疗前、后实验数据的差值),再对该差值的均值进行t 检验。
3.两样本均值差异的显著性检验作两样本均值差异比较的两组原始资料各自独立,没有成对关系。
两组样本所包含的个数可以相等,也可以不相等。
每组观测值都是来自正态总体的样本。
设1X 与2X 为两样本的均值,1n 与2n 为两样本数,21s ,22s 为两样本方差,分两种情形,其数学模型为:(1)方差齐(相等)时:)/1/1(21221n n s x x t +-=)2/(])1()1[(212222112-+-+-=n n s n s n s(2)方差不齐时: 22212121//n s n s x x t +-=SAS 中采用TTEST 过程,先作方差齐性检验(F 检验),然后根据方差齐(EQUAL)和方差不齐(UNEQUAL)输出t 值和P 值以及基本统计量。
在作方差齐性检验时,用F 检验。
F 值计算公式为:),(),(22212221S S Min S S Max F =9.1.2 用MEANS 过程作t 检验1.过程格式PROC MEANS MEAN STD STDERR T PRT ;VAR 变量表;2.说明(1)PROC MEANS 语句中,选择了5个统计量:均值、标准差、标准误差、t 值、P 值。
(2)VAR 语句中的变量是分析变量。
缺省时,计算所有数值型变量。
3.举例例1: 样本均值与总体均值差别的显著性检验。
已知某水样中含CaCO 3的真值为20.7mg /L ,现用某方法重复测定该水样11次,CaCO 3的含量为:20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.41,20,23,22。
问用该法测CaCO 3的含量所得的均值与真值有无显著差别 ?程序: (yp111.sas)编程说明:在数据步中,变量x 读取测定值,产生一个差值变量y(y=x-20.7),在过程步中,计算出Y 的均值、标准差、标准误差、t 值、P 值。
结果说明:因t =1.0636907,0.05<p=0.3125,故用此法测定水中CaCO 3的含量的均值与真值间无显著差异。
此法可信。
例2:配对比较的t 检验。
研究食物中维生素E 与肝脏中维生素A 含量的关系。
将大白鼠按性别、体重配对。
每对随机分配,一个用正常饲料,一个用缺乏维生素E 的饲料。
经过一个时期饲养,杀死动物测定肝中维生素A 的含量,结果如下表:大白鼠肝脏中维生素A含量(IU/g)配对号 1 2 3 4 5 6 7 8正常饲料3550 2000 3000 3950 3800 3750 3450 3050 缺乏E饲料2450 2400 1800 3200 3250 2700 2500 1750程序:(yp112.sas)编程说明:数据步中,把每对数据中的一个作为x,另一个作为y,计算出差数d(d=x-y),在过程步中,计算差数d的均值、标准差、标准误差、t值、P值。
结果说明:因t=4.21 p=0.0040<0.05,故有非常显著差异,即正常饲料组鼠肝维生素A含量比维生素E缺乏组的含量大。
例3 自身对照比较的t检验。
应用克矽平治疗矽肺患者10名,治疗前后血红蛋白的含量如下表,问该药是否会引起血红蛋白的变化?治疗前后血红蛋白的含量(mg%)治疗前11.3 15.0 15.0 13.5 12.8 10.0 11.0 12.0 13.0 12.3 治疗后14.0 13.8 14.0 13.5 13.5 12.0 14.7 11.4 13.8 12.0程序:(yp113.sas)编程说明:数据步中,把每对数据中的一个作为x,另一个作为y,计算出差数d(d=x-y),在过程步中,计算差数d的均值、标准差、标准误差、t值、P值。
结果说明:因t=1.1989377,O.05<p≤O.2612,故差别无显著差异,即该药不会引起血红蛋白的变化。
9.1.3用TTEST过程作t检验1.过程格式PROC TTEST [DATA=数据集];CLASS变量;VAR变量表;2.说明(1)CLASS语句中的变量是分类变量,其水平值只能有两个,并对应两组观察。
是必选语句。
(2)VAR语句中的变量是被分析的变量,如果缺省,则对所有的数值型变量进行分析。
3.举例观察某药物对大白鼠肉瘤的影响。
数据如下表,试作差异性检验。
对照组56 55 54 53 56 52 57 54 52 56实验组50 48 49 49 50 50 60 55 43 52 56 57 程序: (yp114.sas)编程说明:数据步中,用循环控制变量a作分类变量,其水平值为1(对照组)和2(实验组),变量n表示样本数,分别为10和12,用变量x读取原始数据,在过程步中,用CLASS语句标识分类变量,用VAR语句标识分析变量。
结果说明:输出的最后:H0:Variances are equal(方差相等)表示给出的是对方差相等假设的结果。
先看方差齐性检验(F检验),然后根据F检验的结果,选择方差齐(Equal)或不齐(Unequal)的t值和p值,以及两组观察的均值、标准差、标准误差、最大值、最小值。
找Prob>F’=右边的值,即方差相等假设检验的P值,如果此值大于0.01则在方差相等假设下继续进行,否则只能使用近似T检验。
因P=0.0074,说明方差差异显著,即方差不齐。
当方差不齐时,T=2.0000,0.05<P≤0.0644,故无显著差异,即此药物对大白鼠肉瘤无显著影响。
第二节方差分析当试验结果受到多个因素的影响,而且也受到每个因素的各水平的影响,为从数量上反映各因素以至各因素诸水平对试验结果的影响时使用方差分析的方法。
方差分析的基本思想是把全部数据关于总均值的离差平方和分解成几个部分,每一部分表示某因素交互作用所产生的效应,将各部分均方与误差均方相比较,从而确认或否认某些因素或交互作用的重要性。
用公式概括为:总变异=组间变异+组内变异其中:组间变异由各因素所引起,组内变异由个体差异所引起的,或者说由误差引起的。
常用的方差分析法有以下4种:(1)完全随机设计资料的方差分析(单因素方差分析)(2)随机区组设计资料的方差分析(二因素方差分析)(3)拉丁方设计资料的方差分析(三因素方差分析)(4)R*C析因设计资料的方差分析(有交互因素的方差分析)SAS系统中,ANOVA过程可以处理以上情形的方差分析,但它要求每个分类因子的组合观察数相等,即数据是均衡的。
若不均衡,就要求用GLM过程进行处理。
在只考虑组间变异和误差变异时,称为单向方差分析。
此时ANOVA会自动处理均衡和非均衡数据。
在方差分析中,每次只研究1个指标时,称之为一元方差分析(简称ANOVA),同时考虑多个指标时,称之为多元方差分析(MANOVA)。
在这一节里,我们还将讨论协方差分析。
9.2.1 均衡数据的方差分析(ANOVA过程)1.过程格式PROC ANOVA 选项CLASS 变量表;MODEL 因变量表=效应;MEANS 效应[/选择项];2.使用说明(1)程序中,CLASS语句和MODEL语句是必需的,而且,CLASS语句必须出现在MODEL语句之前。
(2)CLASS语句中的变量是分类变量,可以是数值型,也可以是字符型。
(3)MODEL语句指明因变量和自变量(因子变量)效应。
效应是分类变量的各种组合,效应可以是主效应、交互效应、嵌套效应和混合效应。
对应的效应模型如下:·主效应模型MODEL y=a b c;模型中,a,b,c是主效应,y是因变量。
下同。
·交互模型MODEL y=a b c a*b a*c b*c a*b*c;模型中,a*b,a*c,b*c,a*b*c是交互效应。
·嵌套效应模型MODEL y=a b c(a b);模型中,c(a b)是嵌套效应。
·混合效应模型MODEL y=a b(a) c(a) b*c(a);(4)MEANS语句是选择语句,计算并输出所列的效应对应的因变量均值,若指明了选择项,则将进行主效应均值间的检验。
常用的选择项如下:BON、DUNCAN、LSD、REGWF、REGWO、SNK(Q检验)、SCHEFFE、SIDAK、SMM(GT2)、TUKEY、WALLER。
以上选择项在实际应用中,一般选择一种或两种方法即可。
ALPHA=p确定检验的显著性水平。
缺省值是0.05。
3.举例(1)完全随机设计资料的方差分析(单因素方差分析)某劳动卫生研究所研究棉布、府绸、的确凉、尼龙四种衣料吸附十硼氢量。
每种衣料各做五次测量,所得数据如下表。
试检验各种衣料吸附十硼氢量有没有显著差别?各种衣料间棉花吸附十硼氢量棉布府绸的确凉尼龙2.33 2.483.064.002.00 2.343.06 5.132.93 2.683.004.612.73 2.34 2.66 2.802.33 2.223.06 3.60程序: (yp115.sas)编程说明:数据步中,用循环控制变量a做分类变量,其水平数是4,分别代表不同的衣料。
过程步中,用CLASS语句指明一个因素a,用MODEL 语句反映出该因素的效果模型。
结果说明:在输出中,找CLASS语句指出的变量的P值。
此例中,P≤0.0003,可得出各衣料组间有非常显著差异。