第4讲 均数间的比较
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四讲均数间的比较(bǐjiào)
在Analyze主菜单(cài dān)下,有Compare Means菜单(cài dān),该菜单集中了几个(jǐ ɡè)用于计量资料均数间比较的过程:
•Means过程(guòchéng) 对准备比较的各组计算描述指标,进行预分析,也可直接比较。
•One-Samples T Test过程进行样本均数与已知总体均数的比较。
•Independent-Samples T Test过程进行两样本均数差别的比较,即通常所说的两组资料的t检验。
•Paired-Samples T Test过程进行配对t检验。
•One-Way ANOVA过程进行两组及多组样本均数的比较,即成组设计的方差分析,还可进行随后的两两比较。
§4.1 Means过程
与上一章所讲述的几个专门的描述过程相比,Means过程的优势在于将各组的描述指标被放在一起便于相互比较,并且如果需要,可以直接输出比较结果,无须再次调用其他过程,显然要方便的多。
4.1.1 Means过程界面介绍
选择Means过程弹出如下的对话框:
【Dependent List框】
用于选入需要分析的变量(必选)。
【Independent List框】
用于选入分组变量(分层控制变量,可有多个,必选)。
同一层各分组变量的水平数相加,不同层的水平数相乘。
【Options钮】
弹出Options对话框,选择需要计算的描述统计量和统计分析:
o Statistics框可选的描述统计量。
它们(tā men)是:
1.sum,number of cases 总和(zǒnghé),记录数
2.mean, geometric mean, harmonic mean 均数,几何均
数,修正(xiūzhèng)均数
3.standard deviation,variance,standard error of
the mean 标准(biāozhǔn)差,均数的标准误,方差
4.median, grouped median 中位数,频数表资料(zīliào)
中位数(比如30岁组有5人,40岁组有6人,则在计
算grouped median时均按组中值35和45进行计
算)。
5.minimum,maximum,range 最小值,最大值,全距
6.kurtosis, standard error of kurtosis 峰度系数,
峰度系数的标准误
7.skewness, standard error of skewness 偏度系数,
偏度系数的标准误
8.percentage of total sum, percentage of total N
总和的百分比,样本例数的百分比
o Cell Statistics框选入的描述统计量。
o Statistics for First layer复选框组
1.Anova table and eta 对分组变量进行单因素方差分析
(对第一层分组变量),并计算用于度量变量相关程度
的eta值。
2.Test for linearity 检验线性相关性,实际上就是上
面的单因素方差分析。
4.1.2 结果解释
有了上一章的基础,Means过程的输出看起来就不太困难了,输出结果如下:
Means
1、缺失值报告。
2、常用统计描述量报表。
这里按默认情况输出均数,样本量和标准差。
由于我们选择了分组变量,因此三项指标均给出分组
及合计值,可见以这种方式列出统计量可以非常直观的进行各
组间的比较。
3、单因素方差分析表。
在选择了Anova table and eta或Test for linearity复选框时出现。
实际上就是在检验各组间均数有无差异。
上面(shàng miɑn)各项的具体含义将在单因素方差分
析一节中解释。
4、相关性度量(dùliàng)指标,给出Eta值以及Eta值的平方根。
§4.2 One-Samples T Test过程(guòchéng)
One-Samples T Test过程用于进行样本(yàngběn)所在总体均数与已知总体均数的比较,可以自行定义已知总体均数为任
意值,该对话框的界面非常简单。
7.2.1 界面(jièmiàn)说明
【Test Variables框】
用于选入需要分析的变量。
【Test Value框】
在此处输入已知的总体均数,默认值为0。
【Options钮】
弹出Options对话框,用于定义相关的选项:
o Confidence Interval框输入需要计算的均数差值可信区间范围,默认为95%。
如果是和总体均数为0相比,则此
处计算的就是样本所在总体均数的可信区间。
o Missing Values单选框组定义分析中对缺失值的处理方法,可以是具体分析用到的变量有缺失值才去除该记录
(Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除(Excludes cases listwise)。
默认为前者,以充分利用数据。
7.2.2 结果解释
One-Samples T Test过程的输出也是比较简单的,由描述统计表和t检验(jiǎnyàn)表组成,比如要检验数据li1_1.sav中血磷值的总体均数是否等于1,则输出结果(jiē guǒ)如下
(rúxià):
1、所分析变量(biànliàng)的基本情况描述,有样本量、均数、标准差和标准误。
2、单样本t检验表,第一行注明了用于比较的已知总体均数为1,下面从左到右依次(yīcì)为t值(t)、自由度(df)、P值(Sig.2-tailed)、两均数的差值(Mean Difference)、差值的95%可信区间。
本例:克山病人:t=4.096,P=0.002;健康人:t=0.723,P=0.484。
因此可以认为克山病人血磷值的总体均数不等于1(大于1)。
健康人血磷值的总体均数等于1。
§4.3 Independent-Samples T Test过程Independent-Samples T Test过程用于进行两样本均数的比较,即常用的两样本t检验。
该对话框已经见过了,和上面的One-Samples T Test对话框非常相似。
4.3.1 界面说明
【Test Variables框】
用于选入需要分析的变量。
【Grouping Variable框】
用于选入分组变量。
注意选入变量后还要定义需比较的组别。
【Define Groups按钮】
用于定义需要相互比较的两组的分组变量值。
可以这样来理解:如果分组变量有3个取值(即有三组),而我们做t检验是比较其中的某两组,这时就可以用Define Groups框来指定需比较的两组。
当然,如果分组变量只有2个取值时,我们仍然要再该框中进行定义,这也算是SPSS 对话框存在的一个小缺陷吧。
【Options钮】
和One-Samples T Test对话框的Options钮完全相同,此处不再(bù zài)重复。
7.3.2 结果(jiē guǒ)解释
比如(bǐrú)要检验数据(shùjù)li1_1.sav中克山病患者(huànzh ě)与健康人的血磷值是否相同,用Independent-Samples T Test过程的结果输出如下:
1、两组需检验变量的基本情况描述。
可见该结果分为两大部分:第一部分为Levene's方差齐性检验,用于判断两总体方差是否齐,这里的结果为F = 0.032,P = 0.860,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t= 2.524,ν=22,P=0.019。
从而最终的统计结论为按α=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。
最后面还附有一些其他指标,如两组均数的可信区间等,以对差异情况有更直观的了解。
上表的标题内容翻译如下:
Levene 方差齐性检验两均数是否相等的
t检验
F值 P值t值自由度P值
(双
侧)
均数
差值
差值
的标
准误
差值的95%可
信区间
下限上限
血磷值假
设
方
差
齐
.032 .860 2.524 22 .019 .4363 .1729
7.777E-
02
.7948
假
设
方
差
不
齐
2.524 21.353 .020 .4363 .1729
7.716E-
02
.7954
§4.4 Paired-Samples T Test过程
该过程用于进行配对设计的差值均数与总体均数0比较的t
检验,对统计学比较熟悉的人可以看出,他的功能实际上是和One-Samples T Test过程相重复的(等价于已知总体均数为0的情况),但Paired-Samples T Test过程使用的数据输入格式和前者不同,即我们所称的统计表格格式,因此仍然有存在的价值。
7.4.1 界面说明
整个界面上只有一个(yī ɡè)Paired Variable框,他用于选入希望进行比较的一对或几对变量。
选入变量需要成对的选入,即按住Ctrl键,选中两个成对变量,再单击将其选入。
如果只选中一个(yī ɡè)变量,则按钮为灰色(huīsè),不可用。
【Options钮】
和One-Samples T Test对话框的Options钮完全相同,此处不再(bù zài)重复。
3.4.2 分析(fēnxī)实例
某单位研究食料中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白按性别相同,年龄、体重相近者配成对子,共8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺
乏组,过一定时期将大白鼠杀死,测得其肝中维生素A的含
量,问不同饲料的大白鼠肝中维生素A含量有无差别(卫统第
三版例4.5)?
大白鼠对号正常饲料组维生素E缺乏
1 3550 2450
2 2000 2400
3 3000 1800
4 3950 3200
5 3800 3250
6 3750 2700
7 3450 2500
8 3050 1750
为了说明问题,此处假设输入数据时就按照上表格式输
入,其中正常饲料组变量名为G1,维生素E缺乏组变量名为
G2。
操作如下:
1.同时选中G1、G2:选入Paired Variables框
2.单击OK钮
(也可以先算出G1,G2的差值,然后用单一样本的t检验)7.4.3 结果解释
其输出(shūchū)结果如下:
1、配对变量各自的统计(tǒngjì)描述,此处只有1对,故只有Pair 1。
2、配对变量间的相关性分析(fēnxī)。
等价于
Analyze==>Correlate==>Bivariate。
3、配对t检验表,给出最终(zuì zhōnɡ)的检验结果,可见
P=0.004,故可认为两种饲料所得肝中维生素A含量有差别,即维生素E缺乏对大白鼠肝中维生素A含量有影响。
上表的标题(biāotí)内容翻译如下:
对子间的差值
差值均数标准差标准误均数的95%可信区
间t值
自
由
度
P值
(双
侧)下限上限
第一对G1
-
G2
812.5000 546.2535 193.1298 355.8207 1269.1793 4.207 7 .004 §4.5 One-Way ANOVA过程
One-Way ANOVA过程用于进行两组及多组样本均数间的比较,即成组设计的方差分析,如果做了相应选择,还可进行随后的两两比较,至于在各组间精确设定哪几组和哪几组进行比较,在本章的内容中,他是最为复杂的一个,但是有了前面的基础,理解和掌握应该不成问题。
4.5.1界面说明
【Dependent List框】
选入需要分析的变量,可选入多个分析变量(应变量)。
【Factor框】
选入需要比较的分组因素(分析因素),只能选入一个。
【Contrast按钮】
弹出Contrast对话框,用于对精细趋势检验和精确两两比较的选项进行定义,由于该对话框太专业,也较少用,这里只做简单介绍。
o Polynomial复选框定义是否在方差分析中进行趋势(qūshì)检验。
o Degree下拉列表(liè biǎo) 和Polynomial复选框配合使用,可选则从线性趋势一直到最高五次方曲线来进行检
验。
o Coefficients框定义精确两两比较的选项。
这里按照分组变量升序给每组一个系数值(shùzí),注意最终所有系数值相加应为0。
如果不为(bù wéi)0仍可检验,只不过结果是错的。
比如说在下面的例子中要对第一、三组进行单独
比较,则在这里给三组分配系数为1、0、-1,就会在结果(jiē guǒ)中给出相应的检验内容。
【Post Hoc钮】
弹出Post Hoc Multiple Comparisons对话框,用于选择进行各组间两两比较的方法,有:
o Equar Variances Assumed复选框组一组当各组方差齐时可用的两两比较方法,共有14中种这里不一一列出了,其中最常用的为LSD和S-N-K法。
o Equar Variances Not Assumed复选框组一组当各组方差不齐时可用的两两比较方法,共有4种,其中以
Dunnetts's C法较常用。
o Significance Level框定义两两比较时的显著性水平,默认为0.05。
此处只是介绍可用的方法,并不是要推荐说那种最好,使用时请认真参考有关统计书籍。
【Options钮】
弹出Options对话框,用于定义相关的选项,有:
o Statistics复选框组选择一些附加的统计分析项目,有统计描述(Descriptive)和方差齐性检验(Homogeneity-of-variance)。
o Means plot复选框用各组均数做图,以直观的了解它们(tā men)的差异。
o Missing Values单选框组定义分析中对缺失值的处理方法,可以是具体分析用到的变量有缺失值才去除该记录
(jìlù)(Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除
(Excludes cases listwise)。
默认为前者,以充分利用数据。
4.5.2 分析(fēnxī)实例
例某职业病防治(fángzhì)院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,问三组石棉矿工的用力肺活量有无差别(卫统第三版例5.1)?
石棉肺患者可疑患者非患者
1.8
2.3 2.9
1.4
2.1
3.2
1.5
2.1 2.7
2.1 2.1 2.8
1.9
2.6 2.7
1.7
2.5
3.0
1.8
2.3
3.4
1.9
2.4
3.0
1.8
2.4
3.4
1.8 3.3
2.0
3.5
设数据已经输好,分组变量为group,三组取值分别为1、2、3,结果(jiē guǒ)变量为X。
此处先进行单因素方差分析,然后进行两两比较,这里选择S-N-K法进行两两比较。
操作如下:
o Dependent List框:选入X
o Factor框:选入group
o Post Hoc钮:选中S-N-K复选框:单击Continue钮
o单击OK钮
4.5.3 结果解释
输出结果如下:
1、描述性分析结果;
2、方差分析结果表。
给出了单因素方差分析的结果,可见
F=84.544,P<0.001。
因此可认为三组矿工用力肺活量不同。
上表的标题内容翻译如下:
3、用S-N-K法进行两两比较的结果。
在表格的纵向上各组均数按大小排序,然后在表格的横向上被分成了若干个亚组,不同亚组间的P值小于0.05,而同一亚组内的各组均数比较的P值则大于0.05。
从上表可见,石棉肺患者、可疑患者和非患者被分在了三个不同的亚组中,因此三组间两两比较均有差异;由于各个亚组均只有1个组别进入,因此最下方的组内两两比较P 值均为1.000(自己和自己比较,当然绝对不会有差异了)。
从上面(shàng miɑn)的解释大家可以得知:SPSS进行两两比较时,如果有差异,则只会告诉你P值小于预定的界值(默认为0.05),而不会给出具体的概率P有多大。
内容总结
(1)第四讲均数间的比较
在Analyze主菜单下,有Compare Means菜单,该菜单集中了几个用于计量资料均数间比较的过程:
Means过程对准备比较的各组计算描述指标,进行预分析,也可直接比较(2)第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t= 2.524,ν=22,P=0.019。