SPSS 统计软件教程—方差分析菜单详解
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
16
【Options钮】 当然是定义选项啦!可以定义输出哪些 指标的估计均数、并做所选择的两两比 较,还有其它一些输出,如常用描述指 标、方差齐性检验等。
17
好了,都解释完了,再重复以下,我们所作的操作为:
1.Analyze==>General Lineal
model==>Univariate 2.Dependent Variable框:选入weight 3.Fixed Factors框:选入group和food 4.Model钮:单击 5. Custom单选钮:选中 6. Model框:选入group和food 7. 单击OK 8.Post Hoc钮:单击 9. Post Hoc test for框:选入food 10. SNK复选框:选中 11. 单击OK 12.单击OK
超重组
胆固醇(Y1) 年龄(X2)
3.5
58
4.6Leabharlann 415.871
5.8
76
4.9
49
8.7
33
3.6
54
5.5
65
4.9
39
5.1
52
4.1
45
4.6
58
5.1
67
胆固醇(Y2) 7.3 4.7 8.4 8.8 5.1 4.9 6.7 6.4 6.0 7.5 6.4 6.8 9.2
29
考虑到统计分析对数据格式的要求, 我们这里建立三个变量:GROUP 表示组别,AGE代表年龄,CHOL 则表示胆固醇。
9
在上面的这些框框钮钮中,最常用的有: Dependent Variable框、Fixed Factors框、 Model钮、Post Hoc钮,下面我们来一一解释。 【Dependent Variable框】选入需要分析的变量 (应变量),只能选入一个。这里我们的应变 量为weight,将他选入即可。 【Fixed Factors框】即固定因素,如果你搞 不明白,那么绝大多数要分析的因素都应该往 里面选。这里我们要分析的是group和food两个 变量,把他们全都给我抓进去!
7. Model框:选入group、age和group*age(
后者用interaction方法就可选入)
8. Sum of squares列表框:改为Model I
9. 单击OK
10.单击OK
32
该步骤用于判断group和age间是否 存在交互作用,如存在,则协方差 分析的条件不满足,分析不能继续。 注意这里选择了Model I,从而拟合 结果和模型中变量的引入顺序有关, 即侧重点在group对chol的影响大小 和交互作用上。
33
6.2.2 预分析结果解释
34
预分析步骤的结果如下: Univariate Analysis of Variance
35
36
上表显示交互作用无统计学意 义,而且P值非常大,因此交换 group和age多半交互作用也无 统计学意义,因此可以不继续 作预分析了,当然,严格的步 骤应当交换两者的顺序继续进 行预分析。
30
6.2.1 分析步骤
由于协方差分析涉及到许多较深的统计理论,
这里我只好采用照本宣科的方法,告诉大家如 何作,而不作过多解释,欲进一步了解原理的 朋友请参考相关书籍。
首先应进行预分析,了解资料是否符合协方差 分析的要求,最重要的一点就是看age的影响 在两组中是否相同,这可以用age与group是否 存在交互作用来表示。对该问题,粗糙的方法 可以是作分组散点图,差不多就可以,也可以 进行预分析,看交互作用有无统计学意义,这 里用后一种方法中最为精确的步骤来讲解。
38
7. Sum of squares列表框:改为Model III
8. 单击OK
9. Options钮:单击
2
General Linear Model菜单
一般线性模型的能力如此强大,那么下属的 四个子菜单各自的功能是什么呢?请看: • Univariate子菜单:四个菜单中的大哥大,
绝大部分的方法分析都在这里面进行。 • Multivariate子菜单:当结果变量(应变量
)不止一个时,当然要用它来分析啦!
10
固定因素指的是在样本中它所有可能的取值都出现了, 比如例中的food,只可能有1、2、3这三个值,并且 都出现了,就被称作固定效应;而相对应的随机效应 的因素指的是所有可能的取值在样本中没有都出现, 或不可能都出现,如本例中的group,实际上总体中 当然不可能只有这8窝,因此要用样本中group的情况 来推论总体中group未出现的那些取值的情况时就会 存在误差,因此被称为随机因素。我这里让group也 选入固定框是基于下面的事实:这样做统计分析的结 论是完全相同的。不同的只是推论的那部分。
22
上表的标题内容翻译如下:
变异来源
III型方差SS
自由度
校正的模型
2521.294
9
截距
74359.534
1
GROUP
2376.376
7
FOOD
144.917
2
误差
340.543
14
合计
77221.370
24
校正的合计
2861.836
23
均方MS 280.144 74359.534 339.482
6
区组号 1 2 3 4 5 6 7 8
A营养素 50.10 47.80 53.10 63.50 71.20 41.40 61.90 42.20
B营养素 58.20 48.50 53.80 64.20 68.40 45.70 53.00 39.80
C营养素 64.50 62.40 58.60 72.50 79.30 38.40 51.20 46.20
4
§6.1 两因素方差分析
5
一个例子
例6.1 对小白鼠喂以A、B、C三种不同的营养 素,目的是了解不同营养素增重的效果。采用 随机区组设计方法,以窝别作为划分区组的特 征,以消除遗传因素对体重增长的影响。现将 同品系同体重的24只小白鼠分为8个区组,每 个区组3只小白鼠。三周后体重增量结果(克) 列于下表,问小白鼠经三种不同营养素喂养后 所增体重有无差别?
15
【Plots钮】用于指定用模型的某些参数作图, 比如用food和group来作图,用的也比较少 (指国内,因为它主要是用来做模型诊断用 的)。 【Post Hoc钮】该按钮弹出的两两比较对话框 。本题对food作两两比较,方法为SNK法。 【Save钮】将模型拟合时产生的中间结果或 参数保存为新变量供继续分析时用,可保存 的东东有预测值、残差、诊断用指标等。
18
6.1.2 结果解释
按照上面的操作,结果输出如下:
19
Univariate Analysis of Variance
这是一个所分析因素的取值情况列表,没有什么不好懂的。
20
21
现在大家看到的是一个典型的方差分析表,只不 过是两因素的而已,我来解释一下:首先是所用 方差分析模型的检验,F值为11.517,P小于0.05, 因此所用的模型有统计学意义,可以用它来判断 模型中系数有无统计学意义;第二行是截距,它 在我们的分析中没有实际意义,忽略即可;第三 行是变量GROUP,可见它也有统计学意义,不过 我们关心的也不是它;第四行是我们真正要分析 的FOOD,非常遗憾,它的P值为0.084,还没有统 计学意义。尽管不太愿意,我们的结论也只能是: 尚不能认为三种营养素喂养的小白鼠体重增量有 差别。
31
预分析步骤:
1. Analyze==>General Lineal
model==>Univariate
2. Dependent Variable框:选入chol
3.Fixed Factors框:选入group
4. Covariates框:选入 age
5. Model钮:单击
6. Custom单选钮:选中
7
根据统计分析的要求,我们建立了三个变量来包 括上述信息,即group表示区组,food代表使用 的营养素,weight表示最终的重量,即:
group food weight
1
1 50.01
1
2 58.20
依此类推。
8
6.1.1 univarate对话框界面说明
这里只有一个结果变量weight,要采用univarate 对话框,如下所示:
25
看到了吗?由于所谓的交互作用将自由度给全部 “吃”掉了,没有误差可用于统计分析,什么结 果也做不出来。
26
§6.2 协方差分析
27
例6.2 某医生欲了解成年人体 重正常者与超重者的血清胆固 醇是否不同。而胆固醇含量与 年龄有关,资料见下表。
28
正常组 年龄(X1)
48 33 51 43 44 63 49 42 40 47 41 41 56
第6章:方差分析―General Linear Model菜单
方差分析用于分析在不同条件下(用分类变量表 示)单个或多个连续变量间的差异,它通过General Linear Model菜单完成。
一般线性模型( General Linear Model )可不是用 一章就可以说清楚的,因为它包括的内容实在太多了。 那么,究竟我们用到的哪些分析会包含在其中呢?简 而言之:凡是和方差分析粘边的都可以用它来做。比 如成组设计的方差分析(即单因素方差分析)、配伍 设计的方差分析(即两因素方差分析)、交叉设计的 方差分析、析因设计的方差分析、重复测量的方差分 析、协方差分析等等。因此,能真正掌握GLM菜单的 用法,会使大家的统计分析能力有极大地提高。
11
【Random Factors框】用于选入随机因 素,如果你弄不明白,假装没看见他就 是了。 【Covariate框】用于选入协方差分析 时的协变量,现在还用不到,不过下一 个例子我们就要给它送礼了。 【WLS Weight框】即用于选入最小二 乘法权重系数。很少用到,别理它。
12
【Model钮】单击后出现一个对话框,用于设 置在模型中包含哪些主效应和交互因子,默 认情况为Full factorial,即分析所有的主 效应和交互作用。我们这里没有交互作用可 分析,所以要改一下,否则将作不出结果来。 将按钮切换到右侧的custom,这时中部的 Build Term下拉列表框就变黑可用,该框用 于选择进入模型的因素交互作用级别,即是 分析主效应、两阶交互、三阶交互、还是全 部分析。这里我们只能分析主效应:选择 main,再用黑色箭头将group和food选入右侧 的model框中,如果对这段叙述不太清楚,请 参考下图:
13
14
该对话框中还有两个元素:左下方的Sum of squares框用于选择方差分析模型类别,有1 型到4型四种,如果你搞不清他们之间的区别, 使用默认的3型即可;中下部有个Include intercept in model复选框,用于选择是否在 模型中包括截距,不用改动,默认即可。 【Contrast钮】弹出Contrast对话框,用于对 精细趋势检验和精确两两比较的选项进行定 义,在这里,该对话框比单因素方差分析的 时候还要专业,使用频率也更少,反正我都 没用过,就干脆就不介绍了。
3
•Repeated Measures子菜单:顾名思义, 重 复测量的数据就要用他来分析,这一点我可 能要强调一下,用前两个菜单似乎都可以分 析出来结果,但在许多情况下该结果是不正 确的,应该用重复测量的分析方法才对。 •Variance Components子菜单:用于作方差 成份模型的,这个模型实在太深,不是一时 半会说的请的,所以我在这里就干脆不讲了。
72.459 24.324
统计量F
P值
11.517
.000
3056.985
.000
13.956
.000
2.979
.084
23
FOOD Homogeneous Subsets
24
前面方差分析FOOD的P值不是0.084 吗?这里又是0.121,究竟哪个为准?两 两比较只是近似的比较结果,应以前面 方差分析的P为准,不过这两个P值不会 在检验结果上发生质的冲突,一般只是 大小不同而已。 好了,上面是正确的结果,如果model 选择是采用Full factor又如何呢?会得出 方差分析表如下:
37
正式分析步骤及结果:
Analyze==>General Lineal model==>Univariate
1.Dependent Variable框:选入chol 2.Fixed Factors框:选入group 3.Covariates框:选入 age 4.Model钮:单击 5. Custom单选钮:选中 6. Model框:选入group、age
【Options钮】 当然是定义选项啦!可以定义输出哪些 指标的估计均数、并做所选择的两两比 较,还有其它一些输出,如常用描述指 标、方差齐性检验等。
17
好了,都解释完了,再重复以下,我们所作的操作为:
1.Analyze==>General Lineal
model==>Univariate 2.Dependent Variable框:选入weight 3.Fixed Factors框:选入group和food 4.Model钮:单击 5. Custom单选钮:选中 6. Model框:选入group和food 7. 单击OK 8.Post Hoc钮:单击 9. Post Hoc test for框:选入food 10. SNK复选框:选中 11. 单击OK 12.单击OK
超重组
胆固醇(Y1) 年龄(X2)
3.5
58
4.6Leabharlann 415.871
5.8
76
4.9
49
8.7
33
3.6
54
5.5
65
4.9
39
5.1
52
4.1
45
4.6
58
5.1
67
胆固醇(Y2) 7.3 4.7 8.4 8.8 5.1 4.9 6.7 6.4 6.0 7.5 6.4 6.8 9.2
29
考虑到统计分析对数据格式的要求, 我们这里建立三个变量:GROUP 表示组别,AGE代表年龄,CHOL 则表示胆固醇。
9
在上面的这些框框钮钮中,最常用的有: Dependent Variable框、Fixed Factors框、 Model钮、Post Hoc钮,下面我们来一一解释。 【Dependent Variable框】选入需要分析的变量 (应变量),只能选入一个。这里我们的应变 量为weight,将他选入即可。 【Fixed Factors框】即固定因素,如果你搞 不明白,那么绝大多数要分析的因素都应该往 里面选。这里我们要分析的是group和food两个 变量,把他们全都给我抓进去!
7. Model框:选入group、age和group*age(
后者用interaction方法就可选入)
8. Sum of squares列表框:改为Model I
9. 单击OK
10.单击OK
32
该步骤用于判断group和age间是否 存在交互作用,如存在,则协方差 分析的条件不满足,分析不能继续。 注意这里选择了Model I,从而拟合 结果和模型中变量的引入顺序有关, 即侧重点在group对chol的影响大小 和交互作用上。
33
6.2.2 预分析结果解释
34
预分析步骤的结果如下: Univariate Analysis of Variance
35
36
上表显示交互作用无统计学意 义,而且P值非常大,因此交换 group和age多半交互作用也无 统计学意义,因此可以不继续 作预分析了,当然,严格的步 骤应当交换两者的顺序继续进 行预分析。
30
6.2.1 分析步骤
由于协方差分析涉及到许多较深的统计理论,
这里我只好采用照本宣科的方法,告诉大家如 何作,而不作过多解释,欲进一步了解原理的 朋友请参考相关书籍。
首先应进行预分析,了解资料是否符合协方差 分析的要求,最重要的一点就是看age的影响 在两组中是否相同,这可以用age与group是否 存在交互作用来表示。对该问题,粗糙的方法 可以是作分组散点图,差不多就可以,也可以 进行预分析,看交互作用有无统计学意义,这 里用后一种方法中最为精确的步骤来讲解。
38
7. Sum of squares列表框:改为Model III
8. 单击OK
9. Options钮:单击
2
General Linear Model菜单
一般线性模型的能力如此强大,那么下属的 四个子菜单各自的功能是什么呢?请看: • Univariate子菜单:四个菜单中的大哥大,
绝大部分的方法分析都在这里面进行。 • Multivariate子菜单:当结果变量(应变量
)不止一个时,当然要用它来分析啦!
10
固定因素指的是在样本中它所有可能的取值都出现了, 比如例中的food,只可能有1、2、3这三个值,并且 都出现了,就被称作固定效应;而相对应的随机效应 的因素指的是所有可能的取值在样本中没有都出现, 或不可能都出现,如本例中的group,实际上总体中 当然不可能只有这8窝,因此要用样本中group的情况 来推论总体中group未出现的那些取值的情况时就会 存在误差,因此被称为随机因素。我这里让group也 选入固定框是基于下面的事实:这样做统计分析的结 论是完全相同的。不同的只是推论的那部分。
22
上表的标题内容翻译如下:
变异来源
III型方差SS
自由度
校正的模型
2521.294
9
截距
74359.534
1
GROUP
2376.376
7
FOOD
144.917
2
误差
340.543
14
合计
77221.370
24
校正的合计
2861.836
23
均方MS 280.144 74359.534 339.482
6
区组号 1 2 3 4 5 6 7 8
A营养素 50.10 47.80 53.10 63.50 71.20 41.40 61.90 42.20
B营养素 58.20 48.50 53.80 64.20 68.40 45.70 53.00 39.80
C营养素 64.50 62.40 58.60 72.50 79.30 38.40 51.20 46.20
4
§6.1 两因素方差分析
5
一个例子
例6.1 对小白鼠喂以A、B、C三种不同的营养 素,目的是了解不同营养素增重的效果。采用 随机区组设计方法,以窝别作为划分区组的特 征,以消除遗传因素对体重增长的影响。现将 同品系同体重的24只小白鼠分为8个区组,每 个区组3只小白鼠。三周后体重增量结果(克) 列于下表,问小白鼠经三种不同营养素喂养后 所增体重有无差别?
15
【Plots钮】用于指定用模型的某些参数作图, 比如用food和group来作图,用的也比较少 (指国内,因为它主要是用来做模型诊断用 的)。 【Post Hoc钮】该按钮弹出的两两比较对话框 。本题对food作两两比较,方法为SNK法。 【Save钮】将模型拟合时产生的中间结果或 参数保存为新变量供继续分析时用,可保存 的东东有预测值、残差、诊断用指标等。
18
6.1.2 结果解释
按照上面的操作,结果输出如下:
19
Univariate Analysis of Variance
这是一个所分析因素的取值情况列表,没有什么不好懂的。
20
21
现在大家看到的是一个典型的方差分析表,只不 过是两因素的而已,我来解释一下:首先是所用 方差分析模型的检验,F值为11.517,P小于0.05, 因此所用的模型有统计学意义,可以用它来判断 模型中系数有无统计学意义;第二行是截距,它 在我们的分析中没有实际意义,忽略即可;第三 行是变量GROUP,可见它也有统计学意义,不过 我们关心的也不是它;第四行是我们真正要分析 的FOOD,非常遗憾,它的P值为0.084,还没有统 计学意义。尽管不太愿意,我们的结论也只能是: 尚不能认为三种营养素喂养的小白鼠体重增量有 差别。
31
预分析步骤:
1. Analyze==>General Lineal
model==>Univariate
2. Dependent Variable框:选入chol
3.Fixed Factors框:选入group
4. Covariates框:选入 age
5. Model钮:单击
6. Custom单选钮:选中
7
根据统计分析的要求,我们建立了三个变量来包 括上述信息,即group表示区组,food代表使用 的营养素,weight表示最终的重量,即:
group food weight
1
1 50.01
1
2 58.20
依此类推。
8
6.1.1 univarate对话框界面说明
这里只有一个结果变量weight,要采用univarate 对话框,如下所示:
25
看到了吗?由于所谓的交互作用将自由度给全部 “吃”掉了,没有误差可用于统计分析,什么结 果也做不出来。
26
§6.2 协方差分析
27
例6.2 某医生欲了解成年人体 重正常者与超重者的血清胆固 醇是否不同。而胆固醇含量与 年龄有关,资料见下表。
28
正常组 年龄(X1)
48 33 51 43 44 63 49 42 40 47 41 41 56
第6章:方差分析―General Linear Model菜单
方差分析用于分析在不同条件下(用分类变量表 示)单个或多个连续变量间的差异,它通过General Linear Model菜单完成。
一般线性模型( General Linear Model )可不是用 一章就可以说清楚的,因为它包括的内容实在太多了。 那么,究竟我们用到的哪些分析会包含在其中呢?简 而言之:凡是和方差分析粘边的都可以用它来做。比 如成组设计的方差分析(即单因素方差分析)、配伍 设计的方差分析(即两因素方差分析)、交叉设计的 方差分析、析因设计的方差分析、重复测量的方差分 析、协方差分析等等。因此,能真正掌握GLM菜单的 用法,会使大家的统计分析能力有极大地提高。
11
【Random Factors框】用于选入随机因 素,如果你弄不明白,假装没看见他就 是了。 【Covariate框】用于选入协方差分析 时的协变量,现在还用不到,不过下一 个例子我们就要给它送礼了。 【WLS Weight框】即用于选入最小二 乘法权重系数。很少用到,别理它。
12
【Model钮】单击后出现一个对话框,用于设 置在模型中包含哪些主效应和交互因子,默 认情况为Full factorial,即分析所有的主 效应和交互作用。我们这里没有交互作用可 分析,所以要改一下,否则将作不出结果来。 将按钮切换到右侧的custom,这时中部的 Build Term下拉列表框就变黑可用,该框用 于选择进入模型的因素交互作用级别,即是 分析主效应、两阶交互、三阶交互、还是全 部分析。这里我们只能分析主效应:选择 main,再用黑色箭头将group和food选入右侧 的model框中,如果对这段叙述不太清楚,请 参考下图:
13
14
该对话框中还有两个元素:左下方的Sum of squares框用于选择方差分析模型类别,有1 型到4型四种,如果你搞不清他们之间的区别, 使用默认的3型即可;中下部有个Include intercept in model复选框,用于选择是否在 模型中包括截距,不用改动,默认即可。 【Contrast钮】弹出Contrast对话框,用于对 精细趋势检验和精确两两比较的选项进行定 义,在这里,该对话框比单因素方差分析的 时候还要专业,使用频率也更少,反正我都 没用过,就干脆就不介绍了。
3
•Repeated Measures子菜单:顾名思义, 重 复测量的数据就要用他来分析,这一点我可 能要强调一下,用前两个菜单似乎都可以分 析出来结果,但在许多情况下该结果是不正 确的,应该用重复测量的分析方法才对。 •Variance Components子菜单:用于作方差 成份模型的,这个模型实在太深,不是一时 半会说的请的,所以我在这里就干脆不讲了。
72.459 24.324
统计量F
P值
11.517
.000
3056.985
.000
13.956
.000
2.979
.084
23
FOOD Homogeneous Subsets
24
前面方差分析FOOD的P值不是0.084 吗?这里又是0.121,究竟哪个为准?两 两比较只是近似的比较结果,应以前面 方差分析的P为准,不过这两个P值不会 在检验结果上发生质的冲突,一般只是 大小不同而已。 好了,上面是正确的结果,如果model 选择是采用Full factor又如何呢?会得出 方差分析表如下:
37
正式分析步骤及结果:
Analyze==>General Lineal model==>Univariate
1.Dependent Variable框:选入chol 2.Fixed Factors框:选入group 3.Covariates框:选入 age 4.Model钮:单击 5. Custom单选钮:选中 6. Model框:选入group、age